安装
基础用法
运行 LexBench-Browser
运行 Online-Mind2Web
运行 BrowseComp
常用参数
| 参数 | 说明 | 默认值 |
|---|---|---|
--mode | 运行模式 (all, first_n, sample_n, specific) | all |
--count | 任务数量 | 1 |
--split | 数据子集 | All |
--timeout | 超时时间(秒) | 从配置读取 |
--skip-completed | 跳过已完成任务 | False |
--debug | 调试模式 | False |
使用 browser-use Agent 运行 Benchmark
| 参数 | 说明 | 默认值 |
|---|---|---|
--mode | 运行模式 (all, first_n, sample_n, specific) | all |
--count | 任务数量 | 1 |
--split | 数据子集 | All |
--timeout | 超时时间(秒) | 从配置读取 |
--skip-completed | 跳过已完成任务 | False |
--debug | 调试模式 | False |