BrowseComp

BrowseComp is a benchmark for browser operation competition tasks.

Overview

Attribute	Value
Task Type	Browser operations
Evaluation	Grader-based scoring

Quick Start

# Run tasks
uv run scripts/run.py --agent browser-use --benchmark BrowseComp --mode first_n --count 3

# Evaluate results
uv run scripts/eval.py --agent browser-use --benchmark BrowseComp

Online mind2web Lexmount

⌘I

Get Started

Features

Examples

Development

Browsecomp

BrowseComp

Overview

Quick Start

Get Started

Features

Examples

Development

​BrowseComp

​Overview

​Quick Start

BrowseComp

Overview

Quick Start