Browser Use:9.8 万 Star 的 AI 浏览器自动化库

2026-06-12 14:18:39

Browser Use 开源项目分析

仓库:github.com/browser-use/browser-use · License: MIT · ⭐ 98k+ · Cloud:cloud.browser-use.com

项目是什么

Browser Use 让网站对 AI Agent 可编程访问——用自然语言驱动 Chrome/Chromium 完成:

  • 表单填写、求职申请
  • 电商下单、比价
  • 数据采集、多步导航

架构(v0.13 Beta):Python API → Rust 核心 → Browser Harness → 任务完成

核心能力

  • Agent APIfrom browser_use.beta import Agent,支持 GPT/Claude/Gemini 及自研 bu-* 优化模型
  • CLIbrowser-use open/click/type/screenshot,浏览器会话持久化
  • 自定义 Tools:扩展 Agent 能力
  • Claude Code Skill:官方 SKILL.md 一键安装
  • Benchmark:100 个真实浏览器任务开源评测(browser-use/benchmark)

开源 vs Cloud

模式 适合
开源自托管 深度定制、内网、配合自建代理
Browser Use Cloud 隐身指纹、Captcha、代理轮换、1000+ 集成、规模化并行

快速体验

pip install "browser-use[core]"
uvx browser-use init --template default
from browser_use.beta import Agent, ChatBrowserUse
agent = Agent(
    task="Find stars of browser-use repo on GitHub",
    llm=ChatBrowserUse(model='openai/gpt-5.5'),
)
await agent.run()

适用场景

  • RPA 替代:无 API 的老系统自动操作
  • Agent 工具链:与 LangChain/CrewAI 等组合
  • 测试/QA:E2E 探索性测试
  • 个人助理:订机票、填表等重复网页劳动

黑豹点评

Browser Use 是 Agent × RPA 交集处最活跃的开源项目之一。企业落地建议:内网用开源版 + 固定域名白名单;公网/Captcha 场景再评估 Cloud。与 Nanobot/Hermes 的 MCP 集成可组成「聊天触发 → 浏览器执行」完整链路。

项目链接https://github.com/browser-use/browser-use