在科技飞速发展的今天,我们的工作、生活与 AI 的关系正变得越来越紧密。 无论是语音助手解放双手,还是AI搜索节省时间,这些技术的普及无不在证明:AI 的价值不再只是科研实验室中的概念,而是实实在在融入了我们的日常生活。 然而,当我发现 Browser Use 这个工具时,还是被它的“开挂”能力给惊艳到了。 它允许通过 AI 代理自动操作浏览器,无论是发邮件、订机票,还是网页内容提取、文件存储、数据库操作等都直接用。 Browser Use 是一个能让 AI 智能体自动化操作浏览器的开源工具。 它通过简单的几行代码,就能让 AI 模型像真人一样与网页互动,完成各种复杂任务,比如自动投简历、查询航班信息,甚至筛选模型。 底层也借助了微软的自动化框架 playwright 进行功能延展。 它可以用于多种用途,包括视觉识别、多个代理的并行管理以及多个标签页的自动管理。 11月刚刚开源,最近一周突然爆火,5天内标星数直接从 3.3k 飙升到 7.3k。 安装 browser-use 将API密钥添加到你的.env文件中 启动代理 最后自动开启浏览器进行操作。 比如,投简历这件事本身并不复杂,但在不同网站间反复切换、手动输入信息却非常耗时。 可以通过 Browser Use 设计一个简单的脚本,让它自动打开招聘网站、登录账户、上传简历、甚至自定义申请留言。整个过程只需要提前设置好脚本,之后就可以坐等结果。 1、阅读简历,找到与机器学习相关的职位,将它们保存到文件中,然后在新标签页中开始投递。 2、从2024年12月25日至2025年2月2日期间,在某平台上查找从苏黎世到北京的航班。 3、查找拥有cc-by-sa-4.0许可的模型,并按在Hugging Face上获得的最多点赞进行排序,将前5个保存到文件。 Browser Use 是一款功能强大且灵活的开源工具,可以将 AI 智能体与浏览器操作完美结合,实现自动化、高效的网页交互。 不论是日常办公、信息查询,还是数据采集,都能大大节省人力和时间成本。 GitHub 项目地址:https://github.com/browser-use/browser-use
项目简介
主要功能
快速使用
pip install browser-use
OPENAI_API_KEY=
ANTHROPIC_API_KEY=from langchain_openai import ChatOpenAI
from browser_use import Agent
import asyncio
async def main():
agent = Agent(
task="Find a one-way flight from Bali to Oman on 12 January 2025 on Google Flights. Return me the cheapest option.",
llm=ChatOpenAI(model="gpt-4o"),
)
result = await agent.run()
print(result)
asyncio.run(main())官方示例
写在最后
超火的AI自动化操控浏览器神器!一夜爆火,5天内新增3K Star!AI智能体趋势使然。
相关推荐
- icloudpd:一个可以把iCloud中的照片同步到NAS的极品工具!
- 内网穿透工具全解析:从开发到运维的必备神器
- 一个基于FLUX的开源AI LOGO生成器,稳定性超Midjourney,再也不用为了做LOGO疯狂抽卡。
- 免费!无限制!4款AI视频良心工具!(附教程)
- 告别手动签到!NAS搭建自动签到教程来啦~
- [白话教程]从头捋捋内网穿透工具frp的各种工作模式总有一款适合你|内网穿透|内网反代|frp内网代理|frp安装与配置
- 46.6k星星!最强开源AI集合系统LobeChat,一键部署全网AI工具都能直接用,UI简直是视觉盛宴!
- 2.8K star!超强音乐管理工具Melody,支持多平台、一键“解锁”!