OpenAI首个AI智能体来了,可自主帮人订餐购物

f2g7586549kz
预计阅读时长 5 分钟
位置: 首页 实时动态 正文

本站全国服务客服维修电话:
400--117--9882(温馨提示:点击屏幕下方↓↓↓拨号预约)

界面新闻记者 | 宋佳楠

AI智能体正在加速尝试代替人类去做一些“力所能及”的事情。

当地时间1月23日,OpenAI发布了首个AI智能Operator。据该公司CEO奥特曼介绍,这款智能体能像人类一样使用网页浏览器,并点击按钮、打字输入内容等,能自动完成预订旅行住宿、餐厅预约、在线购物等复杂任务。

不仅如此,系统还支持多任务并行处理,比如在某购物网站上订购搪瓷马克杯之时,也能同步在另一平台预定露营地。

Operator支持个性定制,用户可为特定网页或全站添加自定义指令,并在主页保存,实现跨聊天窗口的多任务处理,如设置订机票时的首选航司等。

其技术原理主要由Computer-Using Agent(CUA)模型驱动,并结合了GPT-4o的视觉识别能力和基于强化学习的高级推理功能,使得Operator能 “看见” 网页,使用鼠标和键盘与网页互动。

目前,Operator研究预览版率先向订阅200美元Pro计划的美国用户开放,后续将逐步扩展至Plus、Team和 Enterprise级别用户。OpenAI表示,希望很快将Operator集成到其所有ChatGPT应用中。

从现有体验来看,Operator在基础网页操作和重复性任务方面表现出色,如搜索筛选、创建购物清单和音乐播放列表等任务成功率较高。但在处理复杂的房产搜索等任务时,成功率相对较低;在处理不熟悉的UI界面和文本编辑时表现欠佳。

在发布演示和用户测试中,Operator出现了网页无法成功加载等情况,表明其在运行稳定性上存在不足。此外,由于部分网站可能会屏蔽AI访问,导致智能体无法在这些网站上执行任务,使其应用范围受到一定限制。

据OpenAI方面介绍,这款智能体在WebArena测试中得分58.1%,而在WebVoyager测试中实际网站导航成功率达87%,OSWorld测试的得分则为38.1%。WebArena是由卡耐基梅隆大学等机构推出的一项用于测试智能代理在网络环境中执行任务能力的测试。WebVoyager测试主要在亚马逊、开源网站GitHub和谷歌地图等真实网站上测试模型的性能。而OSWorld测试用于评估模型控制Windows和macOS等完整操作系统的能力。

尽管还谈不上完美,但“这款产品是我们进军智能体领域的开始。”奥特曼在直播中这样表示。

可以说,Operator是OpenAI向通用人工智能(AGI)目标迈进的重要一步,也将进一步增强该公司在AI领域的竞争力。但考虑到Operator在代替用户执行任务时可能需要输入敏感信息,如何避免潜在安全风险将成为重要问题。


Warning: mysqli::query(): (HY000/1194): Table 'zbp_post' is marked as crashed and should be repaired in /www/wwwroot/m.blin123.cn/randompost.php on line 19
没有找到记录。
头像
钻麦保险柜全国售后电话故障维修客服中心热线-《今日汇总》全球顶级十大天价保险柜揭秘:价值连城的守护者们究竟有多贵?
« 上一篇 2025-01-24
鹰牌燃气灶全国24小时售后服务维修热线是多少-《今日汇总》顶尖之选:为您打造安全无忧的烹饪体验——安全燃气灶
下一篇 » 2025-01-24
声明:1、文章内容均来自互联网用户,不代表本站立场,本站不对内容的真实性、完整性、准确性给予任何担保、暗示和承诺,严禁浏览者根据内容形成判断与决定,浏览者所做的任何判断与决定与本文无关。2、本网站内容和电话均非官方渠道提供。如发现本站有涉嫌抄袭侵权/违法违规的内容请联系,一经查实,本站将立刻删除。

取消
微信二维码
支付宝二维码

似水流年

今日已经过去小时
这周已经过去
本月已经过去
今年已经过去个月
«    2025年3月    »
12
3456789
10111213141516
17181920212223
24252627282930
31
点击拨打电话

目录[+]