OpenAI的下一个新功能来了!名为Operator,一个会自动帮你购物、订购旅游行程等浏览网页的行为的AI。

目前,这个功能仅对每月200美元的Pro配套用户开放,而且仅限美国地区,而且是早起的研究预览阶段,因此很多功能是受限的。
尽管有着诸多限制,OpenAI表示,Operator有着独立上网、打字、点击、滑动网页的能力,这意味着它能够浏览网页、填写表格、购物甚至是帮你制作各种网络表情包梗图等行为,而且这个AI有能力以人类的同等视角来浏览体验各种网页。
根据OpenAI的介绍,Operator采用了一个名为Computer-Using Agent (CUA)的新AI模型,结合ChatGPT 4o的视觉能力,CUA能够与我们一般用户体验的视觉界面(graphical user interfaces,GUIs)进行交互。透过截图来“看”,透过调度键盘与滑鼠的权限来“交互”。

在面对困难或错误时,Operator也能透过自身的推理能力来自我修正,但也不排除会需要用户接受操作的可能性。比方说需要登录、需要用户输入支付资料、解开CAPTCHA(ChatGPT:坏了,我真的是机器人)
Operator也会根据用户的具体需求来行动,比方说自定你偏好的航空公司、喜欢的品牌等,在Operator帮你买东西的时候就会优先选择那些品牌。
这个功能未来会有加入更多的API、处理更多更复杂的工作,并且持续下放到ChatGPT Plus或是团队与企业用户等群体。