亚马逊推出可控制网络浏览器的 AI 代理 Nova Act

站长云网 2025-03-31 5iter.com 站长云网

亚马逊周一发布了NovaAct,这是一款通用AI代理,可以控制网络浏览器并独立执行一些简单的操作。除了新的代理AI模型外,亚马逊还发布了NovaActSDK,这是一个工具包,允许开发人员使用NovaAct构建代理原型。

NovaAct由亚马逊新近在旧金山开设的AGI实验室开发,还将为该公司即将推出的Alexa+升级版提供关键功能,Alexa+是亚马逊广受欢迎的语音助手的生成式AI增强版。不过,从今天开始提供的NovaAct版本略显逊色。亚马逊称其为研究预览版。

开发人员可以通过新网站nova.amazon.com访问NovaAct工具包,该网站也是亚马逊各种Nova基础模型的展示。

NovaAct是亚马逊试图利用自己的通用人工智能代理技术与OpenAI的Operator和Anthropic的ComputerUse竞争的尝试。几家领先的科技公司认为,能够为用户导航网络的人工智能代理将使当今的人工智能聊天机器人更加有用。

亚马逊可能不是第一个开发这种代理技术的公司,但通过Alexa+,它的覆盖范围可能是最广泛的。

亚马逊表示,使用NovaActSDK进行开发的开发人员应该能够代表用户自动执行基本操作,例如从Sweetgreen订购沙拉或预订晚餐。借助NovaAct工具包,开发人员可以整合工具,让AI代理浏览网页、填写表格或在日历上选择日期。

亚马逊声称,NovaAct在公司内部的几项测试中表现优于OpenAI和Anthropic的代理。例如,在衡量AI代理如何与屏幕上的文本交互的ScreenSpotWebText中,NovaAct得分为94%,优于OpenAI的CUA(得分为88%)和Anthropic的Claude3.7Sonnet(90%)。

不过,亚马逊并没有使用更常见的代理评估(例如WebVoyager)来对NovaAct进行基准测试。

NovaAct是亚马逊上述AGI实验室推出的首款公开产品,该项目由前OpenAI研究员DavidLuan和PieterAbbeel共同领导。两人之前都创立过自己的初创公司——Luan创办了Adept,而Abbeel共同创办了Covariant——去年亚马逊聘请他们来领导其AI代理工作。

虽然AGI实验室开发能够订购SweetGreen的AI代理似乎有些奇怪,但Luan认为代理是创建超级智能AI系统的关键一步。Luan将AGI定义为“一种能够帮助您完成人类在计算机上所做的一切的AI系统”。

Luan表示,他的团队设计了NovaActSDK,以可靠地自动执行简短的任务,并为开发人员提供工具,让他们能够精确定义何时需要人工干预代理工作流程。他希望,这将使开发人员能够创建更可靠的代理应用程序,尽管不一定是完全自主的应用程序。

亚马逊在竞争激烈的市场中推出了首款通用人工智能代理,但这是该公司寄予厚望的一项关键技术。NovaAct的早期测试可以让人们一窥拖延已久的Alexa+的一些功能,这对亚马逊的人工智能努力来说是一个成败攸关的时刻。

OpenAI、Google和Anthropic的早期人工智能代理的主要问题是它们在不同领域的可靠性。在TechCrunch的测试中,这些系统速度很慢,难以长时间独立运行,而且容易犯人类不会犯的错误。我们很快就会看到亚马逊是否破解了密码——或者它的代理是否也存在困扰竞争对手的同样缺陷。

责任编辑:站长云网