OpenAI推出o3和o3 Mini推理模型明年初向公众开放

站长云网 2024-12-21 5iter.com 站长云网

在"12DaysofOpenAI"活动的最后一天，OpenAI今天宣布即将推出o3系列推理模型。与现有的o1系列类似，o3系列将包括o3和o3mini模型。OpenAI还分享了o3型号的一些基准数据。

o3在ARC-AGI半私密评估中的得分突破了75.7%。采用高计算配置的o3在半私密评估中获得了87.5%的分数。

在EpochAI前沿数学基准测试中，o3解决了25.2%的问题，而现有模型只解决了2%。

在SWE-BenchVerified测试中，o3获得了71.7分，比o1高出22.8分。

在Codeforces上，o3的Elo评分为2727。

在AIME2024中，o3获得了96.7%的分数。相比之下，o1的得分是83.3。

在GPQADiamond中，o3得分为87.7%。相比之下，o1的得分为78%。

ARC奖团队就OpenAI的新o3模型评价如下：

OpenAI的新o3模型代表了人工智能适应新任务能力的重大飞跃。这不仅仅是渐进式的改进，而是真正的突破，标志着人工智能的能力与之前的LLM限制相比发生了质的转变。o3是一个能够适应从未遇到过的任务的系统，可以说在ARC-AGI领域接近人类水平。

o3迷你模型将为用户提供在三个推理级别之间进行选择的选项：高、中、低三个推理级别。低级别速度最快，但准确度较低，而高级别速度最慢，但准确度较高。

OpenAI尚未发布o3模型。不过，从今天开始，它已开始共享o3模型，用于安全测试。有兴趣的安全和安保研究人员也可以申请在公开发布之前使用o3模型。o3模型预计将于2025年向公众开放。

责任编辑：站长云网

上篇：大众汽车与工会达成协议拟削减产能同时维持德国工厂运营

下篇：Google正在将Gemini的深入研究模式扩展至 40 种语言

顶一下[0]

踩一下[0]