黑料吃瓜网:智慧水务的發展戰略-首席执行官奥特曼罕见“认错”,考虑OpenAI开源策略!啥情况?
当地时间 1 月 31 日,OpenAI 正式推出全新推理模型 o3-mini,并首次向免费用户开放。这一成本效益最高的模型现已在 ChatGPT 和 API 中上线。OpenAI 首席执行官 Sam Altman 携高管在 Reddit 上回应网友问题,承认过去在开源方面存在不足,并表示将考虑新的开源策略。
每经编辑 杜宇
当所有人还在惊叹 DeepSeek 的惊人实力时,OpenAI 终于坐不住了。当地时间 1 月 31 日,OpenAI 正式推出了全新推理模型 o3-mini,并首次向免费用户开放推理模型。这是 OpenAI 推理系列中最新、成本效益最高的模型,现在已经在 ChatGPT 和 API 中上线。

图片来源:OpenAI
OpenAI 可能考虑开源、公开完整思维链。在 o3mini 正式推出之时,OpenAI 的首席执行官 Sam Altman(奥特曼)携一众高管在 reddit 回答网友问题,其间罕见承认 OpenAI 过去在开源方面一直站在 " 历史错误的一边 "。Altman 表示:" 需要想出一个不同的开源策略 "。

在谈及 DeepSeek 时,Altman 表示它是 " 一个很好的模型 ",并表示 " 我们将生产更好的模型,但与往年相比,领先优势更少 "。

Altman 还进一步表示,得益于 DeepSeek,OpenAI 可能更多地揭示其所谓的推理模型(如 O3-Mini)如何展示其 " 思考过程 "。目前,OpenAI 的模型隐藏了它们的推理过程,防止竞争对手为自己的模型获取训练数据。相比之下,DeepSeek 的 R1 模型则对用户开放思维链输出。

OpenAI 首席产品官 Kevin Weil 也补充表示:
" 我们正在努力展示比今天更多的内容,这将很快实现。待定,展示所有的思维链(CoT)的确会导致竞争性蒸馏,但我们也知道人们(至少是高级用户)想要它,所以我们会找到合适的方法来平衡它。"

在当地时间 1 月 31 日的新闻稿中,OpenAI 披露,在 2024 年美国数学邀请赛(AIME 2024)的测试中,低推理努力的 o3-mini 准确率(60%)与 o1-mini 差不多,但速率更快;而在中等努力下,o3-mini 准确率能够提升到 79.6%,与 o1 模型相当。在最高努力水平时,o3-mini 的准确率则能进一步提升至 87.3%。
横向对比,DeepSeek-R1 模型在 AIME 2024 测试中的准确率为 79.8%,而在 GPQA Diamond 测试中的准确率为 71.5%。
有专家在社交媒体表示:受 DeepSeek 影响,OpenAl 现在也显示推理模型的思维过程了。

此外,对于付费用户,o3-mini 将在模型选择器中替代 o1-mini。作为升级的一部分,每月花费 20 美元左右的 ChatGPT Plus 和 Team 用户,速率限制也从 o1-mini 的每天 50 条,提升到 o3-mini 的 150 条。每月支付 200 美元的 ChatGPT Pro 用户,能无限制地访问 o3-mini。
每日经济新闻综合公开资料