OpenAI 于 2 月 1 日正式发布了全新模型 o3-mini!这款小型推理模型专为 STEM 领域(科学、技术、工程、数学)优化,在保持低成本与低延迟的同时,提供了强大的逻辑推理能力。相比前代 o1-mini,o3-mini 在运算速度、回答准确性上都有显著提升,错误率降低了 39%,成为当前最具竞争力的轻量级 AI 模型之一。
o3-mini 即日起开放使用,用户可以通过 ChatGPT(包括 Plus、Team、Pro 方案) 以及 OpenAI API 进行访问,企业版本则将于 2 月 上线。值得一提的是,这是 OpenAI 首次向免费用户开放推理模型,任何人都可以在 ChatGPT 中选择 「Reason」模式 或重新生成回应的方式来体验。
o3-mini 的五大升级亮点
1. 支持多种开发者功能,无缝投入生产环境
o3-mini 是 OpenAI 首款支持开发者热门功能的小型推理模型,包括:
- 函数调用(Function Calling) — 实现 AI 与应用的无缝整合
- 结构化输出(Structured Outputs) — 生成 JSON、表格等格式的数据
- 开发者消息(Developer Messages) — 增强 API 交互体验
- 流式响应(Streaming) — 支持实时流式输出,提升互动效率
这些功能使得 o3-mini 成为真正可用于生产环境的 AI 推理模型,开发者可以轻松将其整合到应用或服务中。
2. 提供「低、中、高」推理模式,灵活应对不同需求
o3-mini 允许开发者选择 低、中、高 三种推理等级(reasoning effort):
- 低推理模式(Low) — 速度最快,适合简单任务
- 中推理模式(Medium) — 平衡速度与准确性,适合大多数应用
- 高推理模式(High) — 进行更深入的计算与分析,应对高难度问题
这种设计让 o3-mini 既能快速响应常规问题,又能在面对复杂挑战时进行更深入的思考,极大提升了应用的灵活性。
3. STEM 领域表现卓越,全面超越 o1-mini
测试结果显示,o3-mini 在 STEM 领域表现显著优于 o1-mini,并在部分领域与 o1 持平:
- 数学(AIME 2024 测试) — 高推理模式下准确度达 83.6%
- 博士级科学问答(GPQA Diamond 测试) — 高推理模式下准确度达 77%
- 研究级数学(FrontierMath 测试) — 高推理模式能解决 32% 的难题,其中 28% 为高难度问题(T3)
- 竞赛级编程(Codeforces 测试) — 最高 Elo 分数达 2073
- 软件工程(SWE-bench 测试) — 高推理模式下准确率高达 48.9%
这些数据表明,o3-mini 特别适合数学、科学、编程等技术领域,能够帮助开发者解决更复杂的问题。
4. 响应速度提升 24%,效率更高
与 o1-mini 相比,o3-mini 的响应时间平均缩短了 24%:
- o3-mini 响应时间:7.7 秒
- o1-mini 响应时间:10.16 秒
这意味着 o3-mini 不仅能处理更复杂的问题,还能以更快的速度提供解决方案,这对于实时应用(如聊天机器人、客服系统) 来说是一大优势。
5. ChatGPT Plus 与 Team 用户每日消息上限提升至 150 条
为了让更多用户体验 o3-mini 的强大功能,OpenAI 对 ChatGPT Plus 和 Team 订阅方案进行了升级:
- Plus & Team 订阅者:每日消息上限从 50 条增加到 150 条
- Pro 订阅者:可无限访问 o3-mini 及 o3-mini-high
此外,o3-mini 还支持实时搜索,能够提供带有网页来源的最新答案,这是 OpenAI 在整合搜索技术上的一次新尝试。
如何使用 OpenAI o3-mini?免费用户也能受益
现在,开发者与用户可以通过多种方式访问 o3-mini:
ChatGPT 用户(免费 & 付费)
- 免费用户 — 选择 「Reason」模式 或 重新生成回应 即可体验
- Plus、Team、Pro 用户 — 可直接在 ChatGPT 内选择 o3-mini,享受更高效能与更快响应
开发者(API 访问)
- API 使用层级 3-5 的开发者可以访问 Chat Completions API、Assistants API、Batch API
-
企业用户 将于 2 月 获得完整访问权限
-
o3-mini(标准版) — 中等推理模式,适合大多数应用
- o3-mini-high(高推理版) — 进行更深入计算,适合高难度问题(仅限 Pro 方案)
o3-mini 引领小型 AI 模型新时代
OpenAI 表示,o3-mini 代表了其在小型推理模型领域的重大突破,带来了更高效、更准确、更灵活的 AI 解决方案。无论是开发者、科学家、数学家、程序员,还是普通用户,都能通过 o3-mini 享受到高质量的 AI 推理能力。