Openai释放视觉推断模型O3和O4
发布时间:2025-04-19 10:37
[TechWeb] 4月17日,OpenAI发布了两种视觉推断模型,OpenAi O3和O4-Mini,这也是OpenAI系列中的第一个模型,或者可以使用图像来思考推理链。 OpenAI还打开了轻型编程代理-Codex CLI。 OpenAI O3是最强的构想模型,它是需要多面检查的复杂查询的理想选择,并且特别在分析诸如图像,图表和图形之类的视觉活动时发挥作用。在解决困难的现实世界活动时,O3的重大错误比OpenAI O1少20%,尤其是在编程,商业/咨询和创造性思维等领域。 Openai O4-Mini是一种针对快速,有效推理的较小模型。它在数学,编码和视觉活动中尤其是在大小和成本方面取得了显着的性能。它还在非茎和数据科学活动等地方增加了其前身O3-Mini。值得注意的是Openai强调,O3和O4-Mini可以通过API功能调用完全访问ChatGpt工具以及定制的用户拥有的工具。对这些模型进行了培训,以推理如何解决问题,选择何时以及如何使用工具来正确输入详细和周到的答案。例如,Openai说,例如,用户可能会问:“与去年相比,加利福尼亚州的标签热量如何?”该模型可以搜索网络以获取实用程序数据,编写Python代码来产生预测,生成图表或图像,并解释预测背后的关键因素,这些因素与许多工具调用相关。推理允许模型反应并调整根据需要遇到的信息。例如,他们可以在搜索提供商的帮助下多次搜索网络,查看结果,并在需要更多信息时测试新搜索。这种灵活的方法使模型能够处理需要访问最新INF的任务在模型内置知识之外的概念,扩展推理,合成和交叉图案产生生成。目前,Chatgpt Plus,Pro和团队用户可以使用O3,O4-Mini和O4-Mini-High,它将替换O1,O3-Mini和O3-Mini-High。 O3和O4-Mini通过完成API聊天和API响应向开发人员开放。 Openai希望在几周内发布OpenAi O3-Pro,并提供全面的工具支持。同时,OpenAI还宣布了Codex CLI编程代理的开源,该代理商目前已在Github完全打开资源。 Codex CLI是一种轻巧的编码代理,可以在末端运行,该代理直接在用户的计算机上运行,​​旨在最大化O3和O4-Mini等。该模型的推理能力和支持其他API模型,例如GPT-4.1⁠。 (Yiue)