ChatGPT制造商宣布具有推理能力的OpenAI o1模型

• 2024-09-18 10:17:12

摘要 OpenAI o1 是一个新的 LLM(大型语言模型)系列，比 GPT 4o(ChatGPT 所依赖的 LLM)更智能。OpenAI 声称 o1 可以思考和推理，并且感...

OpenAI o1 是一个新的 LLM(大型语言模型)系列，比 GPT 4o(ChatGPT 所依赖的 LLM)更智能。OpenAI 声称 o1 可以思考和推理，并且“感觉非常像人类”。这家人工智能研究公司发布了几个基准来支持其说法。让我们来看看这些基准，了解 OpenAI o1 的工作原理、使用方法、成本以及它能做什么和不能做什么。

OpenAI o1 是什么：它比 GPT 4o 好在哪里

在讨论是什么之前，我们先来了解一下为什么，或者说为什么 o1 很重要。至少在 AI 文本生成方面，GPT 4o 及其同类产品的功能类似于具有自动完成功能的高级预测文本系统。据说，随着新推出的 o1 系列 LLM 模型的推出，这种情况将有所改变。

OpenAI 已宣布推出 o1-preview 和 o1-mini(前者的缩小版，专门用于编写和调试代码)。本文中提到的 o1 指的是更大的预览模型，除非另有说明。

o1 在内部被称为“Strawberry”，而这个 OpenAI Strawberry 模型因据称具有类似人类的推理能力而备受期待。

O1 中的“o”代表 Omni(即“全部”)，1 表示“将计数器重置回 1”。这表明该公司认为 o1 标志着其 AI 研究和产品路线图的一个里程碑。

o1 模型经过训练可以学习、认识错误、重新学习并遵循不同的策略来解决问题。

o1 使用为其量身定制的新数据集和称为“强化学习”的优化算法/过程进行训练。o1 旨在分析和解决复杂问题(使用数学和逻辑推理)。想象一下人类思维如何遵循一系列微观思想，每个微观思想都引出另一个微观思想。同时，它可以思考离散的事物。同样，o1 也会学习模式，作为一台具有巨大内存的机器，它可以训练大量问题。

o1 通过“胡萝卜加大棒”的策略来识别正确答案或选择正确的一系列步骤。

o1 真正让 OpenAI 研究人员感到惊讶的是，当 o1 在解决问题时遇到障碍时，它会(自行)收集更多资源并使用它们来实现目标(来源：OpenAI o1 系统卡)。这让我们想到：

OpenAI o1 的优势：它能做什么

据报道，o1 可以像人类一样推理。

它可以自我核实事实。

它可以使用类似人类的短语“哦，我的时间不多了，让我快点找到答案”，或“我可以做这个或那个，我该怎么办?”给你一种思考的幻觉。

o1 在美国高中国际数学奥林匹克 (IMO) 比赛中取得了 83% 的成绩，而 GPT 4o 只能取得 13% 的成绩。

标签：

ChatGPT制造商宣布具有推理能力的OpenAI o1模型

猜你喜欢

最新文章