ChatGPT制造商宣布具有推理能力的OpenAI o1模型
OpenAI o1 是一个新的 LLM(大型语言模型)系列,比 GPT 4o(ChatGPT 所依赖的 LLM)更智能。OpenAI 声称 o1 可以思考和推理,并且“感觉非常像人类”。这家人工智能研究公司发布了几个基准来支持其说法。让我们来看看这些基准,了解 OpenAI o1 的工作原理、使用方法、成本以及它能做什么和不能做什么。
OpenAI o1 是什么:它比 GPT 4o 好在哪里
在讨论是什么之前,我们先来了解一下为什么,或者说为什么 o1 很重要。至少在 AI 文本生成方面,GPT 4o 及其同类产品的功能类似于具有自动完成功能的高级预测文本系统。据说,随着新推出的 o1 系列 LLM 模型的推出,这种情况将有所改变。
OpenAI 已宣布推出 o1-preview 和 o1-mini(前者的缩小版,专门用于编写和调试代码)。本文中提到的 o1 指的是更大的预览模型,除非另有说明。
o1 在内部被称为“Strawberry”,而这个 OpenAI Strawberry 模型因据称具有类似人类的推理能力而备受期待。
O1 中的“o”代表 Omni(即“全部”),1 表示“将计数器重置回 1”。这表明该公司认为 o1 标志着其 AI 研究和产品路线图的一个里程碑。
o1 模型经过训练可以学习、认识错误、重新学习并遵循不同的策略来解决问题。
o1 使用为其量身定制的新数据集和称为“强化学习”的优化算法/过程进行训练。o1 旨在分析和解决复杂问题(使用数学和逻辑推理)。想象一下人类思维如何遵循一系列微观思想,每个微观思想都引出另一个微观思想。同时,它可以思考离散的事物。同样,o1 也会学习模式,作为一台具有巨大内存的机器,它可以训练大量问题。
o1 通过“胡萝卜加大棒”的策略来识别正确答案或选择正确的一系列步骤。
o1 真正让 OpenAI 研究人员感到惊讶的是,当 o1 在解决问题时遇到障碍时,它会(自行)收集更多资源并使用它们来实现目标(来源:OpenAI o1 系统卡)。这让我们想到:
OpenAI o1 的优势:它能做什么
据报道,o1 可以像人类一样推理。
它可以自我核实事实。
它可以使用类似人类的短语“哦,我的时间不多了,让我快点找到答案”,或“我可以做这个或那个,我该怎么办?”给你一种思考的幻觉。
o1 在美国高中国际数学奥林匹克 (IMO) 比赛中取得了 83% 的成绩,而 GPT 4o 只能取得 13% 的成绩。
版权声明:本文由用户上传,如有侵权请联系删除!