深度｜外媒评价OpenAI o1：被设计得过度思考的AI

图片来源：OpenAI OpenAI 在周四发布了其新的 o1 模型，让 ChatGPT 用户首次有机会尝试在回答之前"思考"的 AI 模型。在这些代号为"草莓"的模型发布之前，已经有很多炒作。但草莓真的配得上这些炒作吗？有点儿。与 GPT-4o 相比，o1 模型感觉像是向前迈了一步却又退了两步。OpenAI 的 o1 在推理和回答复杂问题方面表现出色，但使用该模型的成本大约是 GPT-4o 的四倍。OpenAI 最新的模型缺乏使 GPT-4o 如此令人印象深刻的工具、多模态能力和速度。事实上，OpenAI 甚至在其帮助页面上承认"GPT-4o 仍然是大多数提示的最佳选择"，并在其他地方指出 o1 在简单任务上表现不佳。 "这很令人印象深刻，但我认为改进并不是很显著，"纽约大学研究人工智能模型的教授拉维德·施瓦茨·齐夫说。"在某些问题上表现更好，但并没有普遍的改进。" 出于所有这些原因，重要的是仅在 o1 真正设计用来帮助解决的问题上使用它：重大问题。明确来说，目前大多数人并没有使用生成性人工智能来回答这些类型的问题，主要是因为今天的人工智能模型在这方面表现得并不好。然而，o1 是朝着这个方 ...