深度|外媒评价OpenAI o1:被设计得过度思考的AI
Z Potentials·2024-09-15 00:23

图片来源:OpenAI OpenAI 在周四发布了其新的 o1 模型,让 ChatGPT 用户首次有机会尝试在回答之前"思考"的 AI 模型。 在这些代号为"草莓"的模型发布之前,已经有很多炒 作。但草莓真的配得上这些炒作吗? 有点儿。 与 GPT-4o 相比,o1 模型感觉像是向前迈了一步却又退了两步。OpenAI 的 o1 在推理和回答复杂问题方面表现出色,但使用该模型的成本大约是 GPT-4o 的 四倍。OpenAI 最新的模型缺乏使 GPT-4o 如此令人印象深刻的工具、多模态能力和速度。 事实上,OpenAI 甚至在其帮助页面上承认"GPT-4o 仍然是大多数 提示的最佳选择",并在其他地方指出 o1 在简单任务上表现不佳。 "这很令人印象深刻,但我认为改进并不是很显著,"纽约大学研究人工智能模型的教授拉维德·施瓦茨·齐夫说。"在某些问题上表现更好,但并没有普遍的改 进。" 出于所有这些原因,重要的是仅在 o1 真正设计用来帮助解决的问题上使用它:重大问题。明确来说,目前大多数人并没有使用生成性人工智能来回答这些类 型的问题,主要是因为今天的人工智能模型在这方面表现得并不好。然而,o1 是朝着这个方 ...