速递 | OpenAI o1草莓模型发布，这次真的更像人类了！

图片来源:OpenAI OpenAI 官方网站上发布了关于 OpenAI o1 系列模型的介绍。这个系列的模型旨在解决复杂问题，训练模型在回应之前花更多时间思考问题，类似于人类的思考方式。通过训练，它们学会了完善自己的思维过程，尝试不同的策略，并识别自己的错误。这些模型在科学、编程和数学领域的复杂任务上表现出色，比以往的模型有显著提升。以下是一些关键点：工作原理：这些模型被训练成在回应之前更深入地思考问题，通过训练学习优化思考过程，尝试不同的策略，并识别错误。性能：在测试中，新模型在物理、化学和生物学的挑战性基准任务上的表现与博士生相当。在国际数学奥林匹克竞赛的资格赛中，GPT-4o 正确解答了 13% 的问题，而推理模型的得分为 83%。在编程方面，它们在 Codeforces 竞赛中达到了第 89 百分位。安全性：开发这些新模型时，OpenAI 引入了新的安全训练方法，利用模型的推理能力使其遵循安全和对齐指南。在"越狱"测试中，o1-preview 模型的得分为 84 分（满分 100 分），显著高于 GPT-4o 的 22 分。目标用户：这些增强的推理能力对于在科学、编程、数学等领域解 ...