速递 | OpenAI o1草莓模型发布,这次真的更像人类了!
Z Potentials·2024-09-13 02:00

图片来源:OpenAI OpenAI 官方网站上发布了关于 OpenAI o1 系列模型的介绍。这个系列的模型旨在解决复杂问题,训练模型在回应之前花更多时间思考问题,类似于人类的 思考方式。通过训练,它们学会了完善自己的思维过程,尝试不同的策略,并识别自己的错误。 这些模型在科学、编程和数学领域的复杂任务上表现出色, 比以往的模型有显著提升。 以下是一些关键点: 工作原理:这些模型被训练成在回应之前更深入地思考问题,通过训练学习优化思考过程,尝试不同的策略,并识别错误。 性能:在测试中,新模型在物理、化学和生物学的挑战性基准任务上的表现与博士生相当。在国际数学奥林匹克竞赛的资格赛中,GPT-4o 正确解答了 13% 的问题,而推理模型的得分为 83%。在编程方面,它们在 Codeforces 竞赛中达到了第 89 百分位。 安全性:开发这些新模型时,OpenAI 引入了新的安全训练方法,利用模型的推理能力使其遵循安全和对齐指南。在"越狱"测试中,o1-preview 模型的 得分为 84 分(满分 100 分),显著高于 GPT-4o 的 22 分。 目标用户:这些增强的推理能力对于在科学、编程、数学等领域解 ...