计算机|OpenAI o1推理升级,关注强化学习新机遇
中信证券研究·2024-09-18 08:13

文 | 杨泽原 丁奇 马庆刘 Op e nAI o 1模型升级思维链和强化学习,重点提升模型推理性能,代码、数学、科学等强逻辑领域 能力大幅提升,持续探索AGI实现新方式。新模型在训练和推理端同步推动算力需求倍增,算力产 业链景气度持续上升;应用端进一步降低各领域应用开发成本,推理性能提升扩展强逻辑场景覆 盖,加速各领域应用落地。建议持续关注相关领域的头部AI公司。 ▍ 事项:北京时间9月1 3日凌晨, OpenAI发布o 1模型;OpenAI o 1具备复杂推理能力,代码、 数学、科学领域达到顶尖水平。 o 1可将任务拆解成多个简单任务,构成完整思维链并进行优化,提升最终回答的逻辑性、综合 性、准确性。当前p r e v i ew版本已开放给5级API用户,并将在下周向企业和学术用户优先开放。 根据公司官网,编程方面,模型在Co d e f o r c e s竞赛上超过8 3%的专业人员。数学方面,以2 0 2 4年 的美国数学邀请赛为测试集,o 1单次生成可解决7 4%的问题,多次生成后进一步提升正确率到 8 3%,而GPT- 4只能解决1 2%的问题。科学方面,模型GPQA Dimo n d测试集正确率 ...