信息技术行业动态点评:Claude新版本发布,大模型能力持续高歌猛进
东方财富证券·2024-06-24 17:30

行 业 研 究 / 信 息 技 术/ 证 券 研 究 报 告 信息技术行业动态点评 Claude新版本发布,大模型能力持续高 歌猛进 2024 年 06 月 24 日 【事项】 北京时间 6 月 21 日,Anthropic 正式发布 Claude 3.5 Sonnet。从 Anthropic 透露的信息来看,在阅读、编码、数学和视觉等几个主要 AI 基准测试中,新模型能力不仅超过了 Claude 3 Sonnet,还超越了 Anthropic 此前最强版本的旗舰模型 Claude 3 Opus。另外,在其释 出的一系列与行业竞争对手的测试结果榜单中,Claude 3.5 Sonnet 的大部分成绩优于 OpenAI、Google、Meta 的旗舰模型,包括刚推出 不久的 GPT-4o。细致来看,Claude 3.5 Sonnet 在研究生水平推理 (GPQA)、编码能力(HumanEval)、文本推理(DROP)等方面的成绩均 好于 GPT-4o,在数学问题解决能力上稍逊于后者。 【评论】 性能优异,多模态能力优秀。Claude 3.5 具有 20 万个 token 的上下 文窗口,约合 15 万个单词。其 ...