计算机行业投资策略周报:人机交互革命,Anthropic推出Computer Use
财通证券·2024-10-27 20:23

Anthropic发布升级版Claude 3.5 Sonnet,并推出Computer Use功能 Anthropic发布升级版Claude 3.5 Sonnet和Claude 3.5 Haiku [6][7] - Anthropic于2024年10月22日发布了两款新的大模型,分别对标GPT-4o和GPT-4o mini,在多维参数上实现了超越 [6] - Claude 3.5 Sonnet(new)具备行业领先的软件编程能力,在SWE-bench Verified上排名第一,测试的GitHub问题解决率达到49% [8][11] - Claude 3.5 Haiku是Anthropic最新大模型中速度最快的,在所有能力较上一代模型均有所提高,尤其是在编程方面成绩突出 [7] Anthropic推出Computer Use功能,开启人机交互新范式 [12][19] - Computer Use功能让大模型可以像人类一样直接操纵电脑鼠标和键盘去完成指令 [12] - Computer Use功能包括:多模态理解屏幕、定位像素、点击或输入、完成相应任务 [12][13][14][16][17] - Computer Use功能实现了从"工具适应模型"到"模型适用工具"的转变,让大模型直接使用PC软件,无需额外适配环境 [19] Computer Use功能尚需平衡效果、安全和成本 [20][21][22] - 在OSWorld评估中,Claude的得分率为14.9%,远远落后于人类水平 [20] - Anthropic高度重视管理Computer Use功能的安全性,从规避提示注入风险、规避干预政治、保护用户隐私三方面入手 [21] - Computer Use的使用成本相当高,Anthropic需要不断降低成本,才有希望引领AI Agent加速革新和落地推广 [22]