独家 | 李彦宏最新内部讲话曝光,谈大模型三大认知误区:榜单不代表实力,智能体还是非共识
Z Potentials·2024-09-12 10:29

图片来源:百度 近半年多来,AI行业在经历飞速增长后开始进入冷静期。 业内出现了对AI的担忧声音:大模型技术是否已经接近天花板?大模型之间是否没有技术壁垒?闭 源模型相对开源模型的优势是什么?AI应用的发展方向在哪里? 这些令人担心的问题甚至引发了AI是否又是一场科技泡沫的舆论。 近日,李彦宏的一场内部讲话被曝光。 他提出了大模型三大认知误区,涉及了大模型竞争格局、开源模型效能以及智能体发展趋势等备受关注的话题。 ZP整 理了李彦宏的核心观点和讲话原文。 核心观点 误区一:大模型之间的能力已经不存在壁垒? 打榜不能代表大模型真正实力 对于行业"大模型之间的能力已经没有壁垒"的说法,李彦宏给出了不同观点。"每次新模型发布,都要和GPT-4o做比较,说我的得分已经跟它差不多了,甚至 某些单项上得分已经超过它了,但这并不表明和最先进的模型就没有差距了。" 大模型公司刷榜似乎已经成为"潜规则",也就是李彦宏在讲话中说到的"对于测试集的over-fitting"。为了让为了让自家模型得高分,这里面很多厂商会刷榜, 有的会让数据标注员把评测题做一遍,有的会让GPT-4做一遍再把答案喂给自家模型,相当于让模型"刷题"考高分 ...