独家 | 李彦宏最新内部讲话曝光，谈大模型三大认知误区：榜单不代表实力，智能体还是非共识

图片来源：百度近半年多来，AI行业在经历飞速增长后开始进入冷静期。业内出现了对AI的担忧声音：大模型技术是否已经接近天花板？大模型之间是否没有技术壁垒？闭源模型相对开源模型的优势是什么？AI应用的发展方向在哪里？这些令人担心的问题甚至引发了AI是否又是一场科技泡沫的舆论。近日，李彦宏的一场内部讲话被曝光。他提出了大模型三大认知误区，涉及了大模型竞争格局、开源模型效能以及智能体发展趋势等备受关注的话题。 ZP整理了李彦宏的核心观点和讲话原文。核心观点误区一：大模型之间的能力已经不存在壁垒？打榜不能代表大模型真正实力对于行业"大模型之间的能力已经没有壁垒"的说法，李彦宏给出了不同观点。"每次新模型发布，都要和GPT-4o做比较，说我的得分已经跟它差不多了，甚至某些单项上得分已经超过它了，但这并不表明和最先进的模型就没有差距了。" 大模型公司刷榜似乎已经成为"潜规则"，也就是李彦宏在讲话中说到的"对于测试集的over-fitting"。为了让为了让自家模型得高分，这里面很多厂商会刷榜，有的会让数据标注员把评测题做一遍，有的会让GPT-4做一遍再把答案喂给自家模型，相当于让模型"刷题"考高分 ...