美国斯坦福大学以人为本人工智能研究所近日发布了《2026年AI指数报告》,这份423页的年度报告对人工智能在能力、投资、就业、应用等方面进行了系统梳理。其中最引人关注的发现之一,是中美两国在AI模型性能上的差距已几乎消失。
中美差距几乎消失
报告指出,自2025年初以来,两国模型已多次交替登顶性能榜单。过去一年来,这一差距虽有波动,但始终保持在个位数。2025年2月,中国”深度求索”公司的DeepSeek-R1曾短暂追平美国最佳模型。

截至2026年3月,美国顶尖模型Claude Opus 4.6的Elo评分为1503,而中国顶尖模型紧追其后,差距仅有2.7%。报告指出,美国在基础模型创新、资本投入和算力基础设施上仍保持领先。美国拥有5427个数据中心,是其他国家的10倍以上。
中国在科研与产业应用方面表现突出
相比之下,中国在科研产出与产业应用方面表现更为突出。报告显示,中国在论文发表量、引用次数以及专利产出方面均处于领先地位,在工业机器人(物理AI领域)部署数量上也位居世界前列,占全球装机量的54%。
AI”偏科”严重:能解奥数却读不懂时钟
报告用”锯齿状智能”来形容AI能力分布的不均衡。谷歌的Gemini Deep Think模型在2025年国际数学奥赛中,以35分(满分42分)的成绩夺得金牌,能在4.5小时内用自然语言完成端到端的解题。然而,在专门测试时钟识别的ClockBench上,顶尖模型正确读取指针时钟的概率仅为50.1%,而人类为90.1%。

AI对就业的影响显现
AI对就业的影响正在显现。报告发现,生产率提升明显的领域,往往也是初级岗位减少的领域。在美国,22—25岁的软件开发人员就业率自2024年以来下降了近20%,而年长从业者数量增加。
最强AI模型透明度下降
当AI能力越来越强,我们对它的了解却越来越少。报告中的”基础模型透明度指数”平均得分,从上一年的58分骤降至40分。超过90%的知名AI模型由私营公司创造,但许多公司不再披露训练数据集大小、参数数量或训练时长。
这份报告揭示了AI发展的最新态势:中美AI竞争已进入白热化阶段,差距正在快速缩小,但AI本身的”偏科”问题依然突出,如何让AI更均衡地发展仍是行业面临的重要课题。



