斯坦福报告：中美AI模型性能差距缩小至2.7%，竞争进入白热化

2.5K 00

美国斯坦福大学以人为本人工智能研究所近日发布了《2026年AI指数报告》，这份423页的年度报告对人工智能在能力、投资、就业、应用等方面进行了系统梳理。其中最引人关注的发现之一，是中美两国在AI模型性能上的差距已几乎消失。

中美差距几乎消失

报告指出，自2025年初以来，两国模型已多次交替登顶性能榜单。过去一年来，这一差距虽有波动，但始终保持在个位数。2025年2月，中国”深度求索”公司的DeepSeek-R1曾短暂追平美国最佳模型。

中美AI竞争示意图

截至2026年3月，美国顶尖模型Claude Opus 4.6的Elo评分为1503，而中国顶尖模型紧追其后，差距仅有2.7%。报告指出，美国在基础模型创新、资本投入和算力基础设施上仍保持领先。美国拥有5427个数据中心，是其他国家的10倍以上。

中国在科研与产业应用方面表现突出

相比之下，中国在科研产出与产业应用方面表现更为突出。报告显示，中国在论文发表量、引用次数以及专利产出方面均处于领先地位，在工业机器人（物理AI领域）部署数量上也位居世界前列，占全球装机量的54%。

AI”偏科”严重：能解奥数却读不懂时钟

报告用”锯齿状智能”来形容AI能力分布的不均衡。谷歌的Gemini Deep Think模型在2025年国际数学奥赛中，以35分（满分42分）的成绩夺得金牌，能在4.5小时内用自然语言完成端到端的解题。然而，在专门测试时钟识别的ClockBench上，顶尖模型正确读取指针时钟的概率仅为50.1%，而人类为90.1%。

AI能力分布不均衡示意图