九游·体育(NineGameSports)官方网站-数智体育价值引领者

九游智能体育科技:斯坦福年度结论:中美大模型已没差距-九游·体育科技集团
i1pcban.jpg i1pcban.jpg

新闻九游

九游智能体育科技:斯坦福年度结论:中美大模型已没差距

2026-04-15 

分享到

  仔细一看才知道,这竟然还是斯坦福HAI最新发布的《2026年AI指数报告》给出的结论。

  除了谈中美,报告还一口气给出了14个重要观察或结论,它们共同回答了一个问题:

  报告得出的15个主要结论“Scaling Law见顶”争议下,AI发展不停

  2025年,业界生产了超过90%的知名前沿模型,其中多个模型在博士级科学问题、多模态推理和竞赛数学方面现已达到或超越人类基线。

  而且在SWE-bench Verified这个关键的编码基准测试上,模型性能在一年内从60%提升至接近100%。

  企业端的采用率已经达到88%,而在大学生群体中,五分之四的人已经在使用生成式人工智能。

  截至2026年3月,Anthropic的顶尖模型虽仍保持领先,但优势已收窄至仅2.7%。

  在产出层面,美国依然拥有更多顶级AI模型和更高影响力的专利,而中国则在论文发表量、引用量、专利总数及工业机器人安装量上占据优势。

  有5427个数据中心,数量是其他任何国家的10倍以上(不过能源消耗也超过其他任何国家)。

  几乎每一款领先的AI芯片都由台积电一家公司制造,这使得全球AI智能硬件供应链依赖于中国台湾省的一家代工厂——尽管台积电在美国的扩建项目已于2025年投入运营。

  国际前沿模型Gemini Deep Think可以在IMO中拿下金牌,但当前顶尖模型在读取指针式九游体育时钟时,准确率却只有50.1%。

  在OSWorld这一覆盖多操作系统真实任务的测试中,任务成功率从12%跃升至约66%。

  如今,几乎所有头部前沿模型开发者,都会主动披露模型在能力基准测试上的成绩。

  在负责任的AI中,不同目标之间可能存在“此消彼长”,比如提升安全性,往往会以牺牲准确性为代价。

  2025年,美国在AI上的私人投资达到2859亿美元,规模是中国124亿美元的23倍以上。

  一年内获得新融资的AI公司达到1953家,数量是第二名国家的10倍以上。

  自2017年以来,这一数字已经下降了89%;仅过去一年,就又减少了80%。

  仅用三年时间,生成式AI就触达了53%的人口,普及速度明显快于PC和互联网。

  其中,新加坡的普及率达到61%,阿拉伯联合酋长国为54%;相比之下,美国仅为28.3%,排名第24位。

  到2026年初,生成式AI工具为美国消费者创造的年价值,已经达到1720亿美元。

  换句话说,哪怕很多工具本身是免费的,但普通消费者正在从中拿到真金白银的价值。

  美国只有一半的中小学制定了AI相关政策,而在教师群体中,只有6%的人认为这些政策是清晰的。

  在全球范围内,AI工程技能增长最快的国家,反而是阿拉伯联合酋长国、智利和南非。

  从2022年到2024年,美国和加拿大新增的AI博士数量增长了22%,但这些新增博士,更多流向了学术界,而不是工业界。

  为了把AI能力尽量掌握在本土体系内,发展中经济体持续扩展国家级AI战略,同时政府主导的AI超级计算投资也在同步增长。

  在GitHub上,来自“其他地区”的贡献量,已经超过欧洲,并逐渐逼近美国。

  在“AI会如何影响工作”这个问题上,73%的专家认为是正面的,但公众中只有23%这么看,两者之间拉开了整整50个百分点的差距。

  而从全球范围来看,欧盟在“能否有效监管AI”这件事上,整体信任度要高于美国九游体育和中国。

  1、即使在受控环境中表现出色,机器人仍无法完成大多数家务任务(仅12%)。

  2、AI先替代的是“入门级执行”,而不是“有经验的判断”。从2024年开始,美国22~25岁的年轻开发者岗位,直接少了近20%;但与此同时,年长开发者反而在增加。

  3、AI能力在变强,但环境代价也在同步放大。仅GPT-4o推理的年用水量,就可能超过1200万人的饮用水需求。

  5、AI正在快速进入临床一线,但仍缺乏有效性。一项覆盖500多项研究的综述显示,接近一半的研究,依赖的是示例性问题,而不是真实患者数据;真正基于真实临床数据开展的研究,占比只有5%。

  不仅有谷歌、OpenAI这样的头部模型玩家,而且还有麦肯锡、GitHub、领英等强大数据提供方。

  对了,“以人为本”人工智能实验室(HAI)还是李飞飞发起并联合创立的,之前她通常以“代言人”的身份宣传介绍这份报告,不过今年推特暂无动静。

  相比之前,报告今年还明显增加了一个信号:AI已经不只是技术问题,而是开始全面进入深水区。

  一方面,它持续追踪AI在推理能力、安全性、以及真实世界任务中的表现,但一个关键变化是——

  另一方面,报告首次给出了生成式AI的经济价值新估算,并补充了对劳动力市场影响的最新证据——

  更宏观的部分也在展开,比如提出了一个分析国家层面技术控制与竞争的新框架、首次单独设立AI科学/AI医学两大板块、与谷歌前CEO施密特的公司合写科学章节。