中美AI模型差距骤缩至0.3%

2025-04-08 07:25:26 · chineseheadlinenews.com · 来源: 华尔街见闻

2025年斯坦福HAI报告出炉:中国高性能AI模型的数量和质量不断提升,中美顶级模型性能差距缩至0.3%;推理成本暴降,小模型性能飙升;AI正变得更高效、更普惠。

人工智能(AI)的影响从未像现在这样深入社会。斯坦福大学的人工智能研究机构(Stanford HAI)4月8日发布《2025年人工智能指数报告》认为,推理成本暴降280倍,小模型性能飙升,AI正变得更高效、更普惠。

报告还指出,中国高性能AI模型的数量和质量不断提升,对美国的领先地位构成挑战,顶级模型之间的性能差距正在缩小。

美国此前在模型质量方面的领先优势已经消失。中国是人工智能出版物和专利产出最多的国家,如今其开发的模型在性能上已经与美国的竞争对手不相上下。

“2023年,在大规模多任务语言理解测试(MMLU)中,中国领先的模型落后于美国顶级模型近20个百分点。然而,到2024年底,美国的领先优势缩小到了0.3个百分点。”

最新的斯坦福HAI博文中,浓缩了2025年AI指数报告的十二大亮点。

1. AI性能突飞猛进:新基准下的爆发式增长

2023年,研究人员推出了新的基准测试,如MMMU、GPQA和SWE-bench,以测试先进AI系统的极限。

仅一年后,性能便急剧提升:在MMMU、GPQA和SWE-bench上的得分分别提高了18.8、48.9和67.3个百分点。除了基准测试之外,AI系统在生成高质量视频方面也取得了重大进展,在某些情况下,语言模型代理甚至在编程任务中超越了人类,尽管时间预算有限。

2. AI渗透日常生活:从实验室走向现实

从医疗保健到交通运输,AI正迅速从实验室走向日常生活。

2023年,美国食品药品监督管理局(FDA)批准了223款AI医疗设备,而2015年仅有6款。

在道路上,自动驾驶汽车不再是实验:Waymo每周提供超过15万次自动驾驶服务,而百度的Apollo Go无人驾驶出租车队现已服务于中国多个城市。

3. 企业押注AI:投资与应用双双飙升

2024年,美国私营AI投资增长至1091亿美元,是英国45亿美元的24倍。

生成式AI表现尤为强劲,吸引了全球339亿美元的私人投资,比2023年增长了18.7%。AI业务的使用也在加速:78%的组织报告称在2024年使用了AI,高于前一年的55%。

越来越多的研究证实,AI提高了生产力,并且在大多数情况下,有助于缩小劳动力中的技能差距。

4. 美国仍领跑AI模型:但中国正在缩小差距

2024年,总部位于美国的机构产生了40个值得关注的AI模型,大大超过了欧洲的3个。

虽然美国在数量上保持领先,但中国模型在质量上迅速缩小差距:在MMLU和HumanEval等主要基准测试上的性能差距从2023年的两位数缩小到2024年的接近持平。

与此同时,中国在AI出版物和专利方面继续保持领先地位。同时,模型开发日益全球化,来自中东、拉丁美洲和东南亚等地区的项目也值得关注。

5. 负责任AI生态发展不均

与AI相关的事件正在急剧上升,但在主要的工业模型开发商中,标准化的RAI评估仍然很少见。

然而,如HELM Safety、AIR-Bench和FACTS等新基准测试为评估事实性和安全性提供了有希望的工具。在公司中,承认RAI风险与采取有意义的行动之间仍然存在差距。

相比之下,各国政府正表现出越来越大的紧迫性:2024年,全球在AI治理方面的合作加剧,包括OECD、欧盟、联合国和非洲联盟在内的组织发布了侧重于透明度、可信度和其他核心负责任AI原则的框架。

6. 全球AI乐观情绪上升:地区差异依然显著

在诸如中国(83%)、印度尼西亚(80%)和泰国(77%)等国家,大多数人认为AI产品和服务的益处大于危害。相比之下,在诸如加拿大(40%)、美国(39%)和荷兰(36%)等地方,乐观情绪仍然较低。

尽管如此,情绪正在发生变化:自2022年以来,在几个此前持怀疑态度的国家,乐观情绪显著增长,包括德国(+10%)、法国(+10%)、加拿大(+8%)、英国(+8%)和美国(+4%)。

7. AI变得更高效、更经济、更易于获取

在越来越强大的小型模型的推动下,执行GPT-3.5水平任务的系统推理成本在2022年11月至2024年10月期间下降了280多倍。

在硬件层面,成本每年下降30%,而能源效率每年提高40%。开源模型也在缩小与闭源模型的差距,在某些基准测试中,性能差距从8%缩小到1.7%。这些趋势正在迅速降低先进AI的门槛。

8. 政府加大对AI的投入:监管与投资并重

2024年,美国联邦机构引入了59项与AI相关的法规,是2023年的两倍多,并且由两倍多的机构发布。自2023年以来,全球75个国家提及AI的立法增加了21.3%,自2016年以来增长了九倍。

除了日益增长的关注之外,各国政府正在大规模投资:加拿大承诺投资24亿美元,法国承诺投资1090亿欧元,印度承诺投资12.5亿美元,沙特阿拉伯的“超越”项目代表着一项1000亿美元的计划。

9. AI与计算机科学教育扩张:机会与挑战并存

目前,三分之二的国家提供或计划提供K-12计算机科学教育,是2019年的两倍,其中非洲和拉丁美洲取得了最大的进展。

在美国,拥有计算机科学学士学位的毕业生人数在过去10年中增加了22%。然而,由于电力等基本基础设施的差距,许多非洲国家仍然难以获得教育。在美国,81%的K-12计算机科学教师认为AI应该成为基础计算机科学教育的一部分,但只有不到一半的人认为自己有能力教授它。

10. 行业在AI领域加速发展:前沿竞争日益激烈

2024年,近90%的著名AI模型来自行业,高于2023年的60%,而学术界仍然是高度引用的研究的主要来源。模型规模持续快速增长,训练计算量每五个月翻一番,数据集每八个月翻一番,功耗每年增加。

然而,性能差距正在缩小:排名第一和第十的模型之间的分数差距在一年内从11.9%下降到5.4%,并且前两名之间的差距仅为0.7%。前沿领域竞争日益激烈,也变得拥挤。

11. AI在科学领域的影响力获得认可:荣获顶级荣誉

AI日益增长的重要性反映在主要的科学奖项中:两个诺贝尔奖表彰了导致深度学习(物理学)和其在蛋白质折叠(化学)中的应用的工作,而图灵奖则表彰了对强化学习的开创性贡献。

12. 复杂推理仍然是一个挑战:局限性依旧存在

AI模型擅长解决国际数学奥林匹克问题等任务,但在PlanBench等复杂推理基准测试中仍然面临挑战。它们经常无法可靠地解决逻辑任务,即使存在可证明正确的解决方案,这限制了它们在高风险环境中的有效性,在这种环境中,精确性至关重要。


    24小时新闻排行榜更多>>
  1. 中国货断货,美国女企业主哭了
  2. 麻省理工“明星科学家”王江涛加盟北大
  3. 美对华关税最高加到245%:专家解读
  4. 中共搞乌龙称美再加关税至245% 白宫回应
  5. 涉嫌泄密,美防长两名亲信“被休假”
  6. 中国、越南签署45项协议 川普抨击中共密谋搞垮美国
  7. 美撤中国留学生签证 卢比奥:签证是特权 非权利
  8. 李强为何败给王毅? 学者曝背后根源及习的走向
  9. 马斯克听取对华作战计划,川普下令取消
  10. 纽约时报又“反美”:我从未如此担心美国的未来
  11. 加到245%,但美国快撑不下去了
  12. WTO拉响警报:全球贸易萎缩
  13. 防堵中国货洗产地 经济部祭出4招严打违规最高罚300万
  14. 美中贸战转向航空业 中共报复波音被指自伤
  15. 曾称与波音合作 中共避答“暂停交机”传闻
  16. 疯王登基,帝国黄昏
  17. 伯克利中国留学生怒诉川普政府
  18. 245%又怎样?英媒曝北京握有3底牌:中国能撑住
  19. 关键时刻换将!分析:北京不想习直面川普
  20. 英伟达示警+鲍威尔放话
  21. 语出惊人 美前司令:中国在美攻读硕博士32.5万人 恐10%是间谍
  22. 川普大赞“关税政策”有效:通膨下降了
  23. 【佳音时刻】习对美报复被指太无脑 党内恐慌
  24. 川普芯片限制,英伟达领跌科技股
  25. 黄仁勋遭川普背后捅刀?5000亿美元白给了
  26. 美国国税局计划裁员40%
  27. 习近平厚黑学震惊中共党内
  28. 中共最大贸易展广交会凉了 欧美客户不来了?
  29. 身家暴跌37亿美元!三星李在镕痛失韩国首富
  30. 深度:马斯克后宫大戏 如何控制那么多孩子和妈
  31. 一人非移全家禁享住房福利 非法移民福利全面清查
  32. 关键时刻换将 知情人泄李成钢出任贸易代表内情
  33. 别错过这几项抵税福利:人均$3000
  34. 白宫澄清:245%关税税率非新增幅
  35. 美媒承认“中国有1张很强力的牌” 美国没什么反击余地
  36. 川普谈巴拿马运河 拟让各国在美中之间选边站
  37. 加大向伊朗施压 美制裁一中国“茶壶”炼油厂
  38. 再次升级,中方回应
  39. “3岁男童被生父女友虐待致死案”将开庭
  40. 哈佛带头 MIT、普林斯顿等多所大学加入对抗川普
  41. 美对中国关税增至245%?白宫澄清
  42. 美国会发布报告:Deepseek是中共最新工具
  43. 陆媒:神秘财团入局 李嘉诚港口交易大逆转?
  44. 三亚老妇开车撞伤多人 目击网民:有人死亡
  45. 川普阻止马斯克听取对华作战简报,还爆粗
  46. 大陆新近流行的一句话:生了个爷 娶了个奶奶
  47. 新华保险一季度保费增近三成
  48. 弗里克收藏馆4月17日盛大回归
  49. 中国在密谋这件事
  50. 印度扩大军售 低息贷款抢占俄罗斯传统市场
  51. 哈佛硬刚川普遭立即断供:渐冻症等研究叫停
  52. 满世界找不到稀土的川普,有点急眼了
  53. 对比中日二级驱逐舰部队技术与现状
  54. 曝川普政府向70余国施压 限制贸易往来孤立中国
  55. 美国改口:累计援乌1000亿
  56. 川普出手压药价!砍高昂处方药价格 推动进口开放
  57. Temu、Shein大砍广告投放,Meta率先受冲击?
  58. 欧盟警告来自中国的化妆品含有毒物质
  59. 关税再添可能名单 川普启动钴 镍 稀土关键矿产调查
  60. 富二代具俊晔,婚前财产惊人