DeepSeek后更大的机遇:AI端侧推理创新

2025-03-11 04:25:19 · chineseheadlinenews.com · 来源: 量子位

每年开春的“新机潮”,今年出尽风头的是DeepSeek。

一时之间,几乎所有主流消费终端厂都在短时间内完成DeepSeek的接入。

荣耀、OPPO、魅族、vivo、小米纷纷官宣自家AI助理上线DeepSeek-R1及其满血版;甚至OPPO今年新发的旗舰大折叠Find N5,也强调了对DeepSeek的支持。

另一个被掀起鲶鱼效应的是车圈。

一个月内,吉利、比亚迪、奇瑞、岚图、长城、理想等超过20家车企宣布接入DeepSeek,形成汽车与AI加速融合的一个切面。

热潮之下是技术洪流不断向前涌动——

AI正在进入推理创新时代。

如此趋势认知来自高通。DeepSeek效应从AI领域向外辐射,从算法创新逐渐演变成对每个人生活工作的潜在影响。

辐射普罗大众,消费终端是关键桥梁。

由此,在当下节点,一份对AI端侧趋势的梳理就变得尤为重要。高通最新发布的白皮书《AI变革正在推动终端推理创新》,已梳理出四大趋势:

先进AI小模型已具有卓越性能

模型参数规模正在快速缩小

开发者能够在边缘侧打造更丰富的应用

AI正在成为新的UI

透过这份行业分析,AI推理之于终端将产生哪些影响?也就有更明了了。

AI正在进入推理创新时代

最首要的问题,DeepSeek这条“鲶鱼”究竟改变了什么?

之于行业内,大模型端侧趋势早已是暗流涌动。在ChatGPT爆火后,高通就提出了混合AI的概念。

它强调,随着生成式AI不断发展,AI处理必须分布在云侧和终端进行,才能实现AI的规模化扩展并发挥其最大潜能。它几乎适用于所有生成式AI应用和终端领域,包括手机、笔记本电脑、XR头显、汽车和物联网。

从当时来看,节省成本是推动混合AI架构的主要因素之一。一次AI问答所需的成本是传统搜索的1000倍,混合AI能够通过和终端设备协同算力的方式,降低云端计算的成本。同时兼顾个性化、隐私保护等需求。

这也造成了部分AI体验被阉割的问题。由于当时推理Scaling Law(语言模型中的规模化法则行为)尚未被提出,模型能力与参数规模呈强烈正相关,尽避厂商们也陆续推出小型号模型适应端侧需求,但性能和精度水平仍旧受到限制。

在实际进展上,高通在过去几年先后发布的第三代骁龙8、骁龙X Elite和骁龙8至尊版等平台上,开始强化终端芯片对生成式AI能力的支持。手机、PC厂商们在此基础上进一步发力,陆续推出本地支持AI能力的新机,AI端侧应用迎来一波小趋势,不仅手机助手都更加智能化,也衍生出AI一键消除路人、AI语音通话总结等原生AI端侧应用。

可以说,在过去几年,端侧AI已搭建好初步的框架和地基。若有更强劲的东风,这股新趋势便将进一步爆发。

高通技术公司高级副总裁兼技术规划和边缘解决方案业务总经理马德嘉(Durga Malladi)近期的采访,进一步验证了外界的猜测:

我们在去年11月份的时候已经做出了这样的预判,会有越来越多的高质量模型在搭载骁龙平台的终端侧运行,让开发者能够在边缘侧打造更丰富的应用。

果然,在2025年,推理模型DeepSeek-R1这股东风到来。它从模型层面为困扰端侧AI已久的成本问题,提供了全新解决思路。

通过使用思维链推理数据和非推理数狙挞调,并进行蒸馏,DeepSeek-R1实现了将推理能力赋予到小辨模稠密模型上。

这意味着,高质量且小辨模的模型并非不可能实现。DeepSeek一声惊雷过后,这样的模型只可能比人们预想中的还要多、还要实惠。

由此,高通对当下趋势进行梳理,在白皮书给出四大值得参考的方向。一方面是为了在发展中总结经验,另一方面也是与行业一起探讨前路方向。

其中,第一点被提及的还是快速进化的AI模型。

现如今,不仅模型质量在进一步提高,开发方式其实也在变得更便捷。

经过多年探索,目前AI领域内针对不同模型需求,已经形成了诸多范式。

比如针大规模模型,可以使用MoE(混合专家模型)、SSM(状态空间模型)等架构来降低计算开销,同时保证模型质量;使用思维链和自我验证等,能够大幅提升模型在数学、编码、推理等方面能力;对于小模型,蒸馏技术的普遍应用能够让大模型“教学”小模型,保持准确性的同时迁移知识,进一步降低开发难度,一定程度上避免重复造轮子。

其次,从全行业范围看,模型参数规模正在快速缩小。

量化、剪枝、蒸馏等技术下,大模型的性能可以很好迁移到小模型上。

基于通义千问模型和Llama模型的DeepSeek蒸馏版本,在GPQA基准测试中,与GPT-4o、Claude 3.5 Sonnet和GPT-o1 mini等先进模型相比,取得了相似或更高的分数。

此外,让模型更“浓缩精华”也是正在发生的趋势。根据Epoch AI整理的数据,2024年发布的大规模AI模型中,超过75%的模型参数在千亿规模以下。

第三,高质量模型激增,开发者有了更多选择,边缘侧的AI应用正在渗透到普通用户的日常用机习惯中。

比如文档摘要、AI图像生成和编辑以及实时语言翻译,已经成为如今AI手机上的常见功能。影像方面更是可以利用AI进行计算摄影、物体识别和场景优化。

这些都得益于AI推理在终端侧的广泛普及。

由此更进一步,AI正在成为新的UI。

随着大模型入驻手机、PC,传统的屏幕交互正在被变革、颠覆,个性化多模态AI智能体可以简化人机交互流程,高效地跨越各种应用完成任务。

比如荣耀去年火出圈的“一句话点咖啡”,就是一个例子。

当然还不止于手机、PC、汽车等消费级终端,未来在机器人、无人机以及其他自主设备上,AI也有望实现实时决策,在动态的真实环境中实现精确交互。

综上,随着AI进入推理时代,终端侧的创新与应用落地被进一步激发,AI格局甚至都将就此发生改变。

那么问题来了——

AI推理时代需要什么?

DeepSeek-R1的蒸馏模型,在问世不到两周时间内就被争相接入各种终端,令不少业内人士都惊叹不已。

而在DeepSeek之外,值得关注的是,大部分接入的终端产品都是“高通芯”。

关键的一点是,在DeepSeek搅动风云之前,高通就已经进行了前瞻预判:AI计算处理将从云端向边缘侧扩展。

2023年5月,高通发布了《混合AI是AI的未来》白皮书,其中提到:

AI处理必须分布在云端和终端进行,才能实现AI的规模化扩展并发挥其最大潜能。

而决定进程的影响因素包括:终端能力、性能需求、隐私和安全需求,以及商业模式等诸多因素。

简单归纳,核心回到3个问题:

硬件设计是否能满足模型对终端算力的需求?

相比云端模型,终端“小”模型是否足够好,足够多,足够便宜?

打通软硬件的AI Infra(人工智能基础设施,连接算力和应用的AI中间层)是否完备,终端侧的生态系统是否健全?

围绕这3点,再回溯高通这两年以来的技术布局,不难看出,高通在终端AI领域,再次引领了时代之先。

首先,是高性能、高能效的芯片设计。

高通长期致力于开发定制CPU、NPU、GPU和低功耗子系统,同时拥有封装技术和热设计的技术专长,构成了其行业领先系统级芯片(SoC)产品的基础。

这些SoC能够直接在终端侧提供高性能、高能效的AI推理。

比如,骁龙8至尊版除了在对AI最为关键的NPU上带来一系列升级,在CPU和GPU上同样做了不少文章,以更加充分地释放SoC的AI能力。

包括引入自研Oryon CPU,应对对时延敏感的AI任务,比如实时翻译、AI助手命令响应等,并负责将AI任务分配到其他核心上。

而骁龙8至尊版的Hexagon NPU,目前已经可以支持70+ Tokens/秒、4K上下文的生成能力;并为应对多模态AI任务增加了额外的内核。

又比如骁龙X系列平台,其专为实现高性能、高能效的生成式AI推理而打造的NPU核心,对定义全新AI PC品类发挥了关键作用。

△MWC2025高通展区画面

其次,是覆盖所有关键边缘细分领域的可扩展性。

不仅是手机、PC,在XR头显和眼镜、智能汽车,以及工业互联网等诸多终端场景中,高通的身影无处不在,并代表着最先进的技术水平。

△MWC2025中高通展区展出搭载骁龙XR平台的终端

而在所有这些场景中,高通始终在更加积极、极致地融入、提升AI能力。

比如在本届MWC上,高通发布高通跃龙第四代固定无线接入(FWA)平台至尊版,基于高通X85打造,支持长达14公里的毫米波远程通信——

高通提到,毫米波覆盖范围的扩大得益于AI优化和AI辅助波束选择技术。

而其流量分类和智能网络选择等AI功能,也是基于X85这颗5G AI处理器的AI能力实现的。

又比如骁龙数字底盘解决方案,在其情境感知智能座舱系统中使用终端侧AI,旨在增强汽车安全和驾驶体验。该系统利用先进摄像头、生物识别、环境传感器以及先进的多模态AI网络,提供根据驾驶员状态和环境条件而调整的实时反馈和功能。

针对自动驾驶和辅助驾驶系统,高通开发了端到端架构,利用大规模训练数据集,基于真实世界数据和AI增强数据的快速再训练、OTA更新以及包括车内多模态AI模型和因果推理在内的先进软件栈,应对现代自动驾驶和辅助驾驶的复杂性。

目前,高通的硬件和软件解决方案已赋能数十亿智能手机、汽车、XR头显和眼镜、PC以及工业物联网等终端,为广泛行业带来高性能、经济实惠、快速响应和关注隐私的变革性AI体验。

值得关注的是,硬件之外,通过高通AI软件栈、高通AI Hub和开发者协作,高通已构建起完备的生态系统策略,面向不同边缘终端领域的模型部署提供工具、框架和SDK,赋能开发者在边缘侧加速AI智能体和应用的落地。

也可以这样理解——通过高通生态的支持,开发者面向不同平台进行重复开发时,只需一次开发,即可轻松实现跨多平台高效部署。

毫无疑问,大模型从云端扩展到终端的过程中,蕴藏着巨大的机会——

甚至可以说,这是这场“模力时代”变革之中,能最快触达最多人群、引发新爆点的应用领域之一。

而机会总是率先青睐有准备的人,每一次技术变革中,引领潮流的都是有更长远预判,以及孜孜不倦深耕、赋能行业未来的企业、团队。

现在,在AI推理创新时代的开端,以高通为代表的技术上游已经站上潮头,亮出越来越令外界惊喜的手牌,推动着整个行业加速发展。

更多的创新创造,正在涌流。

至少终端侧的智能新可能,已经在2025,初现曙光。


    24小时新闻排行榜更多>>
  1. 茅塞顿开!祖辈流传人生“14自问歌”
  2. 赵乐际因“病”缺席中共人大闭幕会 引揣测
  3. 中国驻美大使:“外资撤离中国论”破产
  4. 赴俄下场令人丧胆 朝鲜盛行“断指”逃兵 当局又出恐怖新规
  5. 两会散场之际 张又侠被指崛起 习失权再惹议
  6. 祖克柏为进军中国,与共产党开发审查系统
  7. 菲律宾前总统杜特尔特回国:生死保卫战
  8. 川普私下怒批查尔斯三世
  9. 多地特斯拉门店爆发示威 马斯克:索罗斯干的
  10. 今年1222万毕业生,三支一扶和西部计划难解青年失业
  11. 官媒删效忠语 两会随从减至两人 习遭降级待遇
  12. 班农马斯克不和,川普“朋友圈”内部之争
  13. 泽伦斯基这次学乖了
  14. 通缩冲击 北京一家店每天四次限时特卖
  15. 日本政府为抑制米价罕见“拍卖”储备米
  16. 传秦刚已遭“秘密处决”李尚福、刘亚洲等人凶多吉少
  17. 马斯克:X遭大规模网络攻击 IP位址来自乌克兰
  18. 真是防弹衣?习近平露出神秘衣角
  19. 中国最神秘富豪要出手,台积电又香了?
  20. 【时事金扫描】小泽正式道歉 川普绝密计划曝光
  21. 川普绝密计划曝光
  22. 川普:不容忍在校从事“亲恐怖,反犹和反美”的学生
  23. 密苏里州胜诉 判罚中共240亿美元 专家解读
  24. 美国大学生访问中国提及神韵 结果令人意外
  25. 重磅!加拿大妥协!对美电力关税取消!
  26. 川普习近平有意6月办“生日峰会” 2人生日仅差一天
  27. 中共南海野心聚焦台海 法媒:8成台人拒绝北京统一
  28. 台湾准备为和平付什么代价?
  29. 高盛下调美国经济预测 警告关税影响远超预期
  30. 上班压力倍增 Z世代员工掀起“装忙”职场风潮
  31. 美股大跌 女股神大举入货 包括特斯拉 重申“通缩繁荣”
  32. 王志安前妻遭遇引关注 赵兰健:王是墙外“高级犬儒”
  33. “美国优先”政策实施 申请SBA担保贷款须有公民身份
  34. 川普会不会是反智?
  35. 美中关税战 中国供应商遭美零售商强令降价消化关税
  36. 白宫:川普不会削减社安金和医疗保险
  37. 鸡蛋供应短缺,将成美国2025年常态
  38. 马斯克与鲁比奥吵架,川普约饭促和解
  39. 实地追踪:习近平的“熊猫外交”为何折戟芬兰?
  40. 川普祭出新关税 标准普尔500指数再度受压
  41. 朝鲜三人逃往韩国失败 遭当局公开枪决
  42. 党史皆伪造 揭秘共军武器来源、地下弹药库
  43. 美国西南航空“超棒招牌优惠”保不住!取消日公布了
  44. 沃尔玛要求中国供应商降价10%
  45. 网红曝“郑爽为获美国绿卡被我爸包养,还怀孕了”
  46. 杜特尔特明知会被抓为何要回国?两大家族斗争白热化
  47. 河南上千高中生撕书 抗议签“双休日自愿到校”
  48. DeepSeek后更大的机遇:AI端侧推理创新
  49. 杨立昆:AI需要学习物理学才能继续进化
  50. 接见美国华裔访团 萧美琴:台美共享价值利益
  51. 童年马斯克:内向和不合群引来了同学的敌意
  52. Meta测试首款自研AI训练芯片 减少对辉达的依赖
  53. 中国用120万移民“占领马来西亚”?
  54. 杜特尔特乘机去海牙,菲副总统发声
  55. 什么是“观察一下”?一定要懂医生的这个“暗语”
  56. 金秀贤否认跟金赛纶恋爱,家属称有200张合影
  57. “国父”的由来 孙中山逝世一百周年纪念文
  58. 被捕菲前总统杜特尔特已登上前往荷兰海牙的飞机
  59. 想问问马委员:平台不相同,条件不一样,何谈竞争?
  60. 轮回的纠葛 命运中的兰花与前世之缘