一段绵延的技术史:算法背的锅太多了
2025-01-10 01:26:00 · chineseheadlinenews.com · 来源: 远川研究所
上世纪五十年代,普通美国家庭每天看电视的时间“高达”6小时。显像管技术迎来黄金时代,但质疑声接踵而至。1950年波士顿大学的毕业典礼上,时任校长、禁酒令坚定支持者丹尼尔·马什对电视毫不留情地开炮[1]:
“如果电视热潮继续以目前的水平发展下去,我们注定会成为一个白痴国家。”
时过境迁,晶体管、集成电路、GPS、Unix架构等一个个塑造现代世界的创新接二连三的诞生于这个白痴国家,电视机普及衍生出的电视辩论成为了美国大选的标配环节,但“白痴论”的加害者名单却越印越长。
上世纪90年代,消费电子产业爆发式增长,电脑可用内存增加、图像影音表现力增强,电子游戏开始出现,随之而来是关于“技术有害”的担忧。廉价电脑生产商Commodore
64为此想了一条广告语:
当您可以买一台能为子女准备上大学的家用电脑时,为何会买一台令子女玩物丧志的游戏机呢?
每种新事物的面世,几乎都会经历误解-争议-培养的命运轮回,最终在漫长的博弈中,探索出一套行之有效的秩序规范。
二十世纪,从电视电脑到动画游戏,从未逃过大毒草的帽子,最新一位进场选手是算法。
人们面对新技术的艰深造物,难免会产生相似的恐惧。其中,短视频或更广义的内容领域,是算法引发种种争议的核心地带。
然而算法的内涵并非一个“猜你喜欢”的推荐黑盒,其学术定义是“以数学方式或者计算机代码表达的意见”,也就是说,它是一种处理信息的新生产力工具。
人类从未有过信息如此爆炸的时代。小到打车、找餐厅,大到股票交易、自动驾驶,每个人都在与信息产生互动。据IDC报告,全球每年产生的数据在2025年会增长到175ZB。
这是什么概念?以25MB/秒的下载速度计算,下载全人类一年产生的数据需要18亿年。
算法为人类提供一种与巨量信息相处的方式。作为一种应用工具,它早已深入社会生活的脉络肌理,形塑了一个远比下滑推荐更复杂、更广阔的世界。
一门技术的胜利
在人工智能这个细分产业里,“算法”是神经网络技术流派下的产物。
2012年,人工智能学者杰夫·辛顿双持英伟达GTX580勇闯ImageNet。他们研发的AlexNet算法模型,通过模拟人脑运转的方式训练电脑,以84%的识别准确率成功夺冠,一举推高了行业准确率,证明了神经网络在图像识别等复杂任务上的能力。
杰夫·辛顿和他的两名学生,他们在2012年被谷歌收入囊中
神经网络算得上最正宗、最原教旨的“算法”。辛顿团队的开创性在于,科技公司从中看到了人工智能产业化的愈发清晰的可能性。
算法决定了计算机识别事物的方式、并为具体的数据处理需求对应解决方案。算法的需要足够大的算力来驱动;而算法的优化也需要大规模高质量的数据,因此算法、算力和数据被称为人工智能三大基石,三者相辅相成。
就像汽车取代马车一样,算法介入大大小小的移动互联网产品,是一种必然趋势。
首先,低门槛的内容供给,必然带来信息分发的效率问题。
人类一脚踏入互联网时代后,内容供给的指数级提升。从博客、视频网站到之后的自媒体、短视频,互联网让信息生产的门槛不断降低,供给则迅速增加。
YouTube曾在2017年初披露过一组数据,早在2016年,YouTube用户每天观看视频的总时长就超过了10亿小时,是2012年收看时长的10倍。为了应对视频内容近乎膨胀的规模,YouTube开始编写算法,利用用户数据进行个性化推荐,从而提高推荐效率。
现代人每天接收到的信息量是1986年的5倍,相当于175份报纸[2],这种爆炸式的信息输入规模增长,使得“如何分发信息”成为了一门技术。
即便在互联网时代,中心化的媒介依然无法高效匹配信息的供需两端。无论是单纯的搜索,还是发布时间、视频时长等结构化的指标,都难以胜任精准推荐的诉求,算法在内容产业的应用由此而来。
在短视频普及前,今日头条已经是一个基于算法的产物,用以应对内容供给增加带来的信息分发效率问题。而这种以兴趣推荐为参照系的算法,又随着快手、抖音这类短视频平台的出现,随之得到应用。
2016年,“英国选手”AlphaGo在围棋比赛上战胜了李世石
其次,线上线下的融合趋势让算法成为了移动互联网时代的最优解。
以电商为代表,在打车、外卖、招聘等一个个场景线上化的过程中,Web时代的搜索逻辑在海量的信息面前同样捉襟见肘,以精准匹配为目标的技术方案完成了对诸多线上化场景的改造。电商平台的千人千面,OTA平台的精准推荐,几乎都离不开算法的参与。
除了在短视频中的应用,早年间关于“大数据杀熟”、“骑手困在系统里”等讨论,都可以溯源到算法在互联网产业的渗透。
也就是说,在人们熟知的AlphaGo大战李世石和GhatGPT出现前,算法就已经在各行各业落地生根,其定位类似于互联网产品的一种“通用技术接口”,在不同的场景中扮演着不同的角色。
当AGI的浪潮袭来,最先应用算法的互联网公司,也自然成为了前沿探索的桥头堡。
一个重要的前置产业
2017年,八位发量浓密的谷歌研究员经过长达数月的合作,发表了一篇名为《Attention Is All You
Need》的论文。论文中提出了一种名为“Transformer”的语言处理架构,成为生成式人工智能兴起的标志性事件。
时至今日,在大模型、自动驾驶、具身智能等人工智能的热门前沿分支,几乎都能找到Transformer划时代的身影。
正如iPhone的诞生要仰仗苹果在iPod上积累的无数经验和专利,Transformer架构的诞生并非孤立的事件,而是大量AI科学家在神经网络研究的基础上,不断推陈出新的成果。
科技领域的许多创新看似源于偶然,但在更长尺度的周期里,它们的诞生大多有迹可循。其中一个鲜明的共性是:下一个时代的推动者,大多是上一个时代的成功者。
2012年,在斯坦福教书的吴恩达以顾问的身份进入谷歌,主持“谷歌猫”图像识别项目研究。吴恩达之所以选择与Google合作,很大程度上是因为只有Google拥有算法训练所需要的数据和算力,而这又建立在Google庞大的数据规模和强大的盈利能力的基础上。
换句话说,Google在移动互联网和云计算产业取得的巨大成功,让他们有足够的动力投资下一个时代的前沿技术。这种动力的具体表现,就是“谷歌猫”项目动用的16000个CPU组成的算力,这是当时产业界能提供的最复杂的计算机系统。
吴恩达在谷歌设计了“谷歌猫”项目
虽然“谷歌猫”的地位远远不及后来的辛顿团队,但如果没有搜索和云计算业务源源不断的数据与现金流,Google也无力进行深度学习领域的前沿探索。
台积电的先进工艺依靠的不是“十万青年十万肝”的口号,而是高达55%的毛利率。同理,如果中国的互联网公司没有建立在算法上的成功业务,人工智能的发展也会止步不前。
2021年末训练GPT-4时OpenAI耗尽了网上所有可靠的英文文本资源,为此不惜偷偷到YouTube扒了超过一百万小时的视频语料;拥有如今最强开源大模型Llama的Meta,本身就是全球最大的社交媒体平台,手握天文数字的训练资源。
另一方面,互联网公司基于用户体验对推荐算法的迭代过程,在无形中为人工智能做了许多技术沉淀。
针对推荐算法延伸出的内容生产需求,2020年,抖音和今日头条上就已经出现了绘画特效类的AICG功能;之后字节推出豆包大模型,“全家桶”的每一块,都能对应上字节成熟的业务线;无独有偶,阿里的通义“文生图”模型能快速上线,离不开阿里在电商领域的长期积淀。
人工智能领域,中美之间的竞争甚嚣尘上,一个关键原因在于,只有中国和美国拥有全世界规模最大的互联网产业。
繁荣的互联网和消费电子产业带动了芯片设计、数据中心、云计算等一系列细分门类的建立,这些都是发展人工智能重要的基础设施。
大模型或许看上去比短视频更“高级”,但没有后者创造的商业模式反哺算法研发,前者其实无从谈起,两者在产业发展的路径中唇齿相依。
更重要的是,并非所有互联网公司都在参与前沿领域的探索和竞争,但他们都在为这些领域的探索者提供宝贵的人才储备。
高校可以筛选人才,但培养人才的只能是本土优势产业。
近年中国游戏产业快速发展,某种程度上得益于影视产业储备了大量特效人才;新能源车领域,传统车企也苦于留不下IT人才。如坐针毡的丰田甚至开始鼓励9000名员工“转码”,学习编程语言,转岗软件工程师。
马斯克与OpenAI的阿尔特曼,两人本身就是硅谷互联网创业者
云计算、自动驾驶、大模型等前沿技术领域开始繁荣,成长于互联网产业的工程师人才,恰好能成为前者的“预备役”。说直白一些,AI公司们拿到融资要大干一场,HR们还得从互联网公司招兵买马。
就像不能脱离电商谈直播带货一样,英伟达在AI时代大杀四方,是因为一大批游戏玩家给黄总报销过研发成本。事实上AI的进步,离不开互联网公司们优化信息分发、精准匹配的漫长积累。
罗马不是一天建成的,你不能只在开着辅助驾驶的时候才热爱算法。
一种被看见的价值
时至今日,自动驾驶仍然存在着一个暂时无法打败的敌人:Corner Case。
Corner
Case指发生概率极低的事件。最典型的场景莫过于前车突然爆装备,比如纸箱、水瓶或运猪车上跌落的二师兄。如果没有提前的预案,自动驾驶状态下的汽车很有可能直接撞上去。
然而,无穷无尽的Corner
Case并不代表自动驾驶是一项不值得研究的技术,它与今天处于舆论风口上狭义的“算法”其实处境类似。
2015年后,移动互联网产业的发展进入井喷期,“家人老铁”在千元智能机面前迅速集结,网红在真实的个体下沉叙事中反客为主,关于算法的种种讨论与争议由此产生。
算法是一个无比年轻的技术分支,从技术到规范,处处是亟待填补的拼图。但从更长的时间周期看,新技术如电视电脑和自动驾驶,往往是在争议之后创造了更大的价值。
推荐算法也是一样,在它出现前,一个人能看到的世界是非常狭窄的。人与人之间的最大公约数,要么是近在咫尺的学历阶层,要么是遥远的新闻站队。
于是南方小孩很难想象东北人如何猫冬;县城父母很难知道清华北大的课堂是什么样子;城市白领很难意识到千里之外,有人在过日落而息的生活;一些宝藏小店、传统手艺或者小众旅游美景,只能活在限定区域的口耳相传中。
正是因为推荐算法把信息与人高效连接在一起,才让更多人有了“被看见”、“被讨论”的机会。
今年年初,“开封王婆”频频登上各大平台热搜。“王婆”本名赵梅,是河南开封万岁山武侠城的一位演员,负责主持一档名为“王婆说媒”的表演项目,展现大宋开封市井文化。
不料她口才极佳的“说媒”,被一众无心插柳的短视频博主发到网上,在网友的口碑效应下迅速走红。不仅让万岁山武侠城客流迎来爆发,还让短视频评论区变成了全国年轻人的大型相亲现场。
类似的故事在时时刻刻发生:2023年9月,一条名为“探访‘三花’剧团开放式化妆间”的短视频在网络上流传,让这个名不见经传的剧团由此火爆全网,吸引了大批网友观戏。
短短三个月,“三花”川剧团通过网络平台卖出2.5万张票,几乎是过去两年多的总和,如今剧团演出场场爆满,老川剧团迎来了新生。
无论是开封的“王婆说媒”还是四川的三花剧团,即便口才再好、技艺再高,在推荐算法诞生前,想红遍大江南北都不容易。当推荐算法将这些鲜活的表演快速匹配全国乃至全世界的观众,他们就产生了前所未有的影响力——某种程度上看,智能推荐反而让内容展现出更加多元和多彩的一面。
当单向、中心化的媒介变成了双向、去中心化的媒介,内容生产和分发的门槛被大幅降低,由此还带来了一个巨大的改变:一个人的才智和技能,可以轻而易举的创造价值。
不管是讲物理学、欧洲古代史,还是探店、卖货、做手工,每个拥有一技之长的人都有自己独特的价值。在上一个互联网时代,他们被信息洪流埋没。但在推荐算法的帮助下,越来越多的人被真正看见,他们不再依赖土地、设备、工厂这些经典的“生产资料”,通过一部手机就可以将自己的才能快速变现。
四川95后小伙王光强曾亲历汶川地震,2017年九寨沟发生7.0级地震,农产品运输受阻,许多水果滞销,这让他决心做一些事。
毕业后,王光强顶着家人的不理解回到故乡,在抖音注册了账号“阿坝小王子”,为家乡的樱桃、杏子、李子等农产品带货找销路。返乡创业近五年后,“阿坝小王子”已经成为当地农村致富的一名带头人。
王光强(左二)与果农
2024年7月,网络主播正式进入国家职业分类,主播们有了新职业身份。正因为推荐算法让普通人“被看见”成为可能,才创造了全新的就业岗位。
作为一种技术工具,算法在不当使用时的确会产生负面作用。许多人不满当前的信息环境,但在这个线上线下无限融合的现代社会中,其实很难简单区分哪些问题是媒介造成、哪些问题是社会造成。
算法打破了过去的社交同温层,让人们意识到不止有同温层的观点,世界上还有另一群人可能有不一样的观点。如果认为不使用推荐算法,这个社会就不会产生问题,其实是一种过于简化的思路。
“有害的可能”不应该成为阻碍技术进步的理由,合理的探索、有效的干预防范是被历史无数次验证过的有效路径。
让汽车更安全的思路不是限制发动机的功率,而是提醒驾驶员,无论如何都要系紧安全带。