疯狂追赶OpenAI的2年,谷歌都做了什么?
2025-03-30 04:25:26 · chineseheadlinenews.com · 来源: 不懂经
AGI的这两年,基本OpenAI压着谷歌打的两年,包括但不限于谷歌自己的失误、每次发布会的被截胡。比如这次Gemini 2.5 Pro 被 4o图片生成功能抢走了几乎所有关注点。
但谷歌确实也在一直追赶,从最开始的措手不及,到现在已经开始有来有往。著名科技杂志《连线》采访了谷歌前和现员工超50人,发布了一篇长文,深度挖掘了谷歌这两年苦苦追赶Openai的内幕故事。
01
8万人参与了Bard的内部测试
新模型和功能发布得太快,审查人员根本跟不上,尽避他们周末和晚上都在加班。当有人提出推迟 Bard 发布的警告时,他们的意见被否决了。(在给《连线》杂志的评论中,谷歌代表表示:“没有任何在批准或阻止发布方面发挥作用的团队建议不要发布。”他们还说,“公司内部的多个团队负责测试和审查生成式人工智能产品”,“没有任何一个团队单独负责”。)
02
仓促发布,一个错误让股价下跌9%
03
两个AI部门合并,Gemini 首战告捷
04
图片生成功能又惹了新麻烦
马斯克的帖子引发了数十位谷歌领导人之间的讨论。副总裁和董事们飞往伦敦与 Hassabis 会面。最终,Hassabis 的团队(Gemini 模型)和 Hsiao 的团队(Gemini 应用)都获得了雇用专家以避免类似失误的许可,并增加了 15 个信任和安全相关的职位。
回到 Gradient Canopy,Hsiao 确保负责图像生成器的团队有充足的时间来纠正这个问题。在 Manyika 的帮助下,其他员工为 Gemini 制定了一套公开原则,所有这些原则都围绕着“你”——也就是用户。根据这些原则,Gemini 应该“遵循你的指示”、“适应你的需求”和“保障你的体验”。一个重要的观点是强调“回应不一定反映谷歌的观点或看法”。“Gemini 的输出主要基于你要求它做什么——Gemini 就是你让它成为的样子。”这很好地掩盖了未来可能出现的任何失误。但是,谷歌可能会采取什么措施来让自己对这些原则负责,这一点并没有明确说明。
05
疯狂上线新功能
随着 AI Overviews 的推出,人们收到了一些奇怪的结果。搜索“我应该吃多少块石头”会得到这样的答案:“根据加州大学伯克利分校地质学家的说法,建议每天至少吃一块小石头。”在另一个疯传的查询中,用户搜索“奶酪不粘在披萨上”,并得到了这个有用的提示:“在酱汁中加入约 1/8 杯无毒胶水,以增加其粘性。”这些失误都有简单的解释。例如,披萨胶水起源于 Reddit 上的一篇玩笑帖子。但 AI Overviews 却将这些信息呈现为事实。谷歌暂时减少了显示 AI Overviews 的次数,以便重新校准。
谷歌负责搜索的首席科学家、在该公司工作了 20 年的资深员工潘杜·纳亚克表示,并非所有问题都能在发布前被发现,这很不幸,但并不令人震惊。大多数情况下,AI Overviews 表现出色。用户只是不太关注成功。“他们只会抱怨,”纳亚克说,并补充说他欢迎反馈。“我们致力于不断改进,因为保证不出问题是不可能的。”
那些警告过准确性问题并呼吁放慢速度的员工对此尤其感到恼火。在他们看来,从 Bard 到 Gemini,再到图像生成器,以及现在的 AI Overviews,谷歌推出了一系列“编造机器”。对他们来说,这家以扩大信息获取为核心的公司,似乎比以往任何时候都更容易让人接受无稽之谈。
然而,搜索团队认为用户普遍喜欢 AI Overviews 提供的“拐杖”。它们全面回归,用户没有选择关闭它们。很快,人工智能摘要就出现在了曾经被禁止使用的工具中:谷歌地图获得了一项功能,该功能使用 Gemini 来分析对商家的评论。谷歌为其 Pixel 手机推出的新天气应用获得了一份人工智能撰写的预报报告。在发布之前,一位工程师询问用户是否真的需要这项功能:难道现有的、传达相同信息的图形还不够吗?相关的高级主管下令进行了一些测试,最终用户反馈胜出:90% 的参与者对摘要表示“赞”。
06
每周工作60小时,是赢得AI竞赛的最佳时间
去年 12 月,在 ChatGPT 带来的冲击和突破两年后,杰夫·迪恩在 Gradient Canopy 接受了我们的采访。他心情很好。就在几周前,Gemini 模型在一个公共排行榜上名列榜首。
英伟达首席执行官黄仁勋最近在一次财报电话会议上称赞了 NotebookLM 的 Audio Overviews,称他“充分利用了它”。几位著名的科学家也回到了谷歌,他们之前逃离了过于谨慎的谷歌——包括最初的八位 Transformer 发明者之一诺姆·沙泽尔,他在不到三年前离开了,部分原因是该公司不愿向公众发布 LaMDA。
当 Dean 坐到沙发上时,他承认谷歌当时判断失误。他很高兴公司克服了对“幻觉”等风险的厌恶——但新的挑战正在等待着。在谷歌拥有超过 20 亿月活跃用户的七项服务中(包括 Chrome、Gmail 和 YouTube),所有这些服务都已开始提供基于 Gemini 的功能。
Dean 说,他和另一位同事以及 Shazeer(他们共同领导模型的开发)必须平衡优先级,因为公司各地的团队都要求提供特定的功能:流利的日语翻译、更好的编码技能、改进视频分析以帮助 Astra 识别世界上的景象。他和 Shazeer 开始在 Gradient Canopy 的一个微型厨房里会面,在咖啡研磨机的喧嚣声中交流想法。
Shazeer 说,他对谷歌将重点扩大到包括帮助用户创建新的人工智能生成内容感到兴奋。“组织信息显然是一个万亿美元的机会,但一万亿美元已经不酷了,”他最近在一个播客中说。“酷的是一千万亿美元。”投资者可能也有同样的想法。
Alphabet 的股价几乎是从 ChatGPT 首次亮相后几天的低点翻了一番。最近开始负责 Hsiao 的 Gemini 应用团队的 Hassabis 坚称,公司的复兴才刚刚开始,利用人工智能治愈疾病等不可思议的飞跃并不遥远。“我认为,我们拥有所有组织中最广泛、最深入的研究基础,”Hassabis 告诉《连线》。
但是,对谷歌来说,只有当更多堆积如山、引人入胜的研究能产生最重要的产出——利润时,它们才有用。大多数客户通常还不愿意直接为人工智能功能付费,因此该公司可能正在寻求在 Gemini 应用中销售广告。当然,这是谷歌的经典策略,很久以前就传播到了硅谷的其他地方:把你的数据、时间和注意力交给我们,在我们的服务条款上打勾、免除我们的责任,我们就不会为我们打造的这个炫酷工具向你收取一分钱。
目前,根据 Sensor Tower 的数据,OpenAI 的 ChatGPT 应用的全球历史总安装量估计为 6 亿次,而谷歌的 Gemini 应用的安装量为 1.4 亿次,相形见绌。而且,在这场人工智能竞赛中,还有很多其他的聊天机器人——Claude、Copilot、Grok、DeepSeek、Llama、Perplexity——其中许多都得到了谷歌最大、资金最雄厚的竞争对手(或者,在 Claude 的例子中,是谷歌自己)的支持。
整个行业,不仅仅是谷歌,都在努力解决一个事实:生成式人工智能系统需要数十亿美元的投资(到目前为止尚未收回),以及巨大的能源消耗,足以延长数十年历史的燃煤电厂和核反应堆的寿命。公司坚称,效率每天都在提高。他们还希望将错误率降低到足以赢得更多用户的程度。但没有人真正弄清楚如何产生可靠的回报或保护气候。
谷歌还面临着其竞争对手没有面临的一个挑战:根据摩根大通分析师道格·安穆斯的说法,在未来几年内,高达四分之一的搜索广告收入可能会因反垄断判决而损失。为公司补充资金的必要性,对公司里的每个人来说都不容忽视。Hsiao 的一些 Gemini 员工已经连续三年在冬季假期工作以跟上进度。
据报道,谷歌联合创始人布林上个月告诉一些员工,每周工作 60 小时是赢得日益激烈的人工智能竞赛的生产力“最佳点”。对更多裁员、更多倦怠和更多法律麻烦的担忧,在接受《连线》采访的现任和前任员工中深深扎根。
一位谷歌研究员和一位高级同事表示,普遍的感觉是不安。生成式人工智能显然是有帮助的。即使是倾向于监管大型科技公司的政府,例如法国,也开始接受这项技术的美好承诺。在 Google DeepMind 内部和公开演讲中,Hassabis 从未放弃过他创造通用人工智能(AGI,一种能够在各种任务中实现人类水平认知能力的系统)的目标。他偶尔会在周末带着他的 Astra 原型在伦敦四处走动,体验未来,在那个未来,整个物理世界,从那边的泰晤士河鸭子到这边的乔治亚风格庄园,都是可以搜索的。但是 AGI 将要求系统在推理、计划和负责方面做得更好。
今年 1 月,OpenAI 朝着那个未来迈出了一步,让公众参与了另一项实验:其期待已久的 Operator 服务,这是一种所谓的“agentic AI”,其行为可以远远超出聊天机器人窗口。Operator 可以像人一样在网站上点击和打字,以执行预订旅行或填写表格等琐事。
目前,它执行这些任务的速度比人类慢得多,也谨慎得多,而且由于其不可靠性,成本很高(作为每月 200 美元计划的一部分提供)。当然,谷歌也在努力将代理功能引入其即将推出的模型中。当前的 Gemini 可以帮助你制定膳食计划,下一个版本会将你的食材放入在线购物车。也许再下一个版本会给你关于切洋葱技巧的实时反馈。
与往常一样,快速行动可能意味着经常失误。1 月下旬,在超级碗之前,谷歌发布了一则广告,其中 Gemini 犯了一个比 Bard 的望远镜错误更可笑的错误:它估计地球上消耗的所有奶酪中有一半或更多是高达奶酪。
随着 Gemini 从一个有时可信的事实机器发展成为人类生活的亲密部分——生活教练、无所不知的助手——皮查伊说,谷歌正在谨慎行事。不过,最终回到了榜首,皮查伊和其他谷歌高管可能再也不想被甩在后面了。
比赛还在继续。