国产AI舞台,站满了“90后天才”

2024-12-31 16:25:06 · chineseheadlinenews.com · 来源: 创投日报

DeepSeek已无法再低调。就在DeepSeek在X平台被海外AI技术大牛发帖背书后,小米的一则挖角消息迅速在中文互联网刷屏。

据悉,为发力大模型,小米创始人雷军以千万年薪招揽DeepSeek开源大模型DeepSeek-V2的关键开发者之一罗福莉,领导小米AI大模型团队。

公开资料显示,罗福莉硕士毕业于北京大学计算语言学研究所。此后她加入了阿里达摩院机器智能实验室,期间主导开发了多语言预训练模型VECO以及AliceMind的开源工作。2022年,罗福莉从阿里离开,进入DeepSeek担任深度学习研究员,参与了MoE大模型DeepSeek-V2的开发。

而早在2019年,罗福莉就已经在社交网络小范围“出圈”。彼时还在读研的她,在人工智能领域顶级国际会议ACL上发表8篇论文(其中2篇一作),登上了知乎热搜。罗福莉本人在知乎进行了回应。“95后AI天才少女”开始成为罗福莉的标签。

可以看到,“90后AI天才”,已经逐渐成为这轮AI 2.0发展的中坚力量。

估值超70亿元的人形机器人独角兽智元机器人,其创始人之一、“华为天才少年”彭志辉,为1993年生人。AI药物研发企业深势科技,其创始人兼CEO孙伟杰与创始人兼首席科学家张林峰,均为北大培元学院的90后毕业生。一度被业内认为国内最有希望在大模型赛道实现弯道超车的3D大模型领域,明星企业之一Vast ,其创始人宋亚宸,是一名创业前就已经有商汤和MiniMax工作经历的“97后”。

1“天才”的“逆袭”

雷军、DeepSeek以及“95后AI天才少女”等多个近期热点的叠加,让罗福莉加入小米AI实验室的消息迅速传遍了中文互联网。

创投日报记者联系了小米方面,以对网传的罗福莉入职消息进行确认,但截至发稿并未获回复。

有关自己的成长经历,罗福莉在个人公众号上曾做过分享。和“天才”的标签有所不同,罗福莉坦言,自己刚考入北师大时,有些“迷惘不知所向,期末排名也是靠后”;大二才振作起来专注于学习,成绩终于爬到了前几;大三为保研到更好的学校,“‘随大流’开启学术生涯,但却收到‘你没有天赋’做科研的打击”;大四开始掉头逃离学术,“曾一度考虑转行做产品”。

转折点出现在保研北大后。罗福莉自述,研一开始“正面硬刚学术”,陆续投出了人生第一二篇文章;研二迎来“黎明前的黑暗”,潜心学术研究,终于在这一年收获了8篇顶会文章,收获“天才AI美少女”标签,开始小范围“出圈”。

研究生毕业后,罗福莉并未选择继续学术深造,而是参加校招进入产业界。她表示,自己基本拿下了国内各个大厂最Top的硕士offer,包括阿里星、腾讯技术大咖、百度AIDU计划等。最终她选择加入阿里达摩院做人工智能研究,具体做预训练语言模型相关的研究。

在个人公众号,罗福莉还分享过如何offer大满贯的经验;对于最终选择进入哪家大厂,她也给出了筛选建议。

她称,国内大部分AI部门或者研究部门都不能做到所谓“业务”和“研究”的一个权衡,其中绝大部分情况下只能兼顾其中一个,或者只能做业务(大概率是非核心业务),或者是跟高校差距不大的研究。所以这时候,筛选出那些真正可以做到把“研究”和“业务”均衡的AI部门和团队就非常关键。

罗福莉的公众号更新记录停留在2021年11月。在不久后的2022年,她从阿里离开,加入了幻方量化。

幻方量化是一家私募,但有别于一般的私募投资机构,幻方的投资决策依托的是数学与人工智能。在储备算力方面,幻方甚至走得比国内大厂更早。根据幻方官网,2019年,幻方 AI(幻方人工智能基础研究有限公司)注册成立,致力于 AI 的算法与基础应用研究。AI 软硬件研发团队自研幻方“萤火一号”AI 集群,搭载了 500 块显卡。到2021年,幻方已经储备了1万张卡。

DeepSeek的出现,还是2023年5月的事情。根据公开资料,这是幻方下场做大模型而成立的独立新组织,专注于做真正人类级别的人工智能。以罗福莉在择业中重视的“业务”和”研究”维度来看,DeepSeek以及其所脱胎于的幻方,更侧重的,是研究。

幻方创始人梁文锋在2023年5月接受媒体采访时明确表示,“我们的目标很明确,就是不做垂类和应用,而是做研究,做探索。”

创投日报记者注意到,罗福莉的谷歌学术页面显示,其论文被引次数在2023年以后显著增加,2024年其论文被引次数更是超过了1000次。目前,罗福莉被引次数最高的一篇论文,就与DeepSeek相关。

这篇论文题为《DeepSeek-Coder:当大型语言模型遇上编程----代码智能的崛起》,摘要称,大型语言模型的快速发展革新了软件开发中的代码智能。然而,封闭源码模型的主导地位限制了广泛的研究和开发。为了解决这一问题,团队推出了 DeepSeek-Coder 系列,这是一组开源的代码模型,规模从 13 亿到 330 亿不等,基于 2 万亿标记从零开始训练。团队广泛评估表明,DeepSeek-Coder不仅在多个基准测试中实现了开源代码模型的最先进性能,还超越了现有的封闭源码模型,如 Codex 和 GPT-3.5。此外,DeepSeek-Coder 模型采用宽松的许可证,允许用于研究和无限制的商业用途。

这篇论文共有包括罗福莉在内的13名作者,截至目前,该论文被引次数达396次。

今年5月,罗福莉曾在知乎发表对DeepSeek团队的评价:DeepSeek团队的每一个人都非常优秀,DeepSeek-V2是群体智慧的结晶,创始人也是我坚信的国内最适合技术驱动型创业的。

2 国产AI站满“90后天才”

可以看到,被认为有希望颠覆未来的AI 2.0,目前已经成为了“90后天才”们施展拳脚的大舞台。

最早以“天才少年”身份被看见的,是彭志辉。

彭志辉最早“出圈”也是因为他在社交网络的KOL形象,他在B站上的账号“稚晖君”,主要发布硬核DIY视频,目前已收获超百万粉丝。而他在创业前,更广为认知的另一个身份是“华为天才少年”。2020年,彭志辉从OPPO研究院AI实验室离开,加入“华为天才少年计划”,从事昇腾AI芯片和AI算法相关研究工作。2022年12月27日,彭志辉在微博发文称已离开华为。随后,在2023年2月,其作为创始人之一的智元机器人成立。

智元机器人致力于打造具身智能机器人产品及应用生态,目前,公司已正式开启通用机器人量产。

人形机器人被认为是AI落地物理世界的最佳载体,当前发展迅猛,吸引了各路技术大咖躬身入局。业内备受关注的另一头部企业宇树科技,其创始人王兴兴也是一名90后。

履历显示,出生于1990年的王兴兴,本科毕业于浙江理工大学。从学历背景,王兴兴并不算典型的学霸,而据媒体报道,其初高中成绩并不理想,偏科尤其严重,理科很好,英语很差。不过,和彭志辉相似,王兴兴也擅长发明创造。读研期间,其还曾申请延毕,只为专注设计机器狗“XDog”。业内认为,宇树科技是目前较为成熟的一家具身智能企业。其于近期更新的Unitree B2-W工业级四足机械狗视频,引爆了二级市场,包括长盛轴承、景兴纸业等多只个股一度涨停。

AI落地带来的广阔机遇,还在不断吸引“90后天才”们施展天赋和努力。

专注于AI在医疗领域应用的深势科技。在这轮清华系跑出了更多创业团队的AI 2.0竞逐中,深势科技则是由两位来自于北大的创始人成立。公开资料显示,两名创始人孙伟杰与张林峰均毕业于北京大学元培学院。本科毕业后,孙伟杰留在北大继续深造教育经济与管理学,此后作为天使投资人活跃在科技、教育、企业服务等领域。而张林峰则前往美国普林斯顿大学攻读博士,研究统计物理、分子模拟和机器学习,并在多个领域的工业应用深耕。

公开资料显示,目前,深势科技推出了Bohrium?微尺度科学计算云平台、Hermite?药物计算设计平台等微尺度工业设计基础设施,革新了现有的药物、材料领域研发模式。

而曾被业内认为是国内最有望在大模型领域实现弯道超车的3D大模型领域,跑出的标杆企业之一Vast,其创始人宋亚宸,是一名“97后”。媒体报道显示,宋亚宸本科就读于约翰霍普金斯大学,还没毕业他就加入了商汤,进入AI游戏事业部,也是在这里他开始接触3D领域。2021年,商汤AI游戏事业部的兼任负责人闫俊杰离职创业MiniMax,宋亚宸也随之加入MiniMax。

紧接着在2022年底,宋亚宸就创办了3D大模型公司Vast。

此前有头部机构的AI领域投资人对创投日报记者表示,多模态中的3D生成有较大可能在国内出机会。“3D AI现在国内技术不落后海外,也不是特别吃算力。在这个阶段算国内比较值得关注的细分领域。”

在业务方面,据宋亚宸在一场公开演讲中介绍,Vast的3D大模型Tripo,输入一段文字或图片、视频等不同模态,就可以生成3D模型。它的表达方式是mesh,带贴图材质PBR,可以在游戏、动画、元宇宙、XR、MR,包括数字孪生、仿真模拟等行业进行使用。目前,Tripo2.0已上线,据悉其成熟度已达到类似于720p分辨率的水平。

值得一提的是,这些AI领域的“90后天才”们,都受到了资本的青睐,他们创业的公司,目前都已经收获了多轮融资,多家头部资本出手押注。比如,上述智元机器人,在成立不到两年时间里,就已经成为估值超过70亿元的独角兽,背后投资机构包括高瓴创投、BV百度风投、经纬创投、蓝驰创投、比亚迪、红杉中国、尚颀资本以及上海临港新片区基金等,股东阵容相当豪华。

宇树科技从2016年发展到今天,也已经完成9轮融资,集结了红杉中国、顺为资本、深创投以及中国互联网投资基金以及美团龙珠等系列知名资方。

2018年成立的深势科技,截至目前已完成6轮融资,吸引了来自BV百度风投、高瓴创投、经纬创投、启明创投、哈勃投资等的出手。Vast亦已完成两轮融资,春华资本、达晨财智、英诺天使基金以及达晨财智皆为背后投资人。

从资本到产业对人才的大手笔抢先押注现状来看,有关AI的比拼,无疑不止算力,而更在于人才。


    24小时新闻排行榜更多>>
  1. 川普30岁小女手捧孕肚“回娘家”,风格像梅拉尼娅
  2. 约翰逊最后“翻转”反对票 获连任
  3. A股三连跌,原因找到了!今日盘面透露出啥信号
  4. 英首相带妻儿度假遭遇当面斥责与嘘声:你插队了
  5. 川普任命曾和自己作对的"她"为中东和平事务副特使
  6. 世界华人数学家大会永久落户上海
  7. 上海一建筑坍塌致酒店客人被困
  8. 马斯克,遥遥领先
  9. 宣称能治癌症的中医诊所:一场精心策划的合谋
  10. 尹锡悦“逃脱”首次逮捕,韩公调处为何不敢硬闯
  11. 川普酒店爆炸案嫌疑人曾在乌克兰服役 是资深特工
  12. 仓促放人,他们丢尽了「远洋捕捞」的脸!
  13. 饿一饿能抗老,背后的原因找到了
  14. 上海258元一份蛋炒饭引热议 商家:卖得很好
  15. 千万公务员大规模加薪 能否拯救中国经济?
  16. 文学杂志纷纷停刊,这位主编却说“我们还在继续”
  17. 新年伊始的美国,三个不祥之兆,太多未解之谜
  18. 纽时:局势紧张,中美关系不再拥有“小院高墙”
  19. 中国篮协官宣 17岁美籍华裔后卫注册入籍成功
  20. 中国对巴拿马运河的渗透为何令美国担忧?
  21. 清华大学:我校毕业生当前在国内的比例约91.7%
  22. 乌军与俄军肉搏战,俄军装死
  23. 新奥尔良血案凶嫌留短片 本欲藉团聚之机杀全家
  24. 俄罗斯大使发言:德日两国永远不能“入常”
  25. “猫女”去世前被发逮捕令 230亿挥霍光还欠债
  26. 郊狼咬伤伦顿5岁男孩,险些将其拖走
  27. 人民币苦守7.3十天后破防 跌至一年来新低
  28. 什么仇什么怨?董明珠为什么抓着小米不放?
  29. 摄影师抓拍下这样一幕:克林顿与莱温斯基
  30. 川普晒出百亿浏览量数据:我为啥要放弃TikTok
  31. USNews新排名上升的美国大学
  32. 当美本招生官对你说大实话
  33. 再曝非正常死亡,“指居”制度何去何从?
  34. 中国春节机票价格降幅近七成 但火车票一票难求
  35. 专家对韩空难提出新质疑:机上或有更险恶的东西
  36. 中国官员落马 突现“自行脱党”新罪名
  37. 干细胞治疗历史性开端:中国首款干细胞药物上市
  38. 清华女硕士失业后转行学厨引热议 当事人回应
  39. 美防长上诉失败 法庭准911主谋保留认罪协议
  40. 美国驻华大使官微评论区转风向 “义和团”退场
  41. 美国朝野一致抗中 QUAD在川普执政后依然重要
  42. 超市被员工偷到倒闭:1700元商品被收银员“1元购”
  43. 陆媒:C919最早今年获欧洲认证 超波音是迟早的
  44. 首次逮捕失败 还有两天 尹锡悦能否挺过这一关?
  45. 追求长春不老 美国妈想要“年轻细胞” 让儿捐血
  46. 俄“神秘专机”抵美 高层会谈?俄外交部回应
  47. 新年驾车撞人惨案后,中国网络流行荒唐阴谋论
  48. 当中美关系不再拥有“小院高墙”
  49. 英前副相克莱格辞Meta全球事务总裁 共和党人接棒
  50. 泽连斯基:川普的强势与无常可助结束俄乌战争
  51. Siri对用户录音并外泄 苹果砸近亿美元和解
  52. 泰总理贝东塔身家资产曝光
  53. 2025中国商业航太进入爆发期 可回收火箭?
  54. 给川普使绊子 拜登欲颁永久性海上能源开发禁令
  55. 19%统一关税 墨西哥针对中国电商出台新关税政策
  56. 中国企业年终奖 互联网与传统行业“冰火两重天”
  57. 美新一届国会开幕 图恩上任参院多数党领袖
  58. 南加惊传飞机失事 爆炸起火致2死19伤
  59. 被讽刺蹭热度 谷爱凌发声:像往心里插刀子
  60. 中国政治审查门槛提升 留学生“选调”公职受限?