九游·体育(NineGameSports)官方网站-数智体育价值引领者

IlyaSutskever——AI最伟大的“推动者”也是其最深刻的“对峙者”-九游·体育科技集团
i1pcban.jpg i1pcban.jpg

新闻九游

IlyaSutskever——AI最伟大的“推动者”也是其最深刻的“对峙者”

2025-12-10 

分享到

  Ilya Sutskever —— AI最伟大的“推动者”,也是其最深刻的“对峙者”

IlyaSutskever——AI最伟大的“推动者”也是其最深刻的“对峙者”(图1)

  并且,在2024年的NeurIPS 会议演讲中,他就提出了类似的结论:预训练依赖于海量数据,而互联网数据存在上限,预训练时代终将结束。

IlyaSutskever——AI最伟大的“推动者”也是其最深刻的“对峙者”(图2)

  这一预判之所以极具分量,并引发业界广泛深思和讨论,是因为Ilya Sutskever 恰恰是在十几年前就一直坚信“Scaling Law”定律,并在后来亲自在GPT-3模型上成功证明给世界看的那个男人。

  甚至可以说,Ilya Sutskever已经将“Scaling Law”变成了业界的一种思维范式,并被许多人奉为圭臬。然而,正是这位“Scaling Law”最有力的证明者,如今开始洞察到它的局限性并提出了新的思考。

  然而,这一深刻的洞察和预判,并非Ilya Sutskever立场的动摇,实则是其思维特质的必然体现:他始终依循一套深刻的“自上而下”的信念体系来推演技术未来。

  Ilya Sutskever信念体系的核心是追求对“智能本质”的正确理解,而非盲从任何具体技术。他早期对Scaling Law的坚信,源于他认为“扩大规模”是触及智能本质的正确方向。

  当Scaling Law发展到极致,他观察到模型出现了无法用“扩大规模”来解决的根本性矛盾:卓越的基准测试表现与脆弱的真实世界泛化能力之间的巨大脱节。这背离了他对“真正智能”的理解。

  此时,Ilya Sutskever“自上而下”的思维特质开始发挥作用。他不会为了维护旧有路径而忽视根本矛盾,而是根据更高层级的信念(“何为真正的智能”)来重新评估当前路径。这促使他转向寻求新的、更接近智能本质的研究范式。故而,最近他又得出新结论:单纯依赖扩大规模的Scaling Law路径正在触及天花板,而与之结合的主流强化学习方法不仅算力消耗巨大,更在实现真正的智能泛化上存在本质缺陷。

  Ilya Sutskever被广泛视为一位拥有罕见“研究者品位”的纯粹科学家,兼具卓越的工程直觉与深刻的哲学思维方式。正如其导师杰弗里辛顿(Geoffrey Hinton)所评价,他拥有“惊人的原始直觉”,且从不轻信,总是致力于将新信息融入自身坚实的世界观框架中。

  这种深刻的顶级赞誉,不禁让人对Ilya Sutskever 产生了浓厚兴趣。接下来,我们将追溯他的成长与求索之路,以期更深入地理解这位始终能够站在AI技术浪潮之巅,凝视着更远未来的思想者。

  一、 学术深耕(2003-2013):叩开AI大门,拜师 深度学习教父 辛顿

  Ilya Sutskever1986年12月出生于俄罗斯下诺夫哥罗德(原前苏联的高尔基市),5岁随家人移民以色列,16岁迁居到加拿大,并在多伦多大学开启求学之路。

  他先后获多伦多大学数学学士(2005 年)、计算机科学硕士(2007年)及博士学位(2013)。在多伦多大学的求学之路,为Ilya Sutskever未来在AI领域的深耕奠定了坚实基石。

  而这段学术生涯中,最具转折意义的,是他与深度学习之父 杰弗里辛顿的相遇。据说,早在 2003 年,还是本科低年级学生的Ilya Sutskever,因对神经网络的痴迷,鼓起勇气主动敲响了辛顿办公室的大门。这份纯粹的求知欲与初生牛犊的勇气,打动了这位学术泰斗,两人自此开启了深度合作的师徒情谊。

  学生时期的Ilya Sutskever,其最具标志性的成果莫过于点燃了深度学习革命的AlexNet。

  2012年,仍在杰弗里辛顿教授指导下攻读博士学位的Ilya Sutskever与同门师兄弟Alex Krizhevsky(亚历克斯克里热夫斯基)合作,在辛顿教授的整体指导下,共同开发了划时代的深度卷积神经网络AlexNet。

  Alex Krizhevsky是网络架构的主要设计者与实现者。而Ilya Sutskever的核心贡献在于工程实现,他编写了高度优化的GPU代码,并亲自采购和搭建了由多块GTX 580 GPU组成的计算系统,为训练庞大的AlexNet提供了至关重要的算力基础。

  最终,AlexNet在2012年ImageNet图像识别竞赛中以压倒性优势夺冠,其成绩远超传统方法。这一胜利被公认为深度学习革命的起点,彻底扭转了学界对神经网络的怀疑态度,并开启了人工智能的新时代。

  2012年底,在AlexNet取得突破性成功之后,杰弗里辛顿教授与他的两位研究生Ilya Sutskever和Alex Krizhevsky共同创立了DNNResearch公司。成立之初,这家公司既无实际产品,也没有生产计划,其核心资产正是这三位深度学习先驱的顶尖才智与专有技术。

  为最大化公司价值,杰弗里辛顿为其创办的公司开展了一场小型竞价交易。该活动迅速吸引了当时对AI前沿最为敏锐的四方力量:谷歌、微软、百度,以及当时尚未被谷歌收购的明星初创公司DeepMind。

  最终,谷歌在2013年3月以约4400万美元的价格胜出,完成了对DNNResearch的收购。此举被广泛视为一场经典的“人才收购”。

  通过此次收购,谷歌获得了该团队在深度学习领域的专有技术。同时,辛顿教授以顾问身份为谷歌提供指导,而Ilya Sutskever和 Alex Krizhevsky则作为全职员工加入。其中,Ilya Sutskever被任命为谷歌大脑(Google Brain)团队的研究科学家。

  在Google Brain期间,Ilya Sutskever分别主导和深度参与了两项影响深远的重大项目:一项革新了自然语言处理的核心框架,另一项则为整个AI社区奠定了工程基础。

  在Seq2Seq出现之前,神经网络处理像翻译这九游体育科技样的任务非常棘手,因为模型要求输入和输出必须是固定长度。2014年,Ilya Sutskever与Oriol Vinyals(奥里奥尔维尼亚尔斯)和Quoc Viet Le合作开发了序列对序列(Seq2Seq)学习算法。

  该算法的核心创新在于其编码器-解码器架构:编码器神经网络将任意长度的输入序列压缩成一个固定维度的上下文向量(语义摘要);解码器则以该向量为初始状态,结合每一步已生成的内容,自回归地逐词生成目标序列,从而首次实现了端到端的变长序列转换。

  Seq2Seq摆脱了传统方法对 “固定长度输入/输出” 的限制,并通过 “隐藏状态” 传递输入序列的语义信息,为后续神经模型处理复杂序列任务提供了核心框架。

  TensorFlow是Google Brain团队于2015年推出的开源机器学习框架。TensorFlow的推出,将强大的机器学习能力变成了易用的工具。它让全球的研究者和工程师能更轻松地构建、训练和部署包括Seq2Seq在内的复杂模型,极大地加速了AI技术的民主化和工业化进程。

  GPT-1(2018年):是GPT系列乃至生成式预训练语言模型的奠基之作。它首创了 “无监督预训练 + 有监督任务微调” 的两阶段范式:首先在海量无标注文本上通过预测下一个词进行预训练,掌握通用语言规律;然后针对不同的下游任务(如文本分类、问答等)使用少量标注数据进行微调。这一范式使单一模型在多项自然语言理解任务上取得了突破性进展,为后续发展奠定了核心方法论基础。

  GPT-2(2019年):作为GPT-1的突破性迭代,其参数规模提升至15亿(1.5B),并使用了更大的WebText数据集进行训练。它首次通过大规模实验证明:仅通过“预测下一个词”训练的语言模型,无需微调就能在零样本下执行翻译、问答等多种任务,从而确立了“语言模型即通用任务求解器”的新范式,为后续的规模扩展研究奠定了基础。

  DALL-E 1(2021):是一个由AI驱动的图像生成模型。它并非GPT的衍生品,而是同样基于Transformer核心思想,在架构上进行了关键创新,将文本和图像统一表示为离散标记,并使用一个自回归Transformer模型对它们进行联合建模与生成,首次证明了神经网络能够从纯文本描述直接生成复杂且富有创意的图像。

  ChatGPT (2022):OpenAI推出的对话式人工智能系统。其核心技术是针对 GPT-3.5 模型进行专门优化,以实现与人类意图和价值观的“对齐”。它取得突破的关键在于引入了 “基于人类反馈的强化学习” 训练范式。该范式并非简单的“微调”,而是一个包含三步骤的系统工程:1) 利用人类编写的对线) 训练一个模拟人类偏好的奖励模型;3) 通过近端策略优化算法,以奖励模型为引导,大规模优化语言模型。

  GPT-4 (2023):OpenAI 发布的第四代大规模多模态预训练模型,标志着大模型在推理能力与跨模态交互上的范式级跃迁。它是 GPT 系列中首个支持文本与图像双输入、并输出精准文本的模型,具备深度跨模态推理能力 既能解析图表数据、识别图像中的逻辑矛盾,也能理解漫画的讽刺内核与视觉幽默。同时,其在专业学术基准(如模拟律师考试跻身前 10%)、长文本处理(支持 2.5 万字输入)和多语言理解上取得了较大突破。

  以 Ilya Sutskever 为代表的部分董事会成员坚持,OpenAI 必须恪守非营利初心,将防范 AGI 的潜在风险、确保“通用人工智能造福全人类”作为首要使命,严防商业利益侵蚀核心目标;而 Sam Altman 一方则主张公司的当务之急是加速产品化、寻求巨额融资并持续投入研发,以在激烈的竞争中确保生存并维持技术领先地位。

  2023年11月初,双方的矛盾因一系列具体事件达到顶峰。Ilya Sutskever与当时的首席技术官Mira Murati (米拉穆拉蒂) 秘密合作,整理了一份长达数十页的PDF备忘录,详细列举了Sam Altman在多方面(包括产品安全审批流程、内部基金归属等事务)对董事会“缺乏一贯坦诚”的证据,并通过“阅后即焚”邮件发送给三位独立董事。

  在独立董事的支持下,董事会于2023年11月17日(公开宣布日)突然行动,以“沟通不坦诚”为由,投票罢免了Sam Altman的CEO职务,并解除了联合创始人Greg Brockman(格雷格布罗克曼) 的董事会主席职务。这一决定由Ilya Sutskever和三位独立董事(共4票)做出,Sam Altman和Greg Brockman投了反对票(共2票)。

IlyaSutskever——AI最伟大的“推动者”也是其最深刻的“对峙者”(图3)

  原文标题:Ilya Sutskever —— AI最伟大的“推动者”,也是其最深刻的“对峙者”