2025-11-30
分享到
传言称,GPT-5的基石仍是GPT-4o,且GPT-4.5之后的预训练版本,都被OpenAI放弃了!
这么说并非空穴来风,核心爆料恰恰来自权威SemiAnalysis的最新一文——
OpenAI顶尖团队自GPT-4o发布之后,迄今尚未完成一次完整的,为下一代前沿模型设计的大规模预训练。
文章中,高级分析师强调:谷歌正手持TPUv7这把利剑,向英伟达王座发起冲锋,或将终结CUDA护城河。
殊不知,没有前沿模型的预训练,一切皆是「无米之炊」。恰恰这一环节,成为了AI硬件里最难、最耗资源的一关。
GPT的预训练,或许在GPT-4o之后触及了天花板,由此也解释了GPT-5性能未达业界预期的关键原因。
恰在昨天,Ilya最新发文称,Scaling不会停,但某个重要的东西仍然会缺失。
这一秘密项目,原定以GPT-5面世,但因训练未达预期,最终被降级为GPT-4.5发布。
如今第五代旗舰模型GPT-5,包括最新GPT-5.1,其「技术根基」本质或仍未突破GPT-4o的范畴。
SemiAnalysis去年底一篇文章,曾对外公开了Orion训练的困境。
当前,算法的进步使得模型每年所需的物理计算量减少约三分之一,因此,训练运行时间很少超过3个月。
然而,OpenAI的Orion大规模预训练,却打破了这一常规,其训练时间超过了3个月。
另据Information同一时间爆出,Orion不会像前代实现巨大的飞跃,相较于从GPT-3到GPT-4的迭代,改进幅度要小得多。
不仅如此,Orion性能提升也基本局限在——语言能力上,其代码能力甚至不如旧模型,且成本更高。
如今再回看2月,GPT-4.5的诞生,基于代号Orion的模型,OpenAI追求的是:
这一切的一切,从侧面印证了,此前外媒关于「Orion遇挫」爆料的准确性——
GPT-4o,成Scaling主线的那场发布,奥特曼将其定调为「博士级AI,是通往AGI又一里程碑」。
几年前,OpenAI内部认为:未来会有一个「统治一切」的超级模型。但现在行业共识已经转变为「模型的专业化和多样化」。
早期的微调,主要用于调整「语气」或「指令遵循」。 现在的重头戏,是强化学习微调(Reinforcement Fine-Tuning) 。
从第一天起,奥特曼和Greg Brockman就确立了「App+ API」的双轨战略。
OpenAI曾推出了可视化的「Agent Builder」(节点式构建),但发现对于开发者而言,这种方式可能过于受限。
NPC(非玩家角色)逻辑。与其让模型完全自由发挥,不如通过代码给予它明确的逻辑框架和标准操作程序(SOP),特别是在受监管的行业(九游体育官方网站如客户支持、金融)。
2025年度压轴大戏,谷歌Gemini 3 Pro无疑打了一场胜仗,但OpenAI不会袖手旁观。