2025-12-07
分享到
AI创投周报是阿尔法公社推出的聚焦于以生成式AI为代表的人工智能新浪潮的创投资讯周报。阿尔法公社发现和投资非凡创业者(Alpha Founders),相信非凡创业者们在技术、商业和社会方面的巨大推动力,他们指引着创投生态的风向。
2.Supabase获1亿美元融资,估值50亿美元,作为Firebase的开源替代方案,它基于PostgreSQL提供一体化后端底座,并因支撑“vibe coding”与AI应用构建,成为全球主流开源基础设施之一。
3.英伟达发布自动驾驶新型“大脑”——自动驾驶模型Alpamayo-R1,作为首个基于Cosmos-Reason的视觉语言动作模型,它具备“三思而后行”的决策能力,被视为实现L4级自动驾驶的关键,并配套Cosmos Cookbook资源以夯实物理AI战略。
DeepSeek-V3.2系列的核心突破体现在三大方面:首先,模型引入了创新的DSA稀疏注意力机制,将长序列处理的计算复杂度从平方级降至线K长度序列的推理成本降低数倍;其次,团队在强化学习训练上投入超过预训练成本10%的计算资源,通过改进的GRPO算法和专家蒸馏策略显著提升模型在复杂任务上的表现;第三,模型实现了推理与工具调用的深度融合,支持思考与非思考双模式,并基于1800多个环境、85000多条指令的大规模Agent数据训练,在工具使用基准测试中接近闭源模型性能。
性能方面,DeepSeek-V3.2在推理能力上比肩GPT-5,Speciale版本则在数学证明和编程竞赛中媲美Gemini-3.0-Pro,尤其在ICPC和IOI竞赛中达到人类选手前列水平。
Runway近日发布新一代AI视频生成模型Gen-4.5,Gen-4.5的核心突破体现在其卓越的基准测试成绩和生成质量。
该模型在Artificial Analysis文本转视频评测中以1247的Elo评分获得SOTA,全面超越现有主流模型。其亮点在于实现了前所未有的物理准确性与视觉精度:模型能够精准模拟物体的重量感、尘土飞扬的动态效果以及光影变化,生成视频在运镜、视角切换和复杂场景还原上表现丝滑自然,如人照镜子、汽车疾驰等细节几乎无破绽。同时,Gen-4.5支持执行复杂序列指令,并保留速度优势,在画质上实现质的飞跃。
在亚马逊云科技re:Invent 2025上,Matt Garman(CEO )在10分钟内快速推出25个新产品,以平均24秒一个的速度展示了公司在计算、存储、安全等领域的创新。
首先在算力层面,亚马逊云科技推出了基于3纳米工艺的Trainium3 Ultra Servers芯片,计算性能提升4.4倍;同时深化与英伟达的合作,推出P6e-GB300实例,并创新性地推出AI Factories,允许客户在自有数据中心部署云基础设施。
在模型生态方面,Bedrock平台首次引入中国模型Kimi和MiniMax,助力国产模型出海,并发布自研的Amazon Nova 2系列模型,包括注重性价比的Lite、面向复杂任务的Pro以及多模态融合的Omni,还通过Nova Forge服务支持企业定制专属模型。
在NeurIPS人工智能大会上,英伟达推出一系列旨在推动物理AI发展的新技术与模型。
本次发布的核心亮点是专为自动驾驶研究设计的开源推理视觉语言模型Alpamayo-R1。该模型基于具备“三思而后行”特性的Cosmos-Reason模型构建,是业内首个专注于自动驾驶应用的视觉语言动作模型,能够使车辆融合处理视觉与语言信息,从而更智能地感知环境并做出决策。
英伟达指出,此类技术是实现L4级高度自动驾驶的关键。为助力开发者,英伟达同步在GitHub上提供了详尽的“Cosmos Cookbook”开发资源,涵盖从数据生成到模型评估的全流程。
5.智象未来入选【甲子100】「2025中国AI大模型领域最具商业潜力榜」
阿尔法公社在早期投资的智象未来近日入选了「甲子100」“2025中国AI大模型领域最具商业潜力榜”,该榜单旨在表彰在科技各细分赛道具备核心技术且商业化成果突出的企业。
智象未来作为一家专注于多模态生成式人工智能的企业,其技术实力与市场应用能力得到了行业认可。该公司自主研发的“智象多模态大模型”拥有超百亿参数,并建立了行业领先的多模态版权语料库,已完成模型与算法的双重备案。其图像生成技术擅长艺术性表达、复杂逻辑刻画与长文本嵌入;视频生成可输出4K高清画面,运动自然且支持全局与局部控制。基于此模型打造的“智象AI”系列产品已服务全球超2000万个人用户及4万家企业客户,包括中国移动、人民网、微软等知名企业,并推出了“AI一语成片”视频彩铃等应用。此外,其开源图像生成模型HiDream-I1曾在Artificial Analysis权威榜单中迅速登顶,显示出国际竞争力。
理想汽车近日正式发布其首款AI眼镜Livis,定位为“理想最强智能附件”,主打轻量化、快速响应与多功能集成。Livis全系标配蔡司镜片,售价1699元起,旨在通过软硬件一体化的设计为理想车主及科技用户提供无缝的智能体验。
Livis重量仅为36克,采用无显示屏设计以优化佩戴舒适度。其核心功能涵盖语音控车、快速抓拍、多模态AI交互与高清音频播放,并搭载自研的Livis OS系统,实现800毫秒内的端到端语音响应速九游智能体育科技度。
产品配备1200万像素摄像头,支持0.7秒冷启动抓拍和41分钟视频录制;音频方面采用双磁路扬声器与空间音频技术,在保证私密性的同时提供沉浸式听感。理想团队将AI眼镜视为“穿戴机器人”战略的关键一环,通过三步走计划推进产品迭代,未来计划实现独立终端化。
快手可灵发布AI视频“O1模型”,宣称其为“全球首个统一多模态视频模型”。
可灵O1模型的核心亮点在于其全能指令与多模态融合能力。实测显示,模型支持以照片、视频、文字作为指令,实现多主体元素的一致性维护,如蒙娜丽莎逃跑剧情中角色转场自然,硅谷大佬偶遇场景虽有个别混淆但整体连贯。
局部编辑功能表现突出,可将视频中的狗狗替换为赛博机器狗,移动主体处理精准;镜头延展支持动作捕捉,如企鹅舞蹈还原度高,但复杂指令如“回头”动作存在遗漏。模型还支持OOTD换装、3D特效等创意玩法,生成时长可达10秒,显著提升创作效率。同步发布的图片O1模型进一步强化了一致性与细节处理。
近日,AI芯片企业Tenstorrent发布了新一代高性能RISC-V处理器TT-Ascalon。该公司由芯片行业资深专家吉姆・凯勒领导,此次推出的产品旨在填补RISC-V架构在高性能计算领域的空白。
该处理器主要面向服务器、人工智能基础设施及汽车高性能计算等应用场景,为相关领域提供了新的技术选择。TT-Ascalon基于三星SF4X工艺节点设计,主频超过2.5GHz,在标准性能测试中表现出色。该处理器完全遵循RISC-V RVA23规范,集成了矢量引擎,支持硬件虚拟化和高级内存管理功能。在软件生态方面,该产品已适配主流开发工具链,方便开发者快速部署。其架构支持从单核到八核的灵活配置,并具备可靠的安全特性。
Tenstorrent还通过创新授权模式与多家企业展开合作,包括与汽车软件平台AutoCore.ai的合作,推动RISC-V在智能汽车领域的应用。
在NeurIPS 2025大会上,谷歌研究团队发布了Titans新架构和MIRAS理论框架,这是针对Transformer模型在处理超
长上下文时计算效率低下的重要突破。谷歌作为Transformer的原始提出者,此次革新旨在解决自注意力机制导致的二次方计算复杂度问题,将上下文窗口扩展至200万token。
Titans架构融合了循环神经网络的速度和Transformer的性能,通过引入一个在推理阶段动态更新权重的神经长期记忆模块,实现“测试时训练”机制。其核心变体MAC将长期记忆作为额外上下文输入注意力机制,而不改变注意力计算本身,并利用“惊喜指标”根据输入与记忆的差异度选择性更新记忆,以高效处理异常或重要信息。
MIRAS框架则从理论层面统一序列模型设计,分解为内存架构、注意力偏差、保留门控和记忆算法四个组件,并采用非欧几里得目标函数如Huber Loss提升鲁棒性。实验表明,Titans在长上下文任务中表现优异,优于Mamba 2等现有模型,且参数规模更小。这一进展为AI序列建模提供了新方向,对推动长上下文处理技术有重要意义。
10.斯坦福MIT联合推出ReCAP框架:递归树结构突破长上下文推理,性能提升超112%
斯坦福大学与麻省理工学院的研究团队联合推出新一代AI智能体推理框架ReCAP,成功超越了统治该领域三年的主流框架ReAct。
ReCAP框架的核心创新在于其独特的递归树结构设计,通过三大机制有效攻克了长上下文任务中的三大难题。其计划前瞻分解机制让模型能够生成完整任务列表并动态优化执行流程;结构化父任务再注入机制确保高层规划与底层执行的连贯性,避免了上下文断层;滑动窗口记忆技术则实现了内存占用的可控管理。
在严格遵循pass@1评测原则下的实验数据显示,ReCAP在Robotouille任务中相较ReAct实现了84.2%至112.5%的性能提升,在ALFWorld任务中也达到91%的成功率。尽管计算成本约为ReAct的三倍,但其在关键任务中展现出的目标一致性与执行稳定性,为对准确性要求高的应用场景提供了极具价值的解决方案。该框架展现出优异的通用性,能够在具身推理和代码编辑等截然不同的任务中都保持稳健表现。
Supabase提供基于PostgreSQL的开源后端平台,将数据库、实时同步、认证、文件存储与边缘函数整合为一体,定位为Firebase的开源替代方案。其技术通过Row Level Security、逻辑复制与实时通道构建数据库原生的实时应用框架,在开发者生态中形成“即插即用”的后端底座。Supabase在“vibe coding”开发模式中被广泛采用,支撑AI工具、前端框架与独立开发者构建生产级应用,并在全球范围内成为主流开源后端基础设施之一。
Ricursive Intelligence研发AI驱动的端到端芯片设计系统,将架构规划、版图布局、验证与优化整合为一个能够持续自我迭代的自动化流程。其技术以AlphaChip强化学习框架为基础,扩展为可对整个芯片堆栈执行设计与优化的生成式系统。
Ricursive的路线图分三阶段:压缩现有设计周期、实现完全自动化可流片设计、构建AI与芯片之间的闭环——让AI设计芯片,再用新芯片运行更强AI,并继续反向提升芯片性能,目标是使任意公司无需芯片团队即可在数周内生成定制硅片。
Databricks完成50亿美元融资,最新估值达到1340亿美元,由Insight Partners领投,公司今年预计销售额约41亿美元,收入增长55%。Databricks目前为美国第五大未上市科技公司。
Databricks由七位加州大学伯克利分校的教授和数据科学家联合创办,已成为全球最具价值的AI公司之一。Databricks的核心产品Delta Lake是一种增强型数据湖解决方案,支持事务存储层,并能与AWS、Azure、Google Cloud等云平台深度集成,使得用户能在单个平台上处理各类数据并进行深入分析,极大提升了数据处理的效率与可靠性。
Databricks与OpenAI关系紧密,OpenAI是其最大客户之一,公司已承诺在未来数年投入1亿美元用于OpenAI模型使用。其收入来源分散,前十大客户合计占比不足15%。
Gradium专注于构建低延迟、多语言音频语言模型,为开发者提供可在大规模生产环境中实时响应的AI语音基础设施。其模型针对“端到端语音交互链路”优化,从语音理解、文本生成到语音合成全流程压缩延迟,以接近即时响应的方式支持对话式应用与智能代理。
Gradium在模型层面原生支持英语、法语、德语、西班牙语与葡萄牙语,并提供高并发、多租户部署能力,面向语音助手、实时协作工具、游戏与娱乐互动等场景,作为通用LLM语音能力之外的专用“超低延迟语音引擎”。
Black Forest Labs研发通用型图像生成与编辑模型,重点在高保真渲染、多图参考、一致性风格控制与4K级分辨率生成能力。其最新模型Flux 2支持基于多达10张参考图的风格聚合,提升人物、文本和细节渲染质量,并适配从企业内容生产到消费级应用的多场景需求。
BFL的模型已被Adobe、Picsart、VSCO、ElevenLabs、Vercel等厂商集成,成为全球图像生成基础模型生态的重要供应者,并在实时生成、控制性编辑与可扩展推理方面快速迭代。
Simular提供跨macOS与Windows的系统级AI代理,通过直接控制鼠标、键盘和操作系统界面执行任务,而非仅在浏览器中操作。其核心技术结合大语言模型与确定性工作流生成,通过让AI自由探索任务路径、由用户锁定成功轨迹并转化为可重复执行的代码,显著降低长链任务中的幻觉风险。
Simular的“neuro-symbolic computer use agents”架构在本地执行可审计的代码流程,实现更稳定、可控的自动化。系统目前支持数据录入、文档操作等高频数字办公任务,并已进入微软Windows 365 for Agents体系。
Simular由前谷歌DeepMind成员创立。联合创始人Ang Li (CEO)曾任持续学习研究员,联合创始人Jiachen Yang专长于强化学习,两人均参与面向谷歌产品(含 Waymo)的技术研发。团队具有长期AI产品化与前沿研究经验。
Coverbase构建面向大型受监管企业的AI原生采购与合规平台,通过多代理架构自动执行供应商引入、尽调、合同评估与持续风险监控等流程。系统在高合规场景中替代人工操作,不仅管理工作流,还直接完成数据审查、风险判断与合规验证。Coverbase可从供应商文档、审计资料与公开数据中提取结构化风险指标,并自动生成审查报告,覆盖金融、保险、医疗、科技等对监管与安全要求高的行业。平台按供应商数量与评估次数计费,适用于需要规模化供应商运营的企业。
Uare.ai构建“Human Life Model(HLM)”框架,仅基于个体提供的事实、经历、专业知识与价值观训练个人模型,实现可被用户完全拥有的数字分身。
系统收集个人背景、叙述性记忆、专业知识体系,再将其整合为结构化决策模型,使AI能以符合个人思维模式的方式回答问题、提供咨询与生成内容。
HLM不会调用通用大模型补齐空白,在知识缺口场景明确回答“我不知道”,以保持专业可靠性。该平台面向律师、会计师、顾问、教练、创作者等“个人即品牌”的专业群体,提供可扩展的专业服务交付方式。
Onton以神经符号架构构建AI商品搜索平台,将大语言模型的语义理解能力与结构化逻辑推理结合,显著降低传统向量搜索的幻觉率。系统可从材料、属性、用途等真实世界知识中推断产品特征,例如基于面料判断家具是否耐刮或适合宠物;并解决不同电商站点命名不一致导致的检索失败。Onton支持文本、图像和AI生成的设计草图输入,通过“无限画布”让用户在空间布置、产品组合和场景设计中获得可视化辅助。其搜索与生成能力已带来显著转化率提升。
Onton由Zach Hudson与Alex Gunnarson共同创立。Hudson长期从事机器学习与产品技术研发,负责公司神经符号模型的技术方向;Gunnarson为联合创始人兼产品负责人。
本文由阿尔法公社综合自多个信息源,并在AI大模型的辅助下写作,封面图片由AI生成。