2026-02-04
分享到
由商汤联合创始人徐冰发起,商汤大芯片原班人马打造的,国内首家All-in推理GPU芯片公司——
当前,AI模型训练已迈入深水区,推理环节的运行效率、综合成本与稳定性能,正成为左右AI技术商业化落地成败的核心关键,这也是商汤徐冰等人下场布局的原因。
2024年底,商汤启动了“1+X”战略重组计划。其中“1” 指核心业务,由生成式AI与视觉AI(传统AI)构成。“X”指垂直领域生态,商汤大芯片就属于X类。
按照当时的规划,“X”中的各生态企业将设立独立的CEO,并对业务发展负责。
2025年6月,作为商汤联合创始人的徐冰,正式发起成立了一家推理GPU芯片公司,也就是曦望。在不久后,商汤2025年股东大会,徐冰就辞任了执行董事及董事会秘书职务,亲自下场做芯片。
作为曦望的发起人徐冰,是跟随汤晓鸥教授一起创业的几个学生之一。在商汤,他就是公司发展的一“大功臣”。
2012年,徐冰获得了香港中文大学信息工程及数学双学士学位,并于同年成为该校多媒体实验室博士候选人,跟随导师汤晓鸥教授,开始了长达四年的计算机视觉研究工作。
2014年,实验室团队发表了 Gausianface 和 DeepID 两套算法,算法的人脸识别效果首次超越了人类表现,得到了《自然》、《科学》等权威媒体的报道。这个成果让团队意识到,将技术研发转化为行业落地应用的时机已经来临。
同年,徐冰与多位实验室师兄弟(徐立、王晓刚)跟随汤教授,创办了商汤科技。
出生于1990年的徐冰,尽管是这几个人中年纪最小,但他很会将专业知识用于企业乃至行业整体规划。
因此,在商汤徐冰也被委以重任,肩负起了企业发展战略以及融资和战略投资的整体管理工作。
他于2015年12月15日获委任为董事,并于2021年8月23日调任为执行董事。
2017 年至 2018 年,随着技术商业化上实现突破和领先,徐冰带领商汤获取了累计超过 30 亿美元的投资意向,并从中遴选最具战略价值和品牌的优质投资人,实现超过 10 亿美元的成功融资。
这也使得他被《麻省理工科技评论》(2017年)“35岁以下创新35人”中国榜单专栏,评为——人工智能商业化的推动人。
在商汤期间,徐冰除了将优质投资人引入公司外。徐冰还注意到,深度学习算法人才的稀有和AI 研发所需计算能力的匮乏。他认为,这两点是阻碍未来产业爆发的核心问题。
一是基于其早期在深度学习领域研究积累的经验,挖掘了来自麻省理工学院、香港中文大学、清华大学等名校以及谷歌、微软等企业的深度学习算法人才;
另一方面,毫不吝惜地将资金用于GPU 超算集群的建设,毕竟,大规模 GPU 并行计算是深度学习训练的刚需算力,强大的算力可以大幅压缩算法研发周期。
在徐冰及其团队的努力下,商汤组建起亚洲最大的深度学习研究团队之一,并自主研发了深度学习平台Parrots,为了加速深度学习训练和算法模型的迭代速度,公司还自主搭建了深度学习超算中心,为算法研发提供硬件“基础设施”支持,大幅降低了各类人工智能技术的研发成本。
2018年,为降低对英伟达等海外芯片巨头的依赖,商汤启动了自研AI芯片项目,重点瞄准边缘计算场景。
两年后,2020年,商汤首款芯片成功流片。也是在这一年,商汤成立上海阵量智能科技有限公司,该公司管理层也成为了如今曦望的核心班底。
曦望联席CEO王勇,是前AMD、昆仑芯核心架构师,拥有20年芯片研发经验,其曾任AMD dGPU首席架构师、百度昆仑芯核心架构师,主导多款7nm高性能芯片从研发到流片及量产。2020年加入商汤后,带领百人团队成功主导了两代芯片的研发和量产。
另一位联席CEO王湛则是百度创始团队成员、原集团副总裁,曾带领百度搜索8000人团队,2025年初加入曦望,负责公司产品化和商业化。
作为发起人、董事长的徐冰,则是会更关注曦望的战略发展、公司文化和客户成功,但不会参与具体的工作,专业的高管团队将带领曦望前进。
目前,曦望团队规模约300人,主要来自于英伟达、AMD、昆仑芯、商汤等企业。
与多数国产芯片厂商不同,曦望摒弃了传统训推一体GPU为训练优化的设计思路,聚焦推理场景进行原生架构重构——在调度、缓存、片上SRAM、互联及编译器路径上做深度优化,结合LPDDR内存技术,从根源降低单位Token推理成本。
“如果能让推理成本下降 90%,并提供更稳定的服务,我们的竞争就不是‘又一个芯片’,而是‘重写中国 AI 产业的损益表’。”曦望联席 CEO 王湛这样说。
“我们的目标是极致降低大模型推理的成本与门槛,让推理算力变得普惠且可广泛获取,从而充分释放 AGI 的全部潜力。”王湛表示,这也是曦望坚持 All-in 推理的初心所在。
第一代S1芯片聚焦视觉推理,适配千余种CV模型,累计销量超2万颗,为商汤科技计算机视觉业务提供坚实支撑。
第二代S2芯片采用GPGPU架构,实测性能接近英伟达A100的80%,可适配多元大模型推理场景,深度兼容CUDA 生态,可适配推理 DeepSeek、Qwen等开源大模型,以及文生图、文生视频、文生3D主流模型。
第三代S3芯片于2025年5月正式立项,计划2026年量产,采用全自研架构并兼容CUDA生态,专门针对大模型预填充与解码阶段优化,目标将推理成本降至现有方案的1/10。
以“把推理成本打下来”的目标,曦望希望走出一条自主发展推理 GPU 的特色之路,最终实现国产 AI 芯片从“跟跑”向“差异化领跑”的关键跨越。
曦望官方透露,2026年即将重磅推出的S3芯片,定位“推理性价比之王”。并在1月27日,杭州举办 2026 SGS 产品发布会。
尽管有商汤可以与之协同,众多大牛加持,但作为独立公司,需要自负盈亏。当前,除了一级市场融资外,不少国产GPU公司已走向二级市场,行业整体进入资本化加速阶段。
“国产GPU四小龙”摩尔线程、沐曦股份、壁仞科技已率先登陆资本市场。1月22日,燧原科技科创板IPO申请也已获受理。上市融资也成为这些企业获取资金支持、加速技术研发和市场拓展的重要途径。
如今还仅依靠一级市场融资的曦望也将面临不小的挑战。当然,真正见真章还是最终产品硬核实力,谁能以实力抢占市场,谁就可能成为真正成为国产替代的“希望”!
2月3日晚间,美股三大指数开盘涨跌不一,开盘不久后集体跳水,纳指跌逾1%。现货黄金大涨,截至发稿,报4923.41美元/盎司,涨逾5%。
近日,武汉市公安局黄陂区分局连破多起非法储存、销售、运输烟花爆竹案件,查获非法储存的烟花爆竹5668件,涉案金额达40余万元。
长期以九游智能体育科技来,黄金与美元之间始终维持着一种稳定的反向关联。然而,当前这种传统线性关系似乎正在瓦解,两者的波动幅度已出现失衡。在过去一个完整的年度交易周期(260个交易日)内,金价涨幅与美元跌幅之比高达7.2倍;在半年维度下,这一倍数更是达到了31倍。
昨天ICU今天KTV!连续大跌3日的金价、银价暴力反弹,完全收复昨日跌幅
每经记者:黄胜 记者黄胜编辑程鹏 杜恒峰 校对陈柯名北京时间2月3日晚间,连续3日下跌后,国际金银价格迎来大幅反弹。现货白银盘中大涨超12%,一度触及89.17美元/盎司,完全收复昨日的跌幅。
2月3日,天津市滨海新区公安局发布警情通报:针对互联网上出现“男子骑摩托车遇大巴车逆行挡路并遭威胁”的信息,经查,2026年1月30日18时20分许,冯某(男,43岁)驾驶大型客车在滨海新区塘黄路逆向行驶,与驾驶摩托车正常行驶的赵某某(男,21岁)发生言语冲突。
山西吕梁一小学副校长与多名教师聚餐饮酒至深夜,一教师酒后回家途中桥边坠亡
近日,有网友向大河报《看见》记者反映,2026年1月8日,山西吕梁中阳县北街小学体育老师任某在与学校领导、同事聚餐饮酒后,次日凌晨回家途中不幸在一座桥附近坠亡。
浙江之声2026-02-03 23:10:02来源:@浙江天台公安版权归原作者所有,如有侵权请及时联系 刚刚,@浙江天台公安 发布警情通报。 全文如下: 警情通报针对近期网络关注的“夫妻网购娃娃菜中毒事件”,我局专案组开展了溯源调查、现场勘查、检验鉴定、调查走访等工作。
肖战、杨紫、杨幂、黄晓明、佟丽娅、刘宇宁等近百位演员集体发声:不聚集、不逗留、防诈骗
作为华语娱乐圈年度重磅盛事,2025微博之夜定档2026年2月5日12:30开启线上直播,今日主办方称星光阵容集结完毕,肖战、杨幂、杨紫、沈腾、王一博、周深、谢霆锋、黄晓明、邓超、舒淇、王嘉尔、吴京、雷佳音、倪妮、宋佳、佘诗曼、佟丽娅、陈伟霆、汪苏泷、辛芷蕾、叶童、白鹿、刘宇宁、李宇春、陈丽君、李冰冰、丁禹兮、关晓彤、陈都灵、宋威龙、宋祖儿、娜扎、张凌赫、邓为、时代少年团等百余位艺人确认出席。
美国总统特朗普近日提名前美联储理事凯文·沃什接替杰罗姆·鲍威尔,出任新一任美联储主席。这一提名标志着长时间的猜测与政策不确定性暂告段落,其影响迅速从华尔街蔓延至全球市场,更折射出特朗普政府内外政策的联动逻辑。
如今,特朗普提出的“金穹”计划为美欧双方提供了一个契机,通过合作来强化北极地区的安全态势与核威慑能力。