2026-01-04
分享到
2025年12月28日,笔记侠在海南自贸港陵水举办的《看不见的新大陆:第五代企业家逆风进化——柯洲和他的创业者朋友年度演讲》。
240万人观看12月28日年度演讲直播之余,我们从1月1日通过笔记侠公众号持续更新《看不见的新大陆》第五代企业家案例,欢迎关注。和其他案例
在未来学家凯文·凯利和前经济学人总编吴晨合著的《未来10000天的可能》提到,AI和蒸汽机、电力、计算机一样,通用目的技术具备三个特征:
我想说的第3个行业,就是和人工智能紧密相关的AI 大模型产业,看到 “新大陆” 的是王长虎和他的爱诗科技。
20年视频AI领域的技术老兵,2009年加入微软亚洲研究院,2017年加入字节跳动人工智能实验室,主导抖音、TikTok等产品的视觉技术架构建设。
2021年担任字节跳动视觉技术负责人,完成视觉大模型从0到1建设,2023年创业打造了一家全球图生视频榜单第一的 AI 视频大模型企业。
在很多人眼里,AI大模型,要么是ChatGPT那样的 “聊天机器人”,要么是 Midjourney 那样的 “画图工具”。
王长虎看到它们的时候,感受到新的时代到来了。他在人工智能领域深耕20 年,经历过很多时代,但这一次,他深刻感到是一个新的大时代的到来。为什么?
上一个人工智能时代是10年前,是AI的小爆发期,因为深度学习 (Deep learning)的快速发展,诞生了四小龙,主要服务企业,还是非常小众。即便抖音是人工智能算法功能,还是被当作一家移动互联网公司。
2023年,所有人都扎进大语言模型、文生图的红海。当时,视频生成大模型因为效果差、技术难,被行业专家和投资人集体看衰,不认为5年之内能够落地。
但王长虎反其道而行。作为深耕AI领域20年、带领团队打造过抖音和 TikTok 一半以上视频AI技术的老兵,他带着爱诗科技All in视频大模型,做出了全球TOP25的AI APP,用户超1亿,覆盖C端普通消费者、专业创作者和 B 端广告公司、电商企业、影视团队。
王长虎的目标很明确:要做 “让每个人都能把想象变成视频” 的生产力革命,让视频大模型从 “专业门槛” 变成 “人人可及的基础设施”。
因为他看透了一个被忽略的真相:“视频生成这件事,B 端和 C 端都会产生根本性的影响。”
他为何如此坚定?在他眼里,现在的AI是和工业时代并列的新大时代。人工智能在很大程度上将成为一种基础设施,就像电力一样,未来每个人都不可或缺。
那么,在行动上,这个曾经的字节跳动AI 实验室负责人,是如何将这份“孤独的坚信”,变成全球上亿用户“用指尖投票”的爆款产品?
2023年,AI创业如火如荼。摆在王长虎面前的,是一条清晰的热门赛道,那就是语九游智能体育科技言模型、图文模型,和一条迷雾笼罩的险路:视频生成模型。他几乎毫不犹豫地选择了后者。
王长虎和我回忆说,“当时,我们交流过的绝大多数投资人和业界人士都认为,这项技术在5年内无法落地应用。”这是一个需要极大勇气的“非共识”时刻。
一是他身后这支曾打造出抖音、TikTok的视频AI技术团队,这是全球范围内最懂视频的团队之一,这些经历帮助他在新的时代到来的时候,做出更准确的判断,解决更难的问题,乃至是全世界最难的问题。
团队一致觉得AI时代太适合他们创业了,大家一起去做一件非共识但正确的事;
二是他内心深处的一个信念:相比于图文大模型,视频大模型能够颠覆的行业更多,影响范围更广。
这份“非共识”的押注,为他们赢得了最宝贵的资产:时间。当巨头和同行们还在观望、论证时,爱诗科技已经在2024年1月份,将一款可用的视频生成产品“拍我AI”推到了用户面前,比Sora早一年推出。产品上线当月,访问量便与当时的明星大语言模型处于同一量级。
总结来说,他的战略逻辑很朴素:在颠覆性技术的早期,共识意味着红海,是巨头的厮杀场。非共识但正确,才是创业公司的诺亚方舟。
关键不在于你敢不敢赌,而在于你的赌注,是不是建立在你比别人多十倍的认知深度上。
手握领先的技术,只是拿到了入场券。如何让技术从“酷炫的演示”变成“离不开的工具”?王长虎团队在产品上做了一次关键的“哲学转向”。
几乎所有的公司产视频生成产品都在服务于创作者,王长虎说:“我们创业的初衷,就是让每个普通人成为生活的导演,都能够用起来,玩起来。”
移动互联网让每个人都可以随时随地拍摄视频,但是能够真正在抖音、Tikok上发布视频的用户比例是很小的。痛点包括:缺少创意、不知道怎么呈现。如何让每个人轻松地将脑海中的想象转化为视频进行分享与传播?
2024年10月,“拍我AI”上线 产品,作为“拍我AI”的第三代模型,全球爆火。在产品设计上,他们近乎偏执地追求“一键生成”。
用户不需要理解什么是关键帧、蒙版、渲染,只需要输入“一只戴着墨镜的柴犬在太空跳舞”,或者上传一张自家宠物猫狗的照片,选择“跳芭蕾舞”,或者“穿西装走两步”,几分钟内,一段生动、有趣、可以直接分享到朋友圈的视频就诞生了。
很多普通人虽然粉丝不多,但是他们用“拍我AI”做出来的视频,可能有几十万的赞,正是这种“傻瓜式”的体验,像病毒一样在全球社交网络裂变。
拍我AI的模型能力好,迭代效率快,每几个月就有新的产品升级,持续吸引更多的用户,让他们可以做更牛逼的事情。
这让我想起了一句话:技术的民主化,从来不是把法拉利的价格降到丰田,而是发明人人都能开得起的汽车。
当视频创作的门槛被降低,普通人的想象力被释放,创新的火花就会呈燎原之势。
爱诗科技能持续领先的另一个秘密,在于他们无意中构建了一个自我驱动、不断加速的“增长飞轮”:全球最好的模型、最有创意的产品、最有效的海量用户,模型、产品、用户三者紧密咬合,互相影响,让公司在发展过程中更健康、更务实。
首先,通过模型驱动产品,作为全球第一梯队的生成质量,是产品体验的底气,画质更清晰、动作更自然、创意更天马行空,这是吸引用户的硬实力。
其次,产品吸引用户,“拍我AI”极低使用门槛,提高“哇塞”体验,像磁石一样吸引了上亿用户,他们不仅是消费者,更成了内容的创造者和传播者。
最后,用户反哺模型,海量用户的真实使用,产生了世界上最宝贵的数据——带着场景、情感和意图的数据。用户千奇百怪的需求,又反过来影响产品的进化和模型的发展。
这个飞轮,越转越快,越转越好,于是更多的用户带来更多样化的产品需求,更丰富的产品需求训练出更聪明、更通用的模型,更强大的模型又吸引来更广泛的用户。
有的创业公司,只关注模型,不关注用户,不关注营收;有的创业公司,基于别人的模型,只关注产品。王长虎走自己的路,是全球少有的模型、产品、用户都在第一排的公司。
作为一家2023年创立的创业公司,资源极其有限,意味着时刻有向前的压力。
在这2年多的时间里,爱诗科技如何与资源远在它数十上百倍的同行竞争?王长虎的答案不是硬碰硬,而是:极致的组织效率与精准的技术判断力。
他提出了一个近乎苛刻的目标:要实现相对于同行的10倍效率。这并非狂妄,而是基于两点核心能力:
王长虎说:“视频生成技术是一个极为复杂的过程。在这个可能面临10个关键决策点,每个点有5条路。最优秀的团队能第一次就选对路,平庸的团队可能要试错四五次。”
而他们的团队在视频AI领域深耕二十年,积累了近乎本能的“技术直觉”,判断力直接影响效率,让具有判断力的人做决策,能在迷雾中看到那条最有可能通向终点的路,从而有机会用更少的资源做出更大的事。
王长虎将字节跳动高效、务实的组织文化基因带到了公司。扁平化,让一个好的产品创意或技术思路,能以最快的速度直达决策并获取资源。信息传递的效率,减少了内耗。
他认为:“不同的团队会有不同的组织效率,而组织效率会极大地影响最终的成本和结果。”
大模型极其烧钱,为了确保现金流的健康,不仅要能够持续融资,还要能够更好地做商业化,并且建立好竞争壁垒。
所有的维度,都需要更努力。因此,要时刻吸引更优秀的人加入,筛选有创业意识和创业意志的人,敢于打拼,勇于打拼,勇于冒风险,能够持续更新技术,持续做出最前沿的模型,比别人更快找到用户痛点,保持在第一梯队。
最后,他跟我分享了一个故事:在知名的FIRST青年电影展上,一部完全由一人使用“拍我AI”工具独立创作的长片电影,成功入围并获奖。
没有庞大的剧组,没有昂贵的设备,只有一个创作者和他的想象力。王长虎说:“这代表一种全新的生产力范式,就像汽车出现的时候颠覆了马车行业。”
听完后我感到很震撼,所有与视频表达相关的行业都会被重构。视频生成大模型是一种新的生产力,更多的人可以用新的生产力去更快地更低成本创造出同样质量,甚至是更好质量的内容。
广告是最先用起来的一个行业,让漫画直接动起来的漫剧是应运而生的新行业。他们专门为电商场景做了视频智能体,只要上传一张产品照片,就可以直接生成关于这个照片的广告视频。
AI时代的管理学,正在浮现。未来决定现在,未来将发生什么,决定现在要做什么。未来包括了:政治、经济、AI技术、哲学。
正是在这个时代背景下,笔记侠推出了中国首个面向企业家的PPE(政治、经济、哲学)课程。宗旨是让大家回到决策的源头,重构我们的底层认知逻辑,拥有未来5年的决策底牌。
今天,很多优秀的AI、全球化等创业者,都来上笔记侠PPE(政经哲)书院。未来,让我们一起做保持清醒和笃定的决策者。