21世纪经济报道记者雷晨
60个人的团队,近八成收入来自海外市场,B端客户收入超过同赛道所有公司总和,还成了黄仁勋CES主题演讲里唯一提到的3D生成初创公司——这是1997年生的吴迪和1999年生的张启煊,在2020年还是上海科技大学学生时创办的影眸科技。
近期,影眸科技宣布完成数亿元新一轮融资,由凯辉基金、上海国投先导领投,老股东持续跟投,光源资本担任独家财务顾问。同步披露的还有新模型Hyper3D Rodin Gen-2.5的成绩:上线首月,订阅用户与年度经常性收入(ARR)环比增速均超过400%。
在AI创业普遍拼人员规模、拼烧钱速度的当下,这支核心研发人员多为“00后”的年轻团队,走了条不一样的路:不追流量故事,靠技术效率和商业化落地,在3D生成赛道站稳了头部位置。
押注AI 3D原生,把可控性做进底层
3D生成赛道的技术路线之争,在两年前就有了答案。
早年间行业主流走“2D升维”路线,用图像大模型的能力生成多视角图再转成3D模型,这条路看起来起步快,但有个致命问题:信息丢失不可逆,破面、拓扑混乱这些产业应用的硬伤,从路线根源上就解决不了。
影眸从一开始就选了更难走的“3D原生”路线——哪怕最困难的时候账上只剩一两百万元现金,也没转头走捷径。
难是真的难。做CLAY大模型的时候,整个行业可用的3D数据清洗完只有50万条,和图像、文本大模型千万级的数据量根本没法比。但影眸用这50万条数据训出了可用的3D原生大模型,相关研究入围2024年SIGGRAPH最佳论文提名,直接证明了这条路线走得通。之后整个行业的技术路径开始转向,3D原生成了共识。
先发优势不只是时间差。从CLAY开始,影眸就把“可控性”刻进了模型预训练的底层——这成了现在专业用户选择他们的核心理由。
“到现在这个阶段,很难说哪个模型的绝对效果能百分百超过同行,但在可控性上,我们和同行拉开了明显差距。”张启煊说。对专业创作者来说,可控性不是加分项,是选工具的必选项:能控制生成形状、能用自然语言做局部修改、能自动把模型拆成不同部件,甚至支持导入其他平台生成的模型做二次编辑——这些能力是和模型底层一起长出来的,不是后期打补丁能加上的。
这次发布的Rodin Gen-2.5,是全球首个千万面级3D生成模型。千万面的价值不是参数堆料,更像摄影里的RAW格式:保留最完整的细节当“母版”,游戏、影视行业的美术人员可以在高模上雕刻细节,再烘焙成低模用在实时场景里;3D打印行业则能直接用高精度模型出成品。配合五档可调的“思考深度”,生成时间从4秒到80秒可控,能覆盖从快速出稿到极致精模的全场景需求,配套的12K原生3D贴图,精度已经超过实景扫描效果。
60人小团队,把人效拉满
成立六年,影眸的团队规模一直控制在60人左右,对比大模型赛道动辄几百人的团队,影眸显得格外克制。
但小团队不等于低产出。影眸是目前唯一连续多年拿到SIGGRAPH最佳论文及提名的商业公司,算法团队每2个人里就有1人拿过该会议的最佳论文或提名,约70%的科研成果能直接转化成产品功能。
人效差距从哪来?吴迪总结了三个原因:
一是内部不搞赛马,认准3D原生这条路线就把绝大多数资源砸进去,少了很多内耗;二是算法优化带来的成本优势,同行要达到同等效果,训练成本大概是影眸的5到6倍;三是小团队天然的低消耗,没有冗余的流程和岗位。
年轻是这支团队的另一个标签。团队架构非常扁平,很多前沿研究方向直接让本科生牵头。“AI时代,做算法的本来就是年轻人。”吴迪说得很直接。研发流程也拆得足够细:UV、材质、拓扑每个模块独立,任何人有想法都能提,讨论可行就立刻上手,加上AI工具辅助,很多验证性实验一周就能出结果。
极高的人效也体现在人才稳定性上:算法团队从成立到现在只离开了3个人,分别去了英伟达、迪士尼研发部门和腾讯。
八成收入来自海外,客户覆盖英伟达、Lowe's
技术和效率的优势,最终直接兑现成了收入。
影眸的收入结构有两个很鲜明的特点:海外占比高,B端付费能力强。目前公司70%-80%的收入来自海外,核心市场在北美;积累的B端客户收入超过同赛道其他公司的总和,覆盖游戏、电商、具身智能、空间计算等高价值场景。
最硬的背书来自行业头部客户。今年CES黄仁勋主题演讲中展示的英伟达内部3D资产生成工作流,其3D生成环节用的就是Hyper3D Rodin——影眸是这个工作流里唯一的3D生成初创公司。全球第二大家居建材零售商Lowe's,用他们的模型落地了超过3万个SKU的3D资产目录,单模型成本控制在1美元以内,分钟级就能生成,这些模型用在全球1750多家门店的数字孪生系统里,每个月有超过1亿用户在线“逛店”时会看到。
除此之外,Unity、OctaneRender等专业引擎,Canva、Figma等设计平台,也都先后接入了影眸的3D生成能力。
目前影眸已经实现数千万美元的ARR,新模型发布后,B端和C端的收入比例大概是6:4。值得注意的是,这里的C端不是普通消费者,而是建模师、3D打印爱好者、产品设计师这类专业用户——其中一半左右是游戏行业从业者,要么是Roblox创作者,要么是用3D模型解决多视角图不一致问题的原画师。
一个很有意思的转化路径是:大部分B端客户,都是先以个人身份用C端产品,觉得好用之后才找到公司谈企业采购。“C端用户可能因为我们没打太多广告知道得少,但B端客户做几十万美元的采购决策时,会把所有产品横向比一遍。”吴迪说,这也是为什么影眸的B端客户能攒下这么多。
现在影眸的商业化方式很清晰:平台订阅、B端API合作、私有化部署,以及直接提供最终资产。在张启煊看来,3D生成是个足够健康的生意:单位算力成本结构比其他模态好,加上算法带来的成本壁垒,商业模型的可持续性比很多AI赛道强。
字节、美团、红杉参投,下一步啃场景生成
影眸的融资节奏,一直和产品迭代踩在同一个步点上。
2024年年底,字节跳动、美团龙珠联合领投数千万美元时,Rodin Gen-1刚发布半年,公司已经积累了数百家企业客户;2025年9月蓝驰创投领投,字节、红杉中国种子基金跟投的数千万美元融资落地时,Gen-2发布,推出了行业独有的AI自动拆件能力;2026年1月Gen-2 Edit上线,实现自然语言局部编辑,3D生成正式进入可编辑阶段;这次2026年6月的数亿元融资,正好卡在Gen-2.5发布的节点。
吴迪对记者表示,未来三年,核心场景还是在专业领域,主要做两件事:继续把底层模型的生成质量往上提,补全编辑、Agent这些能力,让专业用户用得更顺手。
更长期的布局在场景级生成。
“不管是游戏还是室内设计,真正商用的时候很少只用单个3D模型,本质都是场景级的需求。”张启煊说。他们2025年拿到最佳论文的CAST项目,就是做场景生成——要理解物体之间的支撑关系、位置关系、使用语义,生成符合常识的完整场景。从论文发布到现在近一年半,团队已经解决了多模块级联崩溃的问题,做了端到端优化,已经能稳定生成完整场景。
除此之外,具身智能是正在起量的新场景。影眸的模型已经支持一键导出可用于物理仿真的资产,不少具身智能公司已经在用他们的模型生成训练数据,相关的可互动资产也已经在给B端客户交付。
显示更多