AI创业反套路：一群“95后”做3D大模型，ARR数千万美元

2026年06月24日

商业与社会

21世纪经济报道记者雷晨

60个人的团队，近八成收入来自海外市场，B端客户收入超过同赛道所有公司总和，还成了黄仁勋CES主题演讲里唯一提到的3D生成初创公司——这是1997年生的吴迪和1999年生的张启煊，在2020年还是上海科技大学学生时创办的影眸科技。

近期，影眸科技宣布完成数亿元新一轮融资，由凯辉基金、上海国投先导领投，老股东持续跟投，光源资本担任独家财务顾问。同步披露的还有新模型Hyper3D Rodin Gen-2.5的成绩：上线首月，订阅用户与年度经常性收入（ARR）环比增速均超过400%。

在AI创业普遍拼人员规模、拼烧钱速度的当下，这支核心研发人员多为“00后”的年轻团队，走了条不一样的路：不追流量故事，靠技术效率和商业化落地，在3D生成赛道站稳了头部位置。

押注AI 3D原生，把可控性做进底层

3D生成赛道的技术路线之争，在两年前就有了答案。

早年间行业主流走“2D升维”路线，用图像大模型的能力生成多视角图再转成3D模型，这条路看起来起步快，但有个致命问题：信息丢失不可逆，破面、拓扑混乱这些产业应用的硬伤，从路线根源上就解决不了。

影眸从一开始就选了更难走的“3D原生”路线——哪怕最困难的时候账上只剩一两百万元现金，也没转头走捷径。

难是真的难。做CLAY大模型的时候，整个行业可用的3D数据清洗完只有50万条，和图像、文本大模型千万级的数据量根本没法比。但影眸用这50万条数据训出了可用的3D原生大模型，相关研究入围2024年SIGGRAPH最佳论文提名，直接证明了这条路线走得通。之后整个行业的技术路径开始转向，3D原生成了共识。

先发优势不只是时间差。从CLAY开始，影眸就把“可控性”刻进了模型预训练的底层——这成了现在专业用户选择他们的核心理由。

“到现在这个阶段，很难说哪个模型的绝对效果能百分百超过同行，但在可控性上，我们和同行拉开了明显差距。”张启煊说。对专业创作者来说，可控性不是加分项，是选工具的必选项：能控制生成形状、能用自然语言做局部修改、能自动把模型拆成不同部件，甚至支持导入其他平台生成的模型做二次编辑——这些能力是和模型底层一起长出来的，不是后期打补丁能加上的。

这次发布的Rodin Gen-2.5，是全球首个千万面级3D生成模型。千万面的价值不是参数堆料，更像摄影里的RAW格式：保留最完整的细节当“母版”，游戏、影视行业的美术人员可以在高模上雕刻细节，再烘焙成低模用在实时场景里；3D打印行业则能直接用高精度模型出成品。配合五档可调的“思考深度”，生成时间从4秒到80秒可控，能覆盖从快速出稿到极致精模的全场景需求，配套的12K原生3D贴图，精度已经超过实景扫描效果。

60人小团队，把人效拉满

成立六年，影眸的团队规模一直控制在60人左右，对比大模型赛道动辄几百人的团队，影眸显得格外克制。

但小团队不等于低产出。影眸是目前唯一连续多年拿到SIGGRAPH最佳论文及提名的商业公司，算法团队每2个人里就有1人拿过该会议的最佳论文或提名，约70%的科研成果能直接转化成产品功能。

人效差距从哪来？吴迪总结了三个原因：

一是内部不搞赛马，认准3D原生这条路线就把绝大多数资源砸进去，少了很多内耗；二是算法优化带来的成本优势，同行要达到同等效果，训练成本大概是影眸的5到6倍；三是小团队天然的低消耗，没有冗余的流程和岗位。

年轻是这支团队的另一个标签。团队架构非常扁平，很多前沿研究方向直接让本科生牵头。“AI时代，做算法的本来就是年轻人。”吴迪说得很直接。研发流程也拆得足够细：UV、材质、拓扑每个模块独立，任何人有想法都能提，讨论可行就立刻上手，加上AI工具辅助，很多验证性实验一周就能出结果。

极高的人效也体现在人才稳定性上：算法团队从成立到现在只离开了3个人，分别去了英伟达、迪士尼研发部门和腾讯。

八成收入来自海外，客户覆盖英伟达、Lowe's

技术和效率的优势，最终直接兑现成了收入。

影眸的收入结构有两个很鲜明的特点：海外占比高，B端付费能力强。目前公司70%-80%的收入来自海外，核心市场在北美；积累的B端客户收入超过同赛道其他公司的总和，覆盖游戏、电商、具身智能、空间计算等高价值场景。

最硬的背书来自行业头部客户。今年CES黄仁勋主题演讲中展示的英伟达内部3D资产生成工作流，其3D生成环节用的就是Hyper3D Rodin——影眸是这个工作流里唯一的3D生成初创公司。全球第二大家居建材零售商Lowe's，用他们的模型落地了超过3万个SKU的3D资产目录，单模型成本控制在1美元以内，分钟级就能生成，这些模型用在全球1750多家门店的数字孪生系统里，每个月有超过1亿用户在线“逛店”时会看到。

除此之外，Unity、OctaneRender等专业引擎，Canva、Figma等设计平台，也都先后接入了影眸的3D生成能力。

目前影眸已经实现数千万美元的ARR，新模型发布后，B端和C端的收入比例大概是6:4。值得注意的是，这里的C端不是普通消费者，而是建模师、3D打印爱好者、产品设计师这类专业用户——其中一半左右是游戏行业从业者，要么是Roblox创作者，要么是用3D模型解决多视角图不一致问题的原画师。

一个很有意思的转化路径是：大部分B端客户，都是先以个人身份用C端产品，觉得好用之后才找到公司谈企业采购。“C端用户可能因为我们没打太多广告知道得少，但B端客户做几十万美元的采购决策时，会把所有产品横向比一遍。”吴迪说，这也是为什么影眸的B端客户能攒下这么多。

现在影眸的商业化方式很清晰：平台订阅、B端API合作、私有化部署，以及直接提供最终资产。在张启煊看来，3D生成是个足够健康的生意：单位算力成本结构比其他模态好，加上算法带来的成本壁垒，商业模型的可持续性比很多AI赛道强。

字节、美团、红杉参投，下一步啃场景生成

影眸的融资节奏，一直和产品迭代踩在同一个步点上。

2024年年底，字节跳动、美团龙珠联合领投数千万美元时，Rodin Gen-1刚发布半年，公司已经积累了数百家企业客户；2025年9月蓝驰创投领投，字节、红杉中国种子基金跟投的数千万美元融资落地时，Gen-2发布，推出了行业独有的AI自动拆件能力；2026年1月Gen-2 Edit上线，实现自然语言局部编辑，3D生成正式进入可编辑阶段；这次2026年6月的数亿元融资，正好卡在Gen-2.5发布的节点。

吴迪对记者表示，未来三年，核心场景还是在专业领域，主要做两件事：继续把底层模型的生成质量往上提，补全编辑、Agent这些能力，让专业用户用得更顺手。

更长期的布局在场景级生成。

“不管是游戏还是室内设计，真正商用的时候很少只用单个3D模型，本质都是场景级的需求。”张启煊说。他们2025年拿到最佳论文的CAST项目，就是做场景生成——要理解物体之间的支撑关系、位置关系、使用语义，生成符合常识的完整场景。从论文发布到现在近一年半，团队已经解决了多模块级联崩溃的问题，做了端到端优化，已经能稳定生成完整场景。

除此之外，具身智能是正在起量的新场景。影眸的模型已经支持一键导出可用于物理仿真的资产，不少具身智能公司已经在用他们的模型生成训练数据，相关的可互动资产也已经在给B端客户交付。

显示更多