当前位置:首页 > 房产 > 正文

抢在其他大厂前,腾讯要做3D版的“秒剪”

  • 房产
  • 2025-01-24 03:42:07
  • 8

界面新闻记者 | 陆柯言

界面新闻编辑 | 文姝琪

在3D生成大模型赛道,腾讯跑在了大厂的最前面。

1月22日,腾讯上线了首个一站式3D内容AI创作平台——混元3D AI创作引擎2.0,并正式宣布开源。新版本包含基础模型生成、3D功能矩阵、3D编辑、3D生成工作流、创作素材库等功能,目前已面向用户和开发者开放。

该引擎支持文生及图生3D。用户输入中/英文提示词,描述主体内容、特征、风格等,即可快速生成生成4个3D模型,同时,也支持上传单图生成3D模型。效果上,可以选择不同纹理风格进行生成。对比去年11月发布的1.0版本,2.0版本在生成效果上有明显提升。

AI正在3D模型生成中扮演日渐重要的角色。游戏制作、社交、电商广告、工业制造、具身智能、自动驾驶、AR/VR、三维打印等多个领域都已开始应用AI能力辅助3D内容生产。以游戏制作为例,3D管线(即将 3D 场景数据转化为最终呈现在屏幕上的 2D 图像)是最为核心的环节之一,但同时也最考验时间和资金成本。

美术成本往往占一款游戏开发总成本的50%,而3D模型成本占美术总成本的30%~40%。锦秋基金报告中也提及,一个十万面以上的3D高模资源,厂商如果委托外包团队生产,价格至少需要3万元,时间需要30-45天。如果在3D资产库购买,除了存在可选资产有限的问题,通常也需要5-10人/天进行清洗才可以使用。

而3D生成大模型能够在很大程度上改变这种现状。腾讯游戏在研项目研发制作人王智刚提到,混元3D AI创作引擎已经开始支持腾讯游戏、地图、元宝等业务的部分需求。以游戏为例,在混元的支持下,腾讯游戏业务3D资产制作时间成本可从5-10天级别下降到分钟级。对于微信小游戏这类轻度游戏的3D生成需求,也基本可以实现覆盖。

对3D模型生成有高频需求的不止是游戏行业。当AI走向更高阶的水平,它将不仅限于对文本、图像、视频等1D或者2D内容的理解,而是不断发展成理解真实物理世界的三维空间,这也是具身智能、自动驾驶等厂商的刚需。它们很难在现实中采集到全面、多样的训练数据,而AI生成的3D模型则能够补充这种能力。

腾讯混元3D负责人郭春超透露,目前已经有一批具身智能、自动驾驶厂商来寻求合作。

不过,相比起文生图等较为成熟的生成式AI应用,3D模型的技术成熟度还远远不够。郭春超认为,3D模型面临的主要挑战之一是数据量不足。相较于文本和2D图像数据,可供训练的3D数据并不多,且经过标注和语义匹配的3D数据则更为稀缺。对于3D数据的积累,也将是未来3D模型生成企业的一项核心竞争力。

“3D模型生产的视觉合格率仅用一年时间就从20%提升到60%的水平,发展非常快。但是相比于生文达到95%,生图达到90%以上,它的成熟度、可用性仍然处在前半赛场。”郭春超说。

在此前大厂纷纷重注的文生图、文生视频等领域,腾讯的动作在国内互联网大厂中相对较慢,但却是最早下场做3D生成大模型的互联网大厂。原因或许在于,腾讯自身的业务具有大量相关需求,这同时也让腾讯对其中的商业价值更为敏锐。郭春超认为,3D生成大模型面向游戏行业的商业价值确定性非常高,国内有百万级游戏从业者,背后是百亿乃至千亿级的市场。

其他大厂也开始在3D领域排兵布阵。今年年初,美团旗下龙珠资本与字节跳动联手领投了一家名为影眸科技的3D生成大模型公司,后者目前已经获得数百万元企业端商业化订单。除了影眸之外,国内另一家备受资本追捧的国内厂商是VAST,创始人宋亚宸曾在商汤科技及MiniMax任职,目前公司超过400家。

郭春超认为,腾讯与上述厂商的区别在于,它不仅仅定位于专业的3D工具,更想成为一款低门槛、覆盖面广的一站式创作引擎,用户可以在上面自由创作、生成、编辑,相当于3D版的“秒剪”。在他看来,目前的2.0版本还远未达到上限。春节过后,它还将开放类似三维场景漫游等更大的场景生成,可应用于AR、VR、线上展馆等领域。

相较于初创公司,腾讯的优势在于能够以更低的成本从自身业务中积累数据,也能从中找到大量应用场景。但不同行业对3D生成效果的要求也大不相同,腾讯需要拿出更多资源来应对初创公司对细分行业的针对性打磨。

不过,AI生成3D模型赛道还远未到达“Sora”时刻。技术角逐才刚刚开始,这些公司仍然有足够的时间和金钱来应对挑战。

有话要说...