
最近,鸿蒙系统上的3D相机火了。
打开手机拍张照片,几十秒后,一个可以360°旋转、连纹理细节都清晰可辨的3D模型就出现在屏幕上。
在日前举行的华为开发者大会上,V2Fun正式亮相,这是鸿蒙系统第一个3D大模型原生应用,该应用由极顶数创(Vertex Lab)开发。

极顶数创创始人嵇盼本科毕业于浙江大学竺可桢学院,是3D视觉、AIGC领域专家。今年,他把公司的部分研发落在了浙江大学校友企业总部经济园。
十多年前,嵇盼在浙大信电系做本科毕业设计,课题就是关于“2D转3D”。此后,他去澳洲读博,去硅谷做VR,回国后在腾讯带XR实验室团队,一路都在跟3D打交道。
以前,制作一个高精度的3D模型,要以月为单位,近几年AI大模型爆发,让效率大幅提升。然而3D数据的格式千变万化,游戏、建筑、动画各有各的标准,光是数据的收集和清理就是一道高门槛。模型架构也没法直接照搬图像或视频生成的路子,加上3D数据的总量远不如文本和图片,还要做出好的泛化效果,难度陡增。
在V2Fun的诞生过程中,从数据收集处理、模型架构设计到训练策略和工程部署,全是极顶数创团队自己做下来的。嵇盼说得很朴素:“就是不断试错,分析哪个方案行、哪个不行,找到背后的原理。”

华为选择与这个成立仅一年多的初创团队深度合作,看中的正是他们模型的还原度。“特别是在人像还原度上,我们远超其他竞品。”嵇盼说,这个指标很关键,因为用户想要的是“我的宠物”“我的孩子”,如果生成出来的东西跟原图不像,整个体验就失去了意义。
对普通用户而言,V2Fun目前最直接的使用场景是实体化。比如拍下宠物的照片生成3D模型,再通过3D打印做成手办,这种带有情绪价值的定制体验正在吸引第一批用户。

在专业端,有独立原画师用V2Fun的网页端工具,几周就把以前工作室三四年没做完的游戏小镇雏形搭了出来。还有做数字人的创作者,以前以周为单位的模型制作,现在压缩到了小时级。
当前,大模型对世界的理解停留在文字和2D图像层面,而真实世界是三维的。极顶数创团队在做的,就是给未来的3D世界模型打地基。嵇盼说,V2Fun让每个人都能低门槛创作3D内容,本质上是在为未来积累数据和素材。
把研发放到余杭,对嵇盼来说是一个很自然的选择。浙大校友企业总部经济园能把浙大人的资源链接起来,余杭政府还给了实打实的研发补贴支持。
目前,V2Fun的网页端已经在服务专业创作者,手机端从华为鸿蒙起步,明年将逐步扩展到其他终端。把3D创作的门槛从“专业团队用专业软件花数周”降到“任何人用手机花几十秒”,这条平权之路才刚刚开始。
✦
往期内容精选
