观察丨从技术原理看元宇宙的可能性Omni
2024/10/6 来源:不详北京中科白癜风出席健康中国公益盛典 http://www.bdfyy999.com/bdf/zhongkedongtai/meitibaodao/102471.html
来源:澎湃新闻
澎湃新闻记者邵文
从元宇宙成为热词至今,外界对其的态度逐渐从好奇转向怀疑,似乎又多了一个新的泡沫,一个用来“涨估值”的概念。这背后的原因可能就在于人人都在讨论元宇宙,但好像没有人能真正说清楚什么是元宇宙。
对于这种现状,科幻作家陈楸帆认为,当下大可不必过多地探讨定义本身,“因为对于一个正处于进行时态中的概念,定义便意味着局限。当元宇宙还没有完全成型的时候,一千个人眼中会有一千个元宇宙,而置身其中的每个人都会如盲人摸象般,有全然不同的角度、诉求和观感。”
对于元宇宙的学术讨论也有很多,中央民族大学文学院副教授安静在中国中外文艺理论学会第19届年会论文中写道,“自从奥卡姆的威廉和中世纪唯名论的哲学家以来,世界的本体性就产生了至少两个分层,一个是我们可以感知的物理世界,一个是由各种符号所构造的无数个可能世界。在符号的世界中,一直以来有两个基本的分野,那就是自然科学与人文科学。”
安静认为,进入元宇宙的世界,符号指称的内外之别从此消失,它重新回到唯名论语境下的中立状况,它指向一个构造的平行世界,也指向人的观念意识,还意味着符号本身和人本身无限缩小的关系。
似乎非常抽象,简单抓住一个易理解的关键词“平行世界”,某种程度上可以将元宇宙理解为“造世界”,用符号构造出无数个与物理世界体验非常相似的虚拟现实世界。“意思就是把现实中的事物进行数字化并复制出一个平行世界,我们每个人都可以拥有一个数字化的虚拟替身——阿凡达。这个替身可以在数字化场景中做任何事情,同时又会反过来影响现实世界,俗称打破次元壁。但这只是最为粗疏的描述,其中每一个名词都能分岔出无穷无尽的细枝末节。”陈楸帆在一篇文章中写道。
本篇文章希望从技术的角度,通过具体案例认识元宇宙背后“造世界”的工作原理,以此去合理设想元宇宙的未来可能。
在开始之前,我们可以先自问一个问题——我们是如何知道火星是什么样?
从没有亲眼见过,没有天文学、天体物理学知识积累,我们是如何建立起对火星的认识的?
如何“造”火星?
一个重要的来源可能就是各种相关的科学纪录片。那么科学纪录片中如此仿真的影像是怎么来的呢?要知道,太空中的很多画面不可能全程录像拍摄。比如科学纪录片《你好!火星》,制作团队需要精确还原当时的探火过程,而这个过程是不可能被由各个角度拍摄出来的。那要如何准确构建这个过程?
“在这种情况下,每个镜头、每个点都要进行精确剖析,客观地、真实地反映科学数据。”中央广播电视总台《你好!火星》纪录片技术负责人王子健对澎湃新闻( 据王子健介绍,这个精确还原的过程通过Omniverse完成,“我们使用了USD模型,其优点就在于完全基于科学计算,能够一比一对照真实世界的场景,比如火星车和探测器。我们从科工局拿到火星探测器的脱敏数据,当时资料只有点云数据,Omniverse基于点云数据形成带有拓扑的多边形模型,然后存储成USD变成数字资产,在纪录片制作中就很方便可以直接使用。”
Omniverse是英伟达在年推出的实时3D设计协作工具,黄仁勋曾在GTC大会上介绍道,“Omniverse可以让个人模拟制造出遵从物理规律的共享3D虚拟世界”。USD(UniversalSceneDescription,通用场景描述)则是Omniverse的基础。
USD最早来自动画公司皮克斯(Pixel)。在动画的制作流程中,不同的分工会涉及不同的设计软件工具,那么在协同工作时,就需要进行格式转换等繁琐工作。后来,皮克斯提出统一场景的格式USD并在年对其开源,不同软件制作的3D内容由此可以统一使用USD格式,《驯龙高手3:隐秘的世界》就是用此方法制作出来。
“以PPT举例,可能5个人打开同一个PPT,公用数据流,一个人的更改另一个人可以马上看到。基于USD格式,则是在三维场景,一个人的更改另一个人可以即时看到,方便沟通和协作。”英伟达高级解决方案架构师宋毅明对澎湃新闻( 王子健则以自己的实际工作内容举例,“最早期要拿三维软件做,做完一个模型要贴图,最后成为一个场景,渲染出来就变成照片输出,如3dsMax存储格式是3DS。但各个软件形成资产只能是自己的工程文件,资产的意思即能够交互,各家如果是自己的文件格式交互起来非常困难。这会造成什么结果呢?就是A软件模型做得挺好,B软件打开之后还得再去修改,修改之后的东西A软件再打开又需要再修改。”
USD的模式就基于标准化的数据结构,呈现的质量可以保证一致,即光照、色彩、整个模型本身材质表现都是统一的,所以在此基础上就可以实现协同创作。
“如果数字资产不能标准化,其实数字协同是没有办法实现的,所谓的协同工作就是空谈。”王子健继续说道。
怎么理解这里的“数字资产”,为什么数字协同如此重要?
数字资产、数字协同与实时光线追踪技术为什么重要?
据王子健解释,如果是以USD作为格式进行保存就可以被多个软件复用,从而这个格式的文件就被叫做数字资产。数字资产还有第二个功能即可迭代,这个迭代不被破坏。“比如我造了一个月球车,这个月球车是第一个版本,如果我造第二个版本起码得另存一个,然后就得破坏性地改。但USD可以避免这个问题,即在原有的基础上进行版本控制‘小修小改’。这样的话对数字资产的保存就会形成复用,也有了可追溯的可能性。”
那么在此基础上,才有了数字协同的可能。
在原来传统的模式下,整个线性的工作流程下,视觉导演到最后一刻才能看到完整的成片,如果有改变那么一切都要相适应调整,甚至从头改。这样损耗就非常大,造成的直接结果就是制作周期显著拉长,伴随的还有人员以及设备的开销,整个花费就会剧增。
而基于实时的迭代模式,最重要的改变就是实现了“所见即所得”。也就是说,视觉导演能够观察到每一步,看到模型、场景,包括气氛等各种各样的元素摆在一起呈现的样貌,同时针对现有实时呈现的画面反过来即时修改台本。这就不只是单纯制作上传下达的任务模式,而是一个互相依托的迭代创作模式。
更进一步说,这样的技术支持下,创作思路实时的更改和变化可以直接被相关工种实时反应、迭代和呈现,这也是数字协同的意义。
另一个重要的技术进步则是实时光线追踪。年,英伟达发布了实时光线技术,将实时光线追踪与AI结合起来落地应用。
“光线追踪是一个理论,基于光线追踪这套理论才能完全模拟现实世界,做到模拟现实世界的渲染。年英伟达推出实时光线追踪技术,某种程度上算是倒逼工业流程,以前很多做不了的事情都可以做了。”王子健说道。
具体而言,比如一束光打到瓶子上,这样一个镜头可能有五秒钟。按照央视的标准一秒钟要渲染五十张照片,五秒钟就是二百五十张照片,以一张照片渲染八个小时计算就是小时。如果这个时候导演发现机位错了,需要重新再来一遍,那么小时就没用了。
实时光线追踪技术以后,小时就变成实时了,一秒钟能直接渲染五十张。这又关联到之前传统的线性工作模式,“为什么之前是线性的?因为大家都 “实时光线追踪技术让我们看到一个新的可能,它可能会给创意市场增加-亿美金市场,促进设计师用这样的技术做出他的作品。有了图形可视化与AI之后,后来发现还可以结合以前做的物理学引擎、XR技术,之后就进一步衍生出把这个技术打造成一个平台的想法。后来发布的Omniverse就是包含各种渲染技术提升的结果。”英伟达中国区Omniverse业务发展经理何展表示。
对于最新的技术进展,王子健则表示,“在此基础上现在又在进一步增强,使得实时渲染高质量照片级的结果越来越高,多个渲染器之间可以无缝衔接,一个场景一个按钮,比如把Real-time改成Penetrating。最后就是物理模拟、机械单元组的模拟,等于是可以通过虚拟的数字世界控制现实世界。”