瞭望元宇宙|數(shù)字人闖入元宇宙 ,虛擬形象究竟蘊含多少可能?

2022年12月06日 13:32   21世紀經(jīng)濟報道 21財經(jīng)APP   張梓桐

21世紀經(jīng)濟報道記者張梓桐上海報道

編者按

元宇宙(Metaverse),這個來源于科幻小說的概念,已成為真實世界中的流行語。圍繞這一新興概念,一場產(chǎn)、學、研的實踐正在展開。數(shù)字化轉(zhuǎn)型中,元宇宙能否擔當大任?這些新概念在中國語境下如何落地?南財合規(guī)科技研究院數(shù)字娛樂課題組策劃了《瞭望元宇宙》系列報道,以期為行業(yè)和社會公眾提供理解元宇宙的敲門磚。

數(shù)字人作為元宇宙的“原住民”,成為了近年來業(yè)界與學界討論的重點,目前業(yè)界普遍認為,數(shù)字人的大規(guī)模應用依賴于高寫實度的效果、好的生產(chǎn)效率和可控的成本。但與此同時,終端的運行疊加算力上的需求對實時云渲染能力形成了挑戰(zhàn)。系列報道第六篇,我們探討元宇宙賴以運行的底層技術(shù),以及其背后的實際產(chǎn)業(yè)應用。

近年來,隨著人工智能、虛擬現(xiàn)實等新技術(shù)的快速發(fā)展,虛擬數(shù)字人開始進入普通人的生活。而在新奇的外觀形象、靈巧的互動效果之外,行業(yè)也正在挖掘出數(shù)字人更多的潛力。

“未來數(shù)字人的發(fā)展,正呈現(xiàn)出靜態(tài)向動態(tài)、2D向3D、卡通向?qū)憣崱蜗蛳蚨嘞蚧拥内厔荨!蔽殿I(lǐng)時代創(chuàng)始人兼CEO郭建君在接受21世紀經(jīng)濟報道專訪時表示,數(shù)字人領(lǐng)域目前已經(jīng)度過萌芽期,進入了快速成長階段,不久的將來會迎來爆發(fā)期。這也意味著行業(yè)開始進入商業(yè)化變現(xiàn)探索的關(guān)鍵階段,標準化也將逐漸建立。 

但在豐富的想象空間之外,一些落地的問題仍然困擾著從業(yè)者與用戶。在未來,數(shù)字人是否可以實現(xiàn)高度實時性,高度可靈活性和高度適應落地場景,并與人類進行有效的交互,仍有待時間去驗證。

面臨品質(zhì)成本雙難題

中國人工智能產(chǎn)業(yè)發(fā)展聯(lián)盟發(fā)布的《虛擬數(shù)字人發(fā)展白皮書》顯示,“虛擬數(shù)字人”一詞最早源于1989 年美國國立醫(yī)學圖書館發(fā)起的“可視人計劃”(Visible Human Project, YHP)。2001年, 國內(nèi)以“中國數(shù)字化虛擬人體的科技問題”為主題的香山科學會議滴174次學術(shù)討論會提出了“數(shù)字化虛擬人體”的概念。

但在當時,這些“虛擬數(shù)字人”主要是指人體結(jié)構(gòu)的可視化,以三維形式顯示人體解剖結(jié)構(gòu)的大小、形狀、位置及器官間的相互空間關(guān)系。與當下所探討的元宇宙中的“原住民”數(shù)字人有較大的含義出入。

近五年得益于深度學習算法的突破,數(shù)字人的制作過程得到有效簡化,虛擬數(shù)字人開始步入正軌。

同時,這也吸引到政策層面的關(guān)注。

2022年8月,北京市經(jīng)濟和信息化局發(fā)布了國內(nèi)首個數(shù)字人產(chǎn)業(yè)專項支持政策——《北京市促進數(shù)字人產(chǎn)業(yè)創(chuàng)新發(fā)展行動計劃(2022—2025年)》(以下簡稱《計劃》)。《計劃》提出,抓住以數(shù)字人為代表的互聯(lián)網(wǎng)3.0創(chuàng)新應用產(chǎn)業(yè)機遇,充分發(fā)揮國際科技創(chuàng)新中心建設(shè)優(yōu)勢,打造數(shù)字人產(chǎn)業(yè)創(chuàng)新高地。

《計劃》提出了發(fā)展目標,“到2025年,北京將培育1—2家營收超50億元的頭部數(shù)字人企業(yè)、10家營收超10億元的重點數(shù)字人企業(yè),建成10家校企共建實驗室和企業(yè)技術(shù)創(chuàng)新中心,打造5家以上共性技術(shù)平臺,培育20個數(shù)字人應用標桿項目,建成2家以上特色數(shù)字人園區(qū)和基地等目標。”

但行業(yè)現(xiàn)狀似乎與《計劃》提出的目標仍有一定距離,21世紀經(jīng)濟報道記者多方了解到,目前來看,一些企業(yè)在打造數(shù)字人的過程中仍會遇到渲染品質(zhì)較低、制作成本高昂,IP打造周期長等難題。

京東集團副總裁、京東智能產(chǎn)品與服務(wù)部總裁何曉冬在接受21世紀經(jīng)濟報道采訪時表示,數(shù)字人是數(shù)字原生、人機交互等技術(shù)落地過程中最被寄予希望的形態(tài)之一,但在實際應用的過程中,有些數(shù)字人的動作十分僵化,只能起到展示的效果,無法提供實際辦理業(yè)務(wù)的交互。

何曉東以銀行場景的數(shù)字人舉例稱,如果數(shù)字人要把整套銀行業(yè)務(wù)辦理好,需要克服幾個非常落地的問題。“首先是需要避免噪音,因為銀行柜臺是比較噪雜的場所。其次是銀行數(shù)字人需要和后臺的業(yè)務(wù)支持系統(tǒng)有效地對接,必須能夠解決很多銀行的具體業(yè)務(wù)問題。”何曉東舉例稱,轉(zhuǎn)賬、取錢、改密碼等業(yè)務(wù)行為都意味著數(shù)字人在知識推理、語音推理等方面都要達到很高標準,因此這些方面的同步也是很大的挑戰(zhàn)。

三種商業(yè)模式 

郭建君在采訪中也表達了類似看法,他表示,數(shù)字人成熟的背后一方面是技術(shù)整合能力,另一方面是IP運營能力。“數(shù)字人是一個產(chǎn)業(yè)鏈很長的行業(yè),既需要底層引擎技術(shù)的發(fā)展,也需要對上層工具和生產(chǎn)管線的優(yōu)化,才能同時滿足數(shù)字人形象好、生產(chǎn)效率高和成本可控的三重效果。”

而IP運營能力體現(xiàn)在對數(shù)字形象打造的思路和經(jīng)驗之上。郭建君表示,當前行業(yè)較為普遍的情況是,技術(shù)制作更有信心,運營思維比較欠缺。在這方面,蔚領(lǐng)時代正在探索的一條道路是——選擇更專業(yè)的生態(tài)伙伴合作進行商業(yè)化。

近日,蔚領(lǐng)時代與文娛企業(yè)海西傳媒集團組建了獨立運營的公司蔚海燦娛,推出了龔俊的數(shù)字人“霽風”,郭建君表示,后續(xù)將圍繞可互動數(shù)字IP的矩陣搭建、共創(chuàng)虛擬空間的構(gòu)建等方面進行多重合作。

值得一提的是,利用契合特定場景的IP加快表演型數(shù)字人創(chuàng)新也是《計劃》的規(guī)劃的主要任務(wù)之一,其提出要“促進技術(shù)人才與藝術(shù)人才聯(lián)合創(chuàng)新,加快數(shù)字人IP孵化,培育創(chuàng)作者經(jīng)濟。同時打造精品數(shù)字人品牌,支持數(shù)字人參與廣告營銷、品牌代言,加強數(shù)字人運營管理,樹立傳播正能量的數(shù)字人形象。” 

事實上,IP運營,客戶服務(wù)和流量變現(xiàn)正是當前數(shù)字人主要的三種商業(yè)模式。

騰訊云近日發(fā)布的《數(shù)字人產(chǎn)業(yè)發(fā)展趨勢報告(2023)》指出,內(nèi)容/IP型數(shù)字人主要依靠數(shù)字人的商業(yè)IP運營實現(xiàn)商業(yè)變現(xiàn),功能服務(wù)型是交付給客戶實現(xiàn)變現(xiàn),而虛擬分身則需要結(jié)合虛擬空間的設(shè)定和規(guī)則進行流量變現(xiàn)。

“數(shù)字人的制作成本和周期伴隨定制化程度的下降而遞減。三種數(shù)字人的制作方式和周期也存在差異,內(nèi)容/IP型數(shù)字人更多是項目制,以定制為主;功能服務(wù)型是產(chǎn)品和定制化相結(jié)合,在通用產(chǎn)品上,進行定制化開發(fā);而虛擬分身更多是產(chǎn)品制,用戶利用平臺工具產(chǎn)品進行數(shù)字人形象的制作并在相應虛擬場景內(nèi)進行活動,一般而言,內(nèi)容/IP型數(shù)字人的成本和周期最高,虛擬分身型數(shù)字人最低。”

大規(guī)模應用依賴可控成本 

“數(shù)字人的大規(guī)模應用,有三個條件必不可少:高寫實度的效果、較高的生產(chǎn)效率和可控的成本。”在郭建君看來,雖然對比傳統(tǒng)離線渲染的影視級別的寫實度效果仍然需要提升,但當前行業(yè)應用的實時渲染的技術(shù),在生產(chǎn)效率、可控成本和數(shù)字人可互動性上均具備了優(yōu)勢。

科技部信息通信專家、上海流程智造科技創(chuàng)新研究院院長賀仁龍告訴21世紀經(jīng)濟報道記者,構(gòu)造虛擬世界的技術(shù)正在逐漸成熟,應用的場景也日益豐富,效果也十分逼真。但在感知交互方面,數(shù)字人仍然面臨著一系列問題。”

“在創(chuàng)建元宇宙的過程中,會構(gòu)造一個世界的秩序和邏輯,但這個世界是否有重力,重力又是多少,目前來看都是技術(shù)需要探索的方向。同時,虛擬世界的邏輯需要規(guī)律和算法生成,在這其中,如何有效地使數(shù)字人在視覺、聽覺之外,與用戶進行觸覺感知交互,也是行業(yè)面臨的難題。”

“未來超寫實的世界將以可視化為主要特征。而這需要海量的圖形運算。”郭建君認為,VR/AR終端將成為元宇宙的入口,但終端的運行依賴算力高速的運行,這其中,實時云渲染能力解決的就是把超寫實的世界帶到終端體驗上的問題。

“只有云端實時渲染在達到較高標準的情況下,才能真正帶來足夠?qū)憣崱⒒印⒂谐两械膱D像畫質(zhì)。這也就是蔚領(lǐng)時代認為的GaaS(Graphics as a Service)時代到來的邏輯依據(jù)。”

郭建君認為,未來支撐實時云渲染的底層技術(shù)主要是云原生的技術(shù),比如多GPU協(xié)同渲染,以及C+S架構(gòu)來實現(xiàn)的單個進程輸出幾十路視頻流供幾十個玩家游玩的技術(shù)。“這些創(chuàng)新的云原生的技術(shù)是未來元宇宙的支撐,同時圍繞著類似云游戲的串流能力和云端虛擬化的能力,也是未來元宇宙所需要的。”

“一個可喜的現(xiàn)象是我們看到頭部渲染引擎的技術(shù)發(fā)展迅速,現(xiàn)在已經(jīng)開始進行影視級效果的應用了。”郭建君說道。

在云原生技術(shù)之外,3D重建技術(shù)的發(fā)展也為數(shù)字人的大規(guī)模落地帶來了更多的可能性。

上述《報告》指出,2D數(shù)字人和3D數(shù)字人生成/建模方式不同,2D數(shù)字人本質(zhì)是生成圖像,因此主要方式是利用深度學習技術(shù)根據(jù)視頻生成與真人相同的圖像,技術(shù)相對成熟。

“3D數(shù)字人需要建立3D模型,主要是利用軟件傳統(tǒng)的手工建模、靜態(tài)掃描建模(相機陣列掃描建模)、動態(tài)光場或者AI建模(3D重建技術(shù))生成3D模型。目前手工建模和靜態(tài)掃描建模技術(shù)較為成熟且應用廣泛,利用3D重建技術(shù)或動態(tài)光場重建可極大節(jié)約建模時間,提升建模效率,是未來重要布局方向。”報告指出。

而在科大訊飛總裁吳曉如看來,機器想更自然地與人類進行交互,需要通過聽覺、視覺、語義以及各種傳感器的組合去獲取更多的有用信息,AI感知方式必然要從單模態(tài)發(fā)展到多模態(tài),逐步擬人化。

2021年10月,科大訊飛正式發(fā)布AI虛擬人交互平臺,它具有多模感知、多維表達、情感貫穿、自主定義四大交互特點。可以在客戶的不同業(yè)務(wù)場景下進行AI虛擬人賦能,提供一站式的AI虛擬人應用服務(wù)。

“科大訊飛推出的數(shù)字人目前已經(jīng)開始把視覺、手勢、視線和語音結(jié)合起來,實現(xiàn)數(shù)字虛擬人交互的多維表達。”吳曉如在接受21世紀經(jīng)濟報道等媒體采訪時說道。

出品:南財合規(guī)科技研究院數(shù)字娛樂課題組

策劃:曹金良

統(tǒng)籌:諸未靜

研究員:諸未靜、蔡姝越、孫煜、吳立洋、張梓桐

本期作者:張梓桐

設(shè)計:陳珊

關(guān)注我們

无码av免费毛片观看一区二区,欧美亚洲国产人成aaa,国产精品无码不卡无码不卡,精品视频一区二区三区四区五区
亚洲产精品VA在线观看 | 在线看片一区二区 | 丝袜亚洲另类欧美变态 | 中文字幕国产精品 | 亚洲成在人线在线播放 | 日韩欧美精品一区二区二区不卡 |