本周,2021年中國(guó)國(guó)際服務(wù)貿(mào)易交易會(huì)在北京落下帷幕。在此次的服貿(mào)會(huì)上,新技術(shù)和新產(chǎn)品層出不窮。其中,利用了人工智能技術(shù)的虛擬數(shù)字人主播尤為惹人關(guān)注。
據(jù)介紹,這些虛擬數(shù)字人主播采用了TTS數(shù)字語音合成、計(jì)算機(jī)圖像處理、NLP自然語言處理等人工智能技術(shù),主要用于各個(gè)短視頻平臺(tái)的電商直播間,可以7×24小時(shí)不間斷進(jìn)行直播。數(shù)字人主播不僅可以實(shí)時(shí)與觀眾進(jìn)行互動(dòng),還能表演各類才藝,從而引導(dǎo)觀眾停留更長(zhǎng)時(shí)間。
除了數(shù)字人主播之外,本屆服貿(mào)會(huì)上還展示了諸多數(shù)字人技術(shù)的實(shí)際應(yīng)用。凌云光對(duì)外展示了冬奧手語播報(bào)數(shù)字人系統(tǒng),這一系統(tǒng)將在北京東奧會(huì)期間正式投入應(yīng)用進(jìn)行賽事報(bào)道,為聽障人士提供更加便捷的服務(wù)。
無獨(dú)有偶,近期新華社媒體融合生產(chǎn)技術(shù)與系統(tǒng)國(guó)家重點(diǎn)實(shí)驗(yàn)室與騰訊互娛NExT Studios工作室共同打造的全球首位數(shù)字航天員、新華社數(shù)字記者小諍也發(fā)布了更多信息。
今年6月份,新華社已經(jīng)陸續(xù)發(fā)布了多條有關(guān)中國(guó)空間站的介紹視頻,向大家介紹空間站情況的就是這位數(shù)字記者小諍。三位航天員返回地球之前,小諍還會(huì)持續(xù)地輸出航天科普內(nèi)容。
二十世紀(jì)七十年代開始,“數(shù)字人”這個(gè)概念就已經(jīng)誕生。隨著近幾年人工智能技術(shù)的不斷演進(jìn),游戲行業(yè)中涌現(xiàn)的一些新技術(shù)讓數(shù)字人的制作過程得到了有效地簡(jiǎn)化,使得數(shù)字人成功地進(jìn)入了公眾的視野之中。
現(xiàn)在數(shù)字人不僅達(dá)到了照片寫實(shí)級(jí)逼真程度,還具備了表達(dá)情感和溝通交流的能力。一些廠商使用數(shù)字人技術(shù)應(yīng)用到大眾娛樂中,虛擬偶像就是數(shù)字人技術(shù)蓬勃發(fā)展下的新風(fēng)口。
然而,數(shù)字人可以發(fā)揮的效用遠(yuǎn)非娛樂產(chǎn)業(yè)那么簡(jiǎn)單。虛擬互動(dòng)技術(shù)的擴(kuò)展,讓數(shù)字人已經(jīng)可以發(fā)揮一些常人無法企及的作用,尤其是醫(yī)學(xué)、礦學(xué)和航天學(xué)等精細(xì)或危險(xiǎn)領(lǐng)域。未來,數(shù)字人技術(shù)勢(shì)必會(huì)進(jìn)一步發(fā)揮其社會(huì)價(jià)值,造福全人類。
要了解一個(gè)事物,首先要明確他的定義。籠統(tǒng)地說,通過3D圖像軟件或其它模擬仿真工具制作,以數(shù)據(jù)形式存在的人與類人角色,都可以算作數(shù)字人。與具備實(shí)體的機(jī)器人不同,數(shù)字人依賴顯示設(shè)備存在。人類的外觀、行為和思想是判斷數(shù)字人的三個(gè)重要特征。
上世紀(jì)90年代,美國(guó)科學(xué)家們就提出了可視人計(jì)劃。這一計(jì)劃的目的就是要把人體進(jìn)行數(shù)字化,然后在電腦中合成三維的人體結(jié)構(gòu)。這一計(jì)劃也被看作是數(shù)字人的雛形。自此之后,數(shù)字人技術(shù)開始了漫長(zhǎng)的發(fā)展之路,一直延續(xù)至今。
CG和動(dòng)作捕捉技術(shù)沒有出現(xiàn)的時(shí)候,人們只能用手繪來實(shí)現(xiàn)數(shù)字人的構(gòu)想。1984年,英國(guó)人George Stone創(chuàng)造出了一個(gè)叫做Max Headroom的虛擬人物,這個(gè)虛擬形象參演了一部電影,并且還拍攝了很多支廣告。受制于當(dāng)時(shí)的技術(shù)限制,Max Headroom的人物形象就是手繪完成的。
到了本世紀(jì)初,3D技術(shù)在影視行業(yè)的普及讓數(shù)字人這一話題再次活躍起來。《指環(huán)王》中咕嚕和后來《猩球崛起》里凱撒的形象,代表了CG技術(shù)與動(dòng)作捕捉結(jié)合所激發(fā)出的潛能。2007年,日本制作出世界上第一個(gè)被認(rèn)可的虛擬偶像初音未來,意味著數(shù)字人開始深入人們的生活,人們可以在公共場(chǎng)合直接看到它們。
即便是當(dāng)時(shí)的初音未來,我們也很難把他和數(shù)字人相提并論,因?yàn)樗⒉痪邆渥R(shí)別外界環(huán)境、并能與人交流互動(dòng)的能力。
近五年來,深度學(xué)習(xí)算法和人工智能技術(shù)得到了突飛猛進(jìn)的發(fā)展,數(shù)字人的制作過程得到有效簡(jiǎn)化,人們逐漸得以實(shí)現(xiàn)最初的構(gòu)想。2018年,搜狗與新華社聯(lián)合發(fā)布了全球首個(gè)全仿真智能AI主持人,拉開了數(shù)字人應(yīng)用在社會(huì)場(chǎng)景中的序幕。
數(shù)字人技術(shù)發(fā)展到今天,高保真、智能化和工具化是其三個(gè)重要的技術(shù)方向。視覺表現(xiàn)上,主流公司已經(jīng)可以做出從外形、表情到動(dòng)作都1:1還原真實(shí)人的高保真虛擬人;人工智能技術(shù)使虛擬人初具智能和情感表達(dá);而開發(fā)便捷的工具可以讓廠商們實(shí)現(xiàn)批量生產(chǎn)。
正是在這樣的技術(shù)趨勢(shì)下,催生了一批專注數(shù)字人技術(shù)的工作室,NExT Studios就是其中的代表。NExT Studios 2017年開始探索實(shí)時(shí)高保真數(shù)字人技術(shù),在高保真數(shù)字虛擬人領(lǐng)域已有數(shù)年深耕和積累,并于2018年聯(lián)合世界各地的多個(gè)先進(jìn)團(tuán)隊(duì),推出了代表當(dāng)時(shí)業(yè)界最高水平的高保真實(shí)時(shí)數(shù)字人Siren。
這些技術(shù)方向的背后,其實(shí)也帶出了數(shù)字人發(fā)展遇到的難點(diǎn)。比如英偉達(dá)在今年GTC 2021技術(shù)大會(huì)黃仁勛的演講中加入了14秒虛擬人的動(dòng)畫,而這段動(dòng)畫則騙過了所有人。
這段14秒的動(dòng)畫耗費(fèi)了英偉達(dá)極大的人力、時(shí)間和成本,難點(diǎn)就是要復(fù)制一個(gè)“以假亂真”的黃仁勛。英偉達(dá)的Omniverse平臺(tái)包辦了渲染、材質(zhì)、光影和照明等所有工序。而為了配合Omniverse平臺(tái),英偉達(dá)打造了專業(yè)的繪圖顯卡NVIDIA RTX A2000。
從結(jié)果上來看,英偉達(dá)突破了高保真的技術(shù)難點(diǎn),但這個(gè)虛擬的黃仁勛并不具備情感表達(dá),更不要說可復(fù)制性。不過,這短短14秒動(dòng)畫還是震動(dòng)了業(yè)界,因?yàn)樗麄円呀?jīng)從英偉達(dá)的身上看到了數(shù)字人技術(shù)未來無限的可能性。
技術(shù)的演進(jìn)只是數(shù)字人發(fā)展的一個(gè)方面,伴隨著技術(shù)的發(fā)展,數(shù)字人的形象和功能也在悄然發(fā)生著變化。
手繪時(shí)代的數(shù)字人,他們只能出現(xiàn)在動(dòng)畫、電影和電視中。前面提到的Max Headroom,以及同時(shí)段出現(xiàn)的《超時(shí)空要塞》里的虛擬歌姬林明美,都是類似的邏輯,觀眾無法與這些所謂的“數(shù)字人”進(jìn)行互動(dòng),只能觀看他們進(jìn)行表演。
初音未來的出現(xiàn)打破了人們對(duì)于所謂“數(shù)字人”的固有印象。一方面得益于CG技術(shù)的革新,讓那些平面的數(shù)字人變成了立體形態(tài)。同時(shí),全息影像技術(shù)的出現(xiàn),使得初音未來虛擬歌姬的身份擴(kuò)展到了線下。
2010年3月,世嘉在日本舉辦了第一場(chǎng)初音未來全息投影演唱會(huì),現(xiàn)場(chǎng)2500張門票立即搶購(gòu)一空,同時(shí)還有3萬名觀眾在網(wǎng)絡(luò)上觀看了直播。初音未來此時(shí)已經(jīng)不再是一個(gè)電視或者網(wǎng)絡(luò)上觀看的形象,而是變成了一個(gè)真正的歌手。
后來,數(shù)字人相關(guān)的一些技術(shù)在游戲領(lǐng)域取得了巨大的突破,包括了動(dòng)作捕捉以及3D建模,一個(gè)個(gè)數(shù)字人開始在游戲中不斷涌現(xiàn)。
近年來,越來越多的影視明星參與到游戲制作中,光是去年就涌現(xiàn)了《賽博朋克2077》和《星球大戰(zhàn):絕地武士團(tuán)》等多款游戲。有野心的游戲廠商大多會(huì)選擇知名影視明星進(jìn)行動(dòng)作捕捉和3D建模,制作出的主角或者NPC角色其實(shí)就是一個(gè)具備互動(dòng)能力的數(shù)字人。
到了當(dāng)下,人工智能和便捷的工具讓數(shù)字人可以實(shí)現(xiàn)批量生產(chǎn)。KizunaAI絆愛出現(xiàn)之后,立即引發(fā)了Vtuber的浪潮。Live2D搭配攝像頭捕捉技術(shù),大量Vtuber出現(xiàn)在人們的視野中。現(xiàn)在,Vtuber已經(jīng)形成了一條完整的產(chǎn)業(yè)鏈,背后代表了數(shù)字人的批量生產(chǎn)已經(jīng)走向成熟。
數(shù)字人生產(chǎn)的成熟在小諍身上也有體現(xiàn)。小諍項(xiàng)目今年3月立項(xiàng),NExT Studios抽出15名精英研發(fā)人員,和新華社團(tuán)隊(duì)密切溝通合作,完成了小諍的數(shù)字人資產(chǎn)建模與綁定。目前,小諍已經(jīng)完成了多次太空?qǐng)?bào)道,涵蓋了“天問一號(hào)”火星探測(cè)任務(wù)和中國(guó)空間站。這種效率從側(cè)面說明了當(dāng)前數(shù)字人技術(shù)的成熟度已經(jīng)到達(dá)了一定的水平。
同時(shí),數(shù)字人互動(dòng)技術(shù)的發(fā)展,則意味著它們可以扮演更多的角色,從而發(fā)揮其社會(huì)價(jià)值。比如前面提到的數(shù)字記者小諍,主要承擔(dān)了此次神舟十二號(hào)載人飛船和空間站情況的介紹。隨著技術(shù)的進(jìn)化,小諍在交互環(huán)境中的作用將被進(jìn)一步放大。今后,小諍實(shí)時(shí)與航天員進(jìn)行互動(dòng),為地面輸出具體的報(bào)道內(nèi)容將會(huì)成為家常便飯。
虛擬主播直播帶貨、數(shù)字記者報(bào)道中國(guó)空間站、祝融號(hào)數(shù)字人發(fā)回火星圖景。這些案例充分說明了數(shù)字人的功能和形象早已不再拘泥于文娛行業(yè),而是走向了各行各業(yè)。
和早期的數(shù)字人不同,當(dāng)下數(shù)字人技術(shù)上可以替代人類去處理一些高風(fēng)險(xiǎn)的工作,同時(shí)與普通人之間的連結(jié)更加緊密,親切感、陪伴感和引領(lǐng)感盡顯。數(shù)字人角色的不斷轉(zhuǎn)變,加上這些特質(zhì),讓大眾看到了它們身上的可能性和社會(huì)價(jià)值。
眾所周知,醫(yī)學(xué)是精細(xì)程度和危險(xiǎn)性都比較高的領(lǐng)域,虛擬互動(dòng)技術(shù)的擴(kuò)展讓數(shù)字人技術(shù)可以通過數(shù)字展示形式和觸控互動(dòng)方式,為臨床醫(yī)生、醫(yī)學(xué)規(guī)培生和醫(yī)學(xué)生提供完整充實(shí)的學(xué)習(xí)參考資料,彰顯了數(shù)字人在高風(fēng)險(xiǎn)領(lǐng)域的作用。
一些行業(yè)人士認(rèn)為,虛擬主播能夠大火,背后體現(xiàn)的是個(gè)體化社會(huì)中對(duì)于陪伴感需求的旺盛。當(dāng)下年輕人普遍個(gè)性較強(qiáng),表達(dá)欲旺盛,且具有一定的孤獨(dú)感。對(duì)于這部分群體而言,三次元主播很難打動(dòng)他們。
相比之下,一些脫胎于三次元真人的虛擬偶像,能夠比較快地打破第一印象,不會(huì)受到時(shí)間與空間的限制,容易打動(dòng)年輕人。比如由唱見轉(zhuǎn)型出道的虛擬藝人泠鳶yousa,憑借著優(yōu)秀的唱作能力吸引了無數(shù)粉絲。
這種陪伴感如果引入到宣教領(lǐng)域,潛力也是非常巨大的。比如前文提到的數(shù)字記者小諍,通過實(shí)時(shí)渲染、等技術(shù),鏈接用戶產(chǎn)生更多互動(dòng),打破虛擬與物理世界界限,形成IP效應(yīng)之后可以推出更多的衍生產(chǎn)品。而小諍作為數(shù)字人具有的陪伴感也能讓年輕人接受航天知識(shí)的科普。這背后體現(xiàn)的正是數(shù)字人與科技教育領(lǐng)域的結(jié)合點(diǎn)。
過去,人們把影視作品看成是向公眾普及科技知識(shí)的最佳載體,《星際穿越》就向公眾普及了什么是蟲洞,近期的《你是我的榮耀》也通過愛情劇的形式宣傳了中國(guó)航天知識(shí)。這種軟性的宣傳永遠(yuǎn)要比《火箭俠》一樣粗制濫造的作品能夠爭(zhēng)取到受眾?,F(xiàn)在,有了小諍這樣的強(qiáng)陪伴感的數(shù)字記者,航天知識(shí)對(duì)于年輕人群體將會(huì)更具穿透性。
除了上述提到的這些社會(huì)價(jià)值之外,海外數(shù)字人的社會(huì)角色更加多元,甚至已經(jīng)進(jìn)入了辦公領(lǐng)域。
上個(gè)月,F(xiàn)acebook推出了一款名為Horizon Workrooms的VR會(huì)議軟件。這款軟件最大的亮點(diǎn)莫過于營(yíng)造了一個(gè)虛擬的數(shù)字空間,在這個(gè)空間中佩戴Oculus Quest 2用戶可以自行創(chuàng)建數(shù)字人形象進(jìn)行線上會(huì)議。
Horizon Workrooms是Facebook元宇宙構(gòu)想的重要組成部分。后疫情時(shí)代,居家辦公成為常態(tài)的情況下,這種數(shù)字人構(gòu)成的線上會(huì)議將會(huì)成為行業(yè)的新趨勢(shì)。
游戲技術(shù)革新帶動(dòng)了虛擬數(shù)字人技術(shù)的進(jìn)化,實(shí)現(xiàn)了游戲與現(xiàn)實(shí)世界的連結(jié),進(jìn)而發(fā)揮更大的社會(huì)價(jià)值。數(shù)字人技術(shù)已經(jīng)將諸多不可能變成了可能,存在于科幻小說中的世界,距離我們或許真的并不遙遠(yuǎn)。
