GAITC2022智媒專題論壇｜沈浩：計(jì)算重塑媒介的延伸

2022-11-29 16:09:02來源：壹點(diǎn)網(wǎng)

11月27日，在2022全球人工智能技術(shù)大會上，由CAAI智能傳媒專委會、中國傳媒大學(xué)媒體融合與傳播國家重點(diǎn)實(shí)驗(yàn)室、新浪AI媒體研究院聯(lián)合支持的“融合與發(fā)展”新智者·智能媒體專題論壇在線上舉行。中國傳媒大學(xué)媒體融合與傳播國家重點(diǎn)實(shí)驗(yàn)室大數(shù)據(jù)中心首席科學(xué)家沈浩教授分享了《計(jì)算重塑媒介的延伸》，在他看來，當(dāng)人們探索媒介，智能與物質(zhì)世界的融合延伸時，人類對局限性的理解將打破，將開啟新的視野。

圖注：沈浩教授-“融合與發(fā)展”新智者·智能媒體專題論壇

以下是沈浩分享實(shí)錄，內(nèi)容經(jīng)編輯略有刪減:

沈浩：在線的朋友們大家好，非常高興參加這樣的智能媒體專題論壇。

我今天演講主題是《計(jì)算重塑媒介的延伸》，這個話題實(shí)際上就是說媒介最早是人的延伸，但是今天的計(jì)算讓人進(jìn)一步延伸。這個延伸可以有充分的想象，是我們智能媒體驅(qū)動下的媒介延伸，也許是虛擬數(shù)字人，也許是元宇宙。但是作為媒體融合與國家重點(diǎn)實(shí)驗(yàn)室，我們主要承擔(dān)著關(guān)于思考媒介的未來媒體形態(tài)，媒介的服務(wù)模式，媒體的智能信息處理與國際傳播問題。

前段時間參加了非常小規(guī)模的人工智能與國際傳播論壇，當(dāng)時參加這個論壇大家會思考說人工智能和國際傳播有什么樣的關(guān)系。

為了應(yīng)景當(dāng)時找了三個叫做“化身”或者“數(shù)字人”，他可以用多種語言，從口唇、姿勢、形態(tài)，最重要的是自然語言生成，即直接用文本生成一段視頻，這段視頻幫助我們解讀了想表達(dá)的內(nèi)容。所以在科學(xué)和藝術(shù)融合時代，媒介是一種可穿戴設(shè)備，未來可穿戴設(shè)備可能是一種媒介。

1964年麥克·盧漢在《理解媒介》時特別關(guān)注到了媒介是人身體的延伸，這句話對于麥克·盧漢來講，大家說他瘋言瘋語。但是他提出的媒介即信息，那什么是信息？實(shí)際上這里還有一個趣事：他當(dāng)時提到，媒介即按摩。

所以，今天信息減少和排除事物不確定性度量，如果你進(jìn)到屋里但是是黑燈狀態(tài)，那打開燈后你才能找到你的東西，這時候電燈給了你決策，因此電燈是不是媒介？今天當(dāng)你受傷或者失戀了，聽首歌也許就撫慰了你受傷的心靈，這個時候媒介是不是就是按摩？所以麥克·盧漢的媒介信息論和媒介技術(shù)論，技術(shù)在驅(qū)動媒介方面發(fā)揮重要作用。

當(dāng)然，今天最重要的是計(jì)算。計(jì)算的核心要素是數(shù)據(jù)算法和算力，數(shù)據(jù)已經(jīng)成為重要的生產(chǎn)要素。前段時間中央電視臺的央視新聞做了關(guān)于“數(shù)字人”的采訪，當(dāng)時我在今日頭條包括學(xué)習(xí)強(qiáng)國進(jìn)行解讀之后，幾個小時大概有四十幾萬的點(diǎn)擊量，說明大家非常關(guān)注媒介延伸以及數(shù)字人。

很多場景下都會做一個數(shù)字人和媒介重塑融合延伸的方式?；谶@個方式你會發(fā)現(xiàn)，在制作這樣方式中大家可能更想的是：最好是你沈老師出現(xiàn)，包括形象、語音等。相信大家知道只要我們給出草本或者腳本，選擇你的化身也就是演員，然后不同的背景無論是圖片或者是視頻就自動合成從文本到視頻的生成。

而且這樣的“化身人”可以讀200多種語言或語種，還可以選擇不同身份的人，這其實(shí)是我們?nèi)斯ぶ悄茉谧匀徽Z言處理、自然語言生成和自然語言理解上有了極大的進(jìn)步。

這也是一個令人興奮的時代，是大數(shù)據(jù)時代，人工智能和數(shù)據(jù)科學(xué)讓我們越來越多地觀察到人類社會的復(fù)雜行為模式。當(dāng)下是科技聚合時代，不僅是人工智能還包括區(qū)塊鏈、北斗、NFT、5G、元宇宙。今天，主要關(guān)注在媒體，所以課題主要關(guān)注虛擬數(shù)字人和媒體融合視角。

比如，今天開一個騰訊會議，大家都希望能開一個具有沉浸感的會議調(diào)劑一下，這件事其實(shí)已經(jīng)出現(xiàn)了。當(dāng)我走入這樣的環(huán)境中可以看到我身旁可能是賣的NFT，也可能將來是媒體融合數(shù)字博物館，也許是其他可能的影視等分享。

舉個例子可以在這看出來，比如我搭建這樣一個環(huán)境，只要在這這上傳視頻、音頻或者可能實(shí)現(xiàn)交互方式，有人來這一起欣賞、購買等等模式。從這個角度來講，不光可以坐這開會，也可以體驗(yàn)新的交互模式。

最近有一些從文本到視頻，甚至文本到圖片的頂級算法叫穩(wěn)定創(chuàng)新。這六張圖真的是沈老師畫的，但不是我畫的，我只要給出關(guān)鍵詞就可以生成這樣的圖片。特別像這張大圖，當(dāng)時我輸入的是三個宗教，基督教、伊斯蘭教和佛教，結(jié)果生成中間張圖，可以看到既有基督教的特色也有伊斯蘭教的服飾，甚至也有佛教的表情，當(dāng)然不同的人有不同的解讀。

從這個角度，我們的藝術(shù)家很難創(chuàng)作出這樣一種寓意，但是當(dāng)一個老人在車上玩手機(jī)時會生成這樣的圖片。人工智能直接從文本到圖像、視頻，已經(jīng)進(jìn)入我們的藝術(shù)領(lǐng)域。

今天已經(jīng)可以把各種圖像、視頻抓幀包括語言圖像等等都可以變成相量化，當(dāng)把我們的手寫或者服裝變成嵌入相量，包括把表情變成相量時，通過科技聚合在一起一定會產(chǎn)生化學(xué)反應(yīng)。這種反應(yīng)可能是媒體融合的特征也是媒體融合需要最關(guān)注的特點(diǎn)。當(dāng)然這個特點(diǎn)對于我們學(xué)校，對于國家媒體融合與傳播來源講實(shí)際上是建立在新文科、新工科，特別具有交叉學(xué)科特點(diǎn)。

就是對于傳統(tǒng)的硬科學(xué)，大數(shù)據(jù)和人工智能與今天的人文社會科學(xué)融合，這個時候就可以產(chǎn)生有組織的科研創(chuàng)新。所以計(jì)算和傳播可能在重塑我們的媒介觀。

這里用了虛幻引擎（metahuman），可以在象素級上進(jìn)行數(shù)字人的描繪或者生成?，F(xiàn)在最難的是虛幻引擎還不能脫離優(yōu)異的引擎。同樣我們看到在強(qiáng)大的智能和算力上，英偉達(dá)的黃教主實(shí)現(xiàn)了和人形象的代言和形象的交流，這一點(diǎn)我們看到數(shù)字人已經(jīng)聚合了智能技術(shù)，同時也在聚合媒體融合的形態(tài)。

所以，我們學(xué)校也在一些特定場景、活動中用數(shù)字人方式，去表達(dá)一些形態(tài)，就像學(xué)生不能蒞臨現(xiàn)場一樣，比如在疫情期間，我們學(xué)校動漫學(xué)院利用一個虛擬的元宇宙畢業(yè)典禮或者開學(xué)典禮。

今天，元宇宙是一個熱門話題，但是它是一種數(shù)據(jù)形態(tài)。

未來我們每個人可能都希望有個“網(wǎng)絡(luò)化身”，這個“化身”在不同的現(xiàn)實(shí)物理世界，因世界的價值觀不同可以享受不同生活方式。

所以，站在交叉學(xué)科和社會科學(xué)視角，技術(shù)往往遮蔽在文化中，只有當(dāng)技術(shù)產(chǎn)生革命性變革時人們才會意識到技術(shù)的重要性。

前面兩位專家提到了未來的可能性，不光在現(xiàn)實(shí)中，可能未來在無人機(jī)，特別是主機(jī)和僚機(jī)作用中互相的感知連接。未來很多領(lǐng)域這種認(rèn)知性東西實(shí)際上是技術(shù)在驅(qū)動媒介產(chǎn)業(yè)和社會變革。這種社會變革，除了區(qū)塊鏈、納米技術(shù)、人工智能技術(shù)、機(jī)器人、人工存儲等等，其實(shí)我們看到現(xiàn)在很多時髦概念撲面而來。

2002年時，美國提出了科技聚合，當(dāng)時它提到了納米、信息技術(shù)等等。但是今天我特別想說認(rèn)知科學(xué)，如果人工智能能夠涉足認(rèn)知科學(xué)，這種認(rèn)知問題如何解決，博弈也是種認(rèn)知，媒體技術(shù)具有驚人的潛力來提升我們與世界的互動方式。

最早人類因?yàn)橛幸粋€洞穴的隱喻，不知道外面世界是什么，只能通過投影感知世界。但是今天，我們也許可以創(chuàng)造出一個世界，也許是元宇宙，也許是媒體融合的延伸，也就是計(jì)算讓我們媒體的進(jìn)一步延伸。延伸到了今天我們愿意用元宇宙方式去探討，當(dāng)我們探索媒介和智能與物質(zhì)世界的融合創(chuàng)新、融合延伸時，我們的認(rèn)知局限性理解將會打破。

特別是智能技術(shù)，所以，希望開拓新的視野。從最小的叫做智能地去除背景技術(shù)到智能地擦除和合成技術(shù)，這些對于媒體來講都是小兒科。甚至對于視頻的融合采集和智能編輯技術(shù)也已經(jīng)非常地方便。只要在算力達(dá)到的情況下，我們就可以給受眾，甚至抖音里面的剪影，包括微博視頻等都有這類技術(shù)出現(xiàn)。

視覺是人工智能創(chuàng)新最典型的要點(diǎn)和突出點(diǎn)，除了我們拿到圖像去構(gòu)建圖像的相量化、預(yù)項(xiàng)量模型以外，現(xiàn)在我們對于圖像的反向搜索，對于圖像的事實(shí)審核問題就非常重要了。

隨著我們對于輿論戰(zhàn)、認(rèn)知戰(zhàn)的認(rèn)知，需要更多地對網(wǎng)上包括社交媒體上出現(xiàn)的大量的圖像和視頻進(jìn)行事實(shí)的審核和追蹤。同樣道理，通過一個帶有計(jì)算機(jī)視覺的攝像頭就可以很容易的快速地捕捉停車場的占位和空位。過去我們需要大量的設(shè)備傳感器電子和人力，今天一個攝像頭就可以感知并做到這一點(diǎn)。

從這一點(diǎn)來講，隨著攝像頭技術(shù)、視覺技術(shù)以及追蹤能力的進(jìn)步，我們可以以一張照片大概算出具體的人群是什么，很多場景都會用這樣的算法來捕捉可能人數(shù)的感知。

對于圖像修復(fù)技術(shù)，無論是從舊相片、破損相片還是黑白照片的著色都有了很好的能力，甚至現(xiàn)在很多媒體都將過去的視頻或者圖像進(jìn)行了相應(yīng)的著色和升頻能力，甚至達(dá)到8倍的升頻技術(shù)。從靜態(tài)到2D、3D，讓清明上河圖活躍起來，讓特殊場景下的一些圖片變得動態(tài)這也是可能的應(yīng)用場景。

這樣的技術(shù)出來以后，也帶來了很多深度造假，當(dāng)然深度造假隨著現(xiàn)在的穩(wěn)定擴(kuò)散模型出現(xiàn)，深度造假又上了臺階，它既有負(fù)向也有正向應(yīng)用，這塊算法和能力主要關(guān)注于如何應(yīng)用起來更好地服務(wù)人們的需要。最典型的是從智能主播的方式，通過虛擬數(shù)字人方式呈現(xiàn)。

對于媒介來講，借助于智能媒體實(shí)際上已經(jīng)成為了重要的社會使能器，是社會互動的使能器。人們通過智能媒體獲取信息知識，應(yīng)對未知和恐懼。

所以，現(xiàn)在在媒體領(lǐng)域普遍流行的就是創(chuàng)建各種各樣的數(shù)字人，也形成了相應(yīng)的產(chǎn)業(yè)鏈。這些產(chǎn)業(yè)鏈很重要的關(guān)鍵技術(shù)就是我們的智能技術(shù)，就是我們的智能媒體技術(shù)，這里面既包括圖像、視頻、語言、聲音、文字甚至細(xì)節(jié)上包括自然語言理解和生成，甚至是主體對象的實(shí)時追蹤都是很重要的方向。這些領(lǐng)域會滲透到不同的輿論產(chǎn)業(yè)，甚至包括新聞傳播。

前段時間做了虛擬數(shù)字人影響力報告，也得到很重要的大家反饋。通過反饋中知道媒介的延伸使我們更好地了解自己、感知世界，媒介的智能在塑造我們現(xiàn)實(shí)世界中起著非常重要的作用。

這時候，人類的認(rèn)知正在迅速地接近使用計(jì)算和數(shù)據(jù)、算法、算力去融合、交互。這個過程中計(jì)算和傳播成為未來媒體的核心技術(shù)。

我特別提到，關(guān)于媒體融合與國家重點(diǎn)實(shí)驗(yàn)室，為了建立對國家戰(zhàn)略服務(wù)需求，實(shí)際上現(xiàn)在我們不僅在信息戰(zhàn)還有輿論戰(zhàn)，最近主要是在認(rèn)知戰(zhàn)上，認(rèn)知戰(zhàn)對我們的智能技術(shù)使用就更重要了。比如俄烏沖突中人臉識別，把相應(yīng)陣亡士兵能夠寄回到他的家里，引起認(rèn)知上的改變。以及各種造假形成對相應(yīng)的戰(zhàn)爭影響以及在社交媒體上和其他媒體上傳播的問題，都需要我們用更加有效的智能技術(shù)來解決。

這種智能技術(shù)不僅包括我們對物體感知，對社會認(rèn)知，特別是他們的關(guān)系的理解。這種關(guān)系需要通過不同的智能技術(shù)來解讀，通過智能技術(shù)來分析，這種智能技術(shù)其實(shí)來自于我們的開源情報等網(wǎng)絡(luò)搜索，包括人臉。

舉個例子，比如特朗普，就需要通過一個帳號獲取他的信息，并且把這個信息提取出來建立我們自己的認(rèn)知模型。例如通過“大五馬”模型捕捉價值需求等，這是一個多標(biāo)簽或者分類模型，它包括對語義、文化方面的認(rèn)知，也包括視覺效果，這個模型能夠快速地對一個人進(jìn)行分析。

既然能分析一個人，就可以分析所有人。我們可以通過GPU加速，可以對更大的社會群體認(rèn)知產(chǎn)生群體分析。這樣的分析也可以推進(jìn)我們?nèi)斯ぶ悄軇?chuàng)新，推進(jìn)技術(shù)聚合，找到新的思考方式。

所有事物都這樣被連接，可計(jì)算。如果用一些數(shù)學(xué)形式的語言來表達(dá)，數(shù)據(jù)、算法和算力構(gòu)成了我們計(jì)算的要素。一個計(jì)算可編程是智能，因?yàn)槿斯ぶ悄塥M義的定義就是一段可編程的智能化程序，這個智能未來和區(qū)塊鏈融合，將會產(chǎn)生未來社會的一種模式。

也就是把今天的信息互聯(lián)網(wǎng)和價值互聯(lián)網(wǎng)融合，產(chǎn)生新的數(shù)字經(jīng)濟(jì)形態(tài)。

這個過程中，一個很重要的社會治理就是需要人工智能和數(shù)據(jù)智能的能力。因此，云計(jì)算、大數(shù)據(jù)、人工智能等自變量里構(gòu)建未來的區(qū)塊鏈，把現(xiàn)在很多新的技術(shù)如何融合構(gòu)建我們可想象的，比如元宇宙這樣的未來形態(tài)。

技術(shù)融合，計(jì)算賦能認(rèn)知不僅僅視為一種技術(shù)，更認(rèn)為人類意識或者認(rèn)知的延伸。這種延伸中媒體融合不斷創(chuàng)新，進(jìn)一步推進(jìn)了技術(shù)的融合，擴(kuò)大視野尋找新的思考方式。

最后總結(jié)，我們一直在探討，盡管我們有很多的信息，但是如果加上時間，當(dāng)我們的信息被時間和位置捆綁時，加上Hash捆綁就可以實(shí)現(xiàn)自辨真家，無假自證.也就是我們的位置,盡管在國界內(nèi)有三大運(yùn)營商，但是如果逃離了國界，那么你在全球地理位置還有北斗衛(wèi)星。如果北斗可以實(shí)現(xiàn)雙向短報文，并且實(shí)現(xiàn)全球授時和全球授位時，那么，你發(fā)個信息都被我的時間和位置捆綁，那你就是中國的。

當(dāng)然，如果你逃離到未來的元宇宙中，你能夠被我的時間和位置捆綁，如果能夠被我們的關(guān)系捆綁，真的無假自證。對于元宇宙的未來和社會治理，我們可能可以看到一種希望的主張，對于全球的空間、時空和我們的人類行為，包括我們的媒體、語言、文字、聲音進(jìn)行Hash捆綁，都可能產(chǎn)生新的一種價值，這是今天我想表達(dá)的。

今天我的主題叫做計(jì)算重塑媒介的延伸，我們努力將未來變成現(xiàn)實(shí)，謝謝大家！

免責(zé)聲明：市場有風(fēng)險，選擇需謹(jǐn)慎！此文僅供參考，不作買賣依據(jù)。

關(guān)鍵詞：

每天都在汆肉中醒来青梅,好男人www在线观看,少妇无码自慰毛片久久久久久,国产欧美另类久久久精品丝瓜

GAITC2022智媒專題論壇｜沈浩：計(jì)算重塑媒介的延伸

推薦內(nèi)容