此前DeepFake換臉在全球引發軒然大波。從生成足以以假亂真的名人不雅視頻開始,很多使用者將這個“換臉神器”當成了視頻造假工具,并通過社交網絡將虛假信息傳播到全世界。DeepFake等技術出現不僅提升了換臉的真實性,其開放源代碼的方式更是降低了將該等技術濫用于虛假信息制作和傳播門檻。
事實上,大約30%經過AI換臉的合成照片、合成視頻是人類僅憑肉眼無法識別的,很容易被當作真實信息進行再次傳播。這已成為一個亟待解決的社會性問題,面對這個問題,我們應該以及可以做些什么?微軟亞洲研究院給出了解決方案。
除了DeepFake,市場上存在多種換臉技術,不同算法生成的圖像結果千差萬別,難以使用同一個換臉鑒別模型解決所有換臉技術的進攻。與此同時,換臉鑒別模型還需要對目前不存在、但未來可能出現的換臉技術也具有判別力,如何去預測未來換臉技術的發展方向,提前布防,也是重要課題。
目前,最常被使用的AI換臉算法有三種:DeepFake、FaceSwap和Face2Face。其中,DeepFake基于大家所熟知的GAN技術,對于它所生成的臉,人類的識別率大約為75%*。FaceSwap是一個學習重建臉部特征的深度學習算法,可以對給出的圖片進行模型替換,人類對于此類換臉的識別率也是75%左右*。Face2Face則是用其他真實的人臉去替換原本的人臉,不涉及人臉的生成,對于它制造的臉,人類的識別率只有41%*。作為目前學術界最大的合成視頻數據庫之一,由慕尼黑技術大學創建的FaceForensics數據庫涵蓋了經過以上三種換臉算法編輯的公開視頻,以供學術研究使用。
多年來,微軟亞洲研究院在人臉識別、圖像生成等方向都擁有業界領先的算法和模型。在CVPR 2018上,微軟亞洲研究院視覺計算組發表了論文“Towards Open-Set Identity Preserving Face Synthesis”,其中的技術能夠利用開放數據集中的數據,逼真地合成保留圖中人臉身份信息的圖像。深厚的技術積累讓研究員們對“進攻方”的技術原理有著更深刻的理解,進而能夠更有針對性地研發換臉鑒別算法。
圖1:微軟亞洲研究院開發的模型分別提取蒙娜麗莎和赫本圖片中的身份信息和屬性信息進行合成
因此,微軟亞洲研究院研發的換臉鑒別算法,基于FaceForensics數據庫的測試結果均超越了人類肉眼的識別率以及此前業界的最好水平*:對于DeepFake的識別率達到了99.87%,對于FaceSwap的識別率為99.66%,對于Face2Face的識別率為99.67%。
表1:針對已知換臉算法的識別測試結果
更重要的是,一般的換臉鑒別方案需要針對每一種換臉算法研發專門的換臉鑒別模型,想要鑒別一張圖像的真偽,需要逐個嘗試所有模型。微軟亞洲研究院的算法則可以用一個通用模型,去鑒別不同類型的換臉算法所制造的臉。與此同時,研究員還對人臉合成時難以處理的細節進行檢查,如眼鏡、牙齒、頭發邊緣、臉部輪廓,將它們作為算法關注的重點,從而提高識別準確率。相比其他同類技術,來自微軟亞洲研究院的換臉鑒別算法很好地解決了應對動態幅度大、有遮擋、有表情變化的圖像的難題。
除了準確識別已知算法合成的圖像,換臉鑒別的另一大挑戰是應對尚未出現的新算法。將現有的換臉鑒別算法直接用于新算法時,它們的有效性往往會顯著下降。為此,微軟亞洲研究院提出了一種通用換臉鑒別方法。為了更好地考察這一算法對未知換臉算法的鑒別能力,研究團隊用真實圖像對模型進行了訓練,再讓其辨別多種未知換臉算法生成的圖像。實驗結果表明,與基線算法相比,新算法對各類換臉算法的識別率均有大幅提升。隨著研究團隊對模型的進一步優化,通用鑒別模型一定能越來越精確地幫助我們應對新算法所帶來的問題和挑戰。
表2:針對未知換臉算法的識別測試結果
在微軟看來,要構建可信賴的AI,必須遵循以下六大原則:公平、可靠和安全、隱私、包容、透明、責任。微軟內部還成立了人工智能倫理道德委員會(AETHER),幫助微軟應對AI帶來的倫理和社會影響。
關鍵詞: