眼見不一定為憑,影片版 PS 悄悄蔓延網路,超過一億則 " 深度偽造 " 影片難辨真假。讓美國 DARPA 都頭痛的 " 黑科技 " ,已經大舉入侵主流網路平台,這究竟是好事還是壞事?古話說的 " 人怕出名豬怕肥 " ,現今恐怕有了續集——人怕出名豬怕肥,出名之後怕 deepfake 。今年年初,受此困擾的是世界上被拍照次數最多的名人之一阿湯哥。你能分辨出下圖中哪個是真的阿湯哥嗎?
答案揭曉:兩者都不是。左圖是湯姆・克魯斯的模仿者費爾希,右圖是由 Tiktok 用戶創造的 deepfake 版湯姆・克魯斯。這位名為 Ume 的用戶創建的 Deeptomcruise 帳號,只放了三則影片,便在一週時間吸引了 38 萬的粉絲。這種效應,還只是 deepfake 影片野蠻生長的冰山一角。在許多人仍然相信 " Seeing is believing " 的時候,歷史的進程已經按下快進鍵:數據統計, 2019 年到 2020 年這一年, deepfake 影片數量成長了大概 6,820 倍,從 14,678 個影片成長到 1 億則影片。deepfake ——這項讓美國 DARPA 都頭痛的 " 黑科技 " ,已經大舉入侵主流網路平台,這究竟是好事還是壞事?
01 名聲狼狽,被視為最嚴重的 AI 安全威脅
不得不說,當一項技術被冠以 " deepfake " 這個名字,給人的印象不負面都不行:fake 已經是造假了,還要深度地造假。但事實也確實如此, deepfake 所代表的由深度學習 AI 系統產生的媒體內容,最早走紅的用途非常負面。
2018 年,Motherboard 記者 Sam Cole在網路上發現了一個令人不安秘密角落:一位名叫 " deepfake s " 的 Reddit 用戶,借助 AI 將色情片中主角替換成名人,發布了不少未經同意的色情假影片。一年之後, deepfake 應用程式越來越易於訪問,即便那個論壇因為充斥著大量合成的色情影片而被關閉,與之相關的換臉色情片成長已經蔓延開來。
且讓 deepfake 名聲掃地的,還不止色情片。另一個臭名昭著的應用是用在政治目的。借助開源的人工智慧算法,你只要收集一個人足夠多的真實錄像素材,就能操縱影片中的歐巴馬、川普們,讓他們 " 發表 " 任何觀點,且達到以假亂真的效果。要知道,曾經只有好萊塢特效工作室和情報機構才會製作這一類虛假音影片用於政治宣傳。
2017 年~2020 年期間,大量湧現的 deepfake 作品集中反映了該技術的陰暗面,用在名人偽造是這項技術濫用的重災區。充斥著社交媒體的換臉影片已經強烈動搖了人類長久以來對自己的視覺和聽覺的信任。當消費的媒體內容真假難辨的時候,很容易出現被這種這些內容所欺騙的受害者。
deepfake 的巨大威力讓很多人坐立不安,美國官員將它與核武器相提並論,媒體文章稱其為 " 人類開啟的一個前所未有的潘多拉魔盒 " 。有著 " 現實版神盾局 " 之稱的美國國防部高級研究計劃局(DARPA ),近幾年瘋狂砸錢找尋鑒定 deepfake 作品的方法。《犯罪科學》於 2020 年發表的一份報告預測,在未來 15 年內, deepfake 將成為眾多人工智慧技術中最嚴重的安全威脅。
但 deepfake 潛在的風險引發大眾擔憂,只是其中的一條故事線。而在另一條故事線中, deepfake 並非 " 洪水猛獸 " ,甚至為許多產業打開了柳暗花明的局面。
02 新的內容生產方式, deepfake 象徵著 " AI 創造力 “
對於盧卡斯影片來說,有著《星球大戰》系列這樣一部經典永流傳的作品固然是好事。但一個現實問題擺在他們面前:這個系列有 40 多年歷史,參演的演員有的已經去世,或者年事已高,繼續開發《星球大戰》系列可能需要啟用新一代的年輕演員。鑒於大量角色已經深入人心的角色,這種改變恐怕很難贏得粉絲認同的。
盧卡斯影業採用的另一種方法是利用 CG 復原舊角色,如你所見,《俠盜一號》中塔金總督和莉亞公主就是用 CG 復原的。但最終效果並不是令人滿意。直到 deepfake 給了他們新的希望。
就在不久前,盧卡斯為自己的團隊招了一位貨真價實的網紅。這位網名叫 Shamook 的 YouTube 網紅,尤其擅長製作 deepfake 影片。他在幾個月前加入了盧卡斯影業旗下,將擔任高級臉部捕捉藝術師。對於渴望新的內容技術的產業, deepfake 似乎能大展拳腳。
deepfake 背後的技術—— GAN ,是這幾年在人工智慧領域的熱門方向,它代表著新的數據生產力,而內容本身就是一種數據。 GAN 的原理類似左右手互博。它由兩類網路組成,分別為產生器和鑑別器,前者負責在數據集上訓練後產生虛假音影片,後者則負責對這些產物進行鑑別,直到再也檢測不出真假為止。因此,對於 GAN 而言,產生器使用的數據集越大,作品的逼真程度越高。這一點也解釋了為什麼早期躥紅網路的 deepfake 作品多以名人為主。因此,也有人看到了這樣一種未來: GAN 代表著 " AI 創造力 " 的崛起。
不止盧卡斯影業,隨著用於 GAN 算法變得越來越強大,創新者們及一眾 deepfake 軟體新創公司正爭先恐後地尋找利用該技術 " 向善 " 的一面來改變產業的途徑。色情和政治虛假宣傳產生作為 deepfake 的殺手應用,該翻篇了。遊戲、影視、行銷等產業正為後 deepfake 時代的到來摩拳擦掌。除了已經被許多人所熟知的各種換臉應用,以下是我們看到的幾項和產業需求深度融合、頗具吸引力的 deepfake 新穎玩法:
1 、聲音濾鏡
照片和影片的濾鏡已經充斥著整個網路,聲音濾鏡對我們來說卻仍頗為新鮮。有不少新創公司正在加速這種新濾鏡的普及。創企 Respeecher 看上了合成聲音的機會,只不過他們的聲音作品主要面向的是影視業。當動畫和電影製片廠不考慮使用真人配音演員時,Respeecher 的聲音複製就派上用場了。
一家更受矚目的公司是 Modulate 。成立於 2018 年 Modulate 團隊有著 MIT 背景,曾因為在其網站上提供了美國前總統歐巴馬正在 " 推銷 " 該軟體的 deepfake demo走紅,該 demo 展示的逼真效果甚至一度引發恐慌。
現在, Modulate 正在遊戲產業中使用 deepfake 來產生 " 聲音濾鏡 " ,老派方法依賴於文本到語音技術,而 Modulate 的亮點是使用即時音樂來合成語音。這家公司最近從 Hyperplane Venture Capital 和 2Enable Partners 等投資者籌集了 200 萬美元。
公司創辦人 Mike Pap PS 認為,用戶們會渴望在社交平台或者遊戲平台上擁有一個很酷的音樂化身,這將提供更好的網路個性化體驗。" 上網的消費者設計他們的線上角色。他們會為自己的角色花錢買新的造型,但一旦他們使用語音聊天,就打破了自己製造的幻覺,因為他們必須用自己的聲音,得給他們這樣的自由,能讓他們完全進入自己的角色。 "
不僅是體驗上的完善,這樣的一層聲音濾鏡讓玩家隱瞞自己的年齡、性別、種族或可能導致被人騷擾的任何其他資訊,也提高了語音聊天時的安全感。 Modulate 想做的事情還不止如此。Mike Pap PS 表示,他們還有更遠大的計劃,那就是利用 deepfake 這樣的機器學習技術針對語音聊天問題構建一套 " 全面的解決方案 " 。
2 、高度客製、個性化的虛擬形象
我們幾乎可以很肯定地說,未來電商、行銷領域不僅僅有 AI 客服,也會有大量 AI 產生的 " 模特 " 。而且是對個性化要求更高的 AI 虛擬形象。已經有大量研究表明,擁有更個性化的消費體驗會促成消費者的購買行為。
總部位於班加羅爾的 Rephrase. AI 則使用 deepfake 技術,幫助品牌方大規模創建個性化的銷售宣傳影片。他們提供的工具允許企業自訂影片的各種元素,使用文本到語音的人工智慧,以自然的方式用選定的語調講述輸入的文本,然後將其與預設人體模型的唇部動作和面部表情同步。
就像我們可以在文本、email 中插入個性化的 logo、圖像一樣,他們希望品牌方在影片內容上也能實現 " 信手拈來 " ,無論這個影片是用於產品推廣還是內部培訓。Rephrase. AI 談到這項技術時說: " 與 2015 年前相比,人們消費的影片內容明顯增多。但就生產和創作而言,它並沒有太大變化。 " 直到 deepfake 的出現, " 它將成為一種基本的接觸方式。 "
3 、不可追朔的數據
看完上面的介紹,如果你覺得 deepfake 技術還是不夠嚴肅,下面介紹的這個用法會改變你的想法。我們知道,社交媒體公司的大量圖像已經被 Clearview AI 、ClearView 、HighQ 和 NTechLabs 等公司抓取,我們的大部分個人資訊已經在網路上流傳。
在全球愈演愈烈的人臉隱私擔憂浪潮中, D-ID 沒有被嚇倒。這家公司想做的事情非常簡單,就是利用 deepfake 讓人臉數據變得不可追溯,但不抹去年齡、性別或情感等重要屬性,仍保有其某些數據價值,這種智能匿名功能為生物識別數據庫提供了新的安全性。
D-ID 由以色列軍隊網路安全和進攻性網路部門的成員。 D-ID 判斷,歸功於歐洲和美國某些州的新隱私立法, deepfake 用作匿名技術的需求將繼續擴大。目前,AXA Ventures、Pitango、Y Combinator、 AI Alliance、現代、歐姆龍、Maverick(美國)和 Mindset 等都參與了 D-ID 先前的 1350 萬美元融資。
更讓人興奮的是, D-ID 收到了汽車製造商的需求。汽車正在變成一款電子消費品,大量的汽車廠商、自動駕駛軟體廠商們希望有新技術來實現駕駛監控系統的匿名,既能收集駕駛員的反應,但不能記錄任何公共識別資訊。監控產業則是另一個潛在客戶。一些監控主要負責記錄物理空間,而不需要收集進出建築物的人的識別資訊。" 加強監控和個人隱私保護的融合,使企業處於必須對其儲存的圖像進行匿名處理,否則就將面臨違反隱私法並付出高昂代價的風險。 "
從上述這些應用我們也不難看出, deepfake 固然有其風險所在,但人類同樣可以像使用其他技術造福自身一樣挖掘這種工具的潛力。
" 這就像 20 年前的 Photoshop,人們不知道什麼是照片編輯,現在他們知道了照片也有贗品, " 創造了阿湯哥 deepfake 的Ume 也說,自己並不太擔心 deepfake 的未來。deepfake 將繼續存在,精靈已經不能再放回瓶子裡了,人類需要自己找到和它相處的方式。隨著 deepfake 與我們真實世界的互動越來越多,人們對它的期望將會改變,就像經歷 Photoshop 誕生對圖像的改變一樣。
《36氪》授權轉載
【延伸閱讀】