[技術(shù)前沿]阻止音頻深度偽造的新技術(shù)出現(xiàn)
語音克隆——人工智能用于創(chuàng)建聽起來真實(shí)但虛假的語音——有其好處,比如為有語音障礙的人生成合成語音。但這項(xiàng)技術(shù)也有很多惡意用途:騙子可以使用人工智能克隆聲音來冒充某人,騙取個(gè)人或公司數(shù)百萬美元。語音克隆還可以用于生成傳播選舉虛假信息的音頻深度偽造。
為了應(yīng)對(duì)音頻深度偽造帶來的日益嚴(yán)重的危險(xiǎn),美國聯(lián)邦貿(mào)易委員會(huì)(FTC,F(xiàn)ederal Trade Commission)發(fā)起了語音克隆挑戰(zhàn)。來自學(xué)術(shù)界和工業(yè)界的參賽者的任務(wù)是開發(fā)防止、監(jiān)測(cè)和評(píng)估用于邪惡目的的語音克隆的想法。該組織在4月宣布了這場(chǎng)比賽的三名獲勝者。這三支隊(duì)伍都以不同的方式處理這個(gè)問題,表明需要采取多管齊下、多學(xué)科的方法來解決音頻深度偽造帶來的挑戰(zhàn)和不斷演變的危害。
處理音頻深度偽造的3種方法
獲獎(jiǎng)作品之一OriginStory旨在驗(yàn)證聲音的來源。亞利桑那州立大學(xué)電氣工程教授Visar Berisha與亞利桑那州立大學(xué)的同事Daniel Bliss和Julie Liss一起領(lǐng)導(dǎo)開發(fā)團(tuán)隊(duì),他說:“ ■十大网投正规信誉官网■十大网投靠谱平台 開發(fā)了一種新型麥克風(fēng),可以在錄音的那一刻驗(yàn)證錄音的人性?!?/p>
VISAR BERISHA
OriginStory的定制麥克風(fēng)與傳統(tǒng)麥克風(fēng)一樣記錄聲學(xué)信號(hào),但它也有內(nèi)置傳感器,用于檢測(cè)和測(cè)量人說話時(shí)身體發(fā)出的生物信號(hào),如心跳、肺部運(yùn)動(dòng)、聲帶振動(dòng)以及嘴唇、下巴和舌頭的運(yùn)動(dòng)。Berisha說:“在錄音過程中,這種驗(yàn)證作為水印附加在音頻上,并為聽眾給予可驗(yàn)證的信息,表明語音是人為生成的。”
另一個(gè)獲獎(jiǎng)項(xiàng)目,名為AI Detect,旨在利用人工智能捕捉人工智能。由生產(chǎn)人工智能語音處理軟件的OmniSpeech公司提出,AI Detect將把機(jī)器學(xué)習(xí)算法嵌入手機(jī)和耳機(jī)等計(jì)算能力有限的設(shè)備中,以實(shí)時(shí)區(qū)分人工智能生成的語音。OmniSpeech首席執(zhí)行官David Przygoda表示:“ ■十大网投正规信誉官网■十大网投靠谱平台 的目標(biāo)是在你打電話或使用耳機(jī)時(shí)擁有某種標(biāo)識(shí)符,例如,另一端的實(shí)體可能不是真正的聲音?!?/p>
最后一個(gè)獲勝的作品DeFake是另一個(gè)人工智能工具。DeFake給人類錄音增加了微小的干擾,使精確克隆變得更加困難。圣路易斯華盛頓大學(xué)計(jì)算機(jī)科學(xué)與工程助理教授Ning Zhang說:“你可以把擾動(dòng)想象成添加到人聲記錄中的微小擾頻噪聲,人工智能用它來分析人聲的特征。因此,當(dāng)人工智能試圖從記錄的語音樣本中學(xué)習(xí)時(shí),它會(huì)犯錯(cuò)誤,并學(xué)到其他東西?!?/p>
Zhang說,DeFake就是所謂對(duì)抗性人工智能的一個(gè)例子,這是一種攻擊人工智能模型正常工作能力的防御技術(shù)。他補(bǔ)充道:“ ■十大网投正规信誉官网■十大网投靠谱平台 正在嵌入攻擊的小片段,以攻擊攻擊者的人工智能——那些試圖竊取 ■十大网投正规信誉官网■十大网投靠谱平台 聲音的人?!?/p>
實(shí)現(xiàn)音頻深度偽造防御
AI Detect和DeFake都處于早期研發(fā)階段。AI Detect仍然是概念性的,而DeFake需要更多的效率改善。Przygoda和Zhang也意識(shí)到了使用人工智能的弊端。
Przygoda說:“這需要持續(xù)的努力, ■十大网投正规信誉官网■十大网投靠谱平台 正在更新 ■十大网投正规信誉官网■十大网投靠谱平台 的數(shù)據(jù)集和技術(shù),以跟上用于創(chuàng)建deepfakes的模型和硬件的開展。這需要持續(xù)監(jiān)控?!?/p>
Zhang回應(yīng)了這一觀點(diǎn):“人工智能開展得很快,所以 ■十大网投正规信誉官网■十大网投靠谱平台 需要不斷確保隨著新功能的出現(xiàn)調(diào)整 ■十大网投正规信誉官网■十大网投靠谱平台 的技術(shù)。作為防御者, ■十大网投正规信誉官网■十大网投靠谱平台 不知道攻擊者在使用什么作為人工智能模型,所以 ■十大网投正规信誉官网■十大网投靠谱平台 必須能夠在保持語音質(zhì)量的同時(shí),對(duì)所有攻擊進(jìn)行一般防御,這讓事情變得更加困難?!?/p>
與此同時(shí),OriginStory正處于測(cè)試階段,并致力于防止該技術(shù)的欺騙。Berisha說:“ ■十大网投正规信誉官网■十大网投靠谱平台 正在進(jìn)行一項(xiàng)驗(yàn)證研究,許多不同的用戶試圖欺騙它,讓它認(rèn)為麥克風(fēng)后面有人,而實(shí)際上沒有人。最后, ■十大网投正规信誉官网■十大网投靠谱平台 會(huì)感覺到它有多強(qiáng)大。你需要非常確定地知道,另一端的人是人?!?/p>
麻省理工學(xué)院計(jì)算機(jī)科學(xué)與人工智能實(shí)驗(yàn)室口語系統(tǒng)組的博士后Nauman Dawalabad表示,人工智能檢測(cè)的方法很有前景。“對(duì)于假/真音頻檢測(cè)模型來說,在設(shè)備上操作以保護(hù)隱私至關(guān)重要,而不是將個(gè)人數(shù)據(jù)發(fā)送到公司的服務(wù)器?!?/p>
與此同時(shí),Dawalabad認(rèn)為DeFake的預(yù)防策略(他將其比作水?。┦且粋€(gè)很好的解決方案,可以在消費(fèi)者的語音數(shù)據(jù)被泄露或截獲時(shí)保護(hù)他們免受欺詐。“然而,這種方法取決于分析所有的源揚(yáng)聲器,需要仔細(xì)實(shí)施。例如,簡(jiǎn)單地用另一個(gè)麥克風(fēng)設(shè)備重新錄制帶水印的語音,就可以完全或部分消除水印的影響,”他補(bǔ)充道。
至于OriginStory,Dawalabad表示,該技術(shù)類似的在源頭蓋章的預(yù)防方法“似乎比單獨(dú)基于軟件的水印更穩(wěn)健,因?yàn)樗蕾囉陔y以復(fù)制的生物信號(hào)?!?/p>
但Dawalatabad指出,解決音頻深度偽造問題的一個(gè)更有效的策略是將多種策略相結(jié)合的四管齊下的方法。他說,第一步是現(xiàn)在給新的錄音添加水印,使其具有可追蹤性。第二步是獲獎(jiǎng)作品正在著手的工作——開發(fā)更好的檢測(cè)模型,這“對(duì)保護(hù)當(dāng)前數(shù)據(jù)至關(guān)重要,其中大部分?jǐn)?shù)據(jù)沒有水印,”他說。
第三步涉及直接在設(shè)備上部署檢測(cè)模型,以增強(qiáng)安全性和保護(hù)隱私。Dawalabad說:“這包括提出更好的模型壓縮算法,以部署在資源受限的設(shè)備上。此外,我建議制造商自己在系統(tǒng)級(jí)別添加這些檢測(cè)模型。”
最后,Dawalabad強(qiáng)調(diào)需要“讓決策者參與進(jìn)來,確保消費(fèi)者保護(hù),同時(shí)盡可能推廣解決方案?!?/p>
聯(lián)邦貿(mào)易委員會(huì)聲音克隆挑戰(zhàn)賽的三名獲勝者將分享35000美元的現(xiàn)金獎(jiǎng)勵(lì)。信息安全公司Pindrop的第四個(gè)解決方案取得了表彰獎(jiǎng)。該解決方案順利獲得以2秒為間隔分析語音并標(biāo)記那些被識(shí)別為潛在可疑的語音,實(shí)時(shí)檢測(cè)音頻深度偽造
文章來源:IEEE電氣電子工程師學(xué)會(huì)