[技術(shù)前沿]生成式人工智能“瘦身”,進(jìn)入便攜消費(fèi)電子產(chǎn)品
消費(fèi)電子產(chǎn)品技術(shù)瞄準(zhǔn)各種大型語言模型,筆記本電腦是灘頭陣地。
下一代親密聊天機(jī)器人將在不需要連接互聯(lián)網(wǎng)的情況下,以光速在個(gè)人筆記本電腦上運(yùn)行。
這至少是英特爾首席執(zhí)行官帕特?格爾辛格(Pat Gelsinger)在2023年英特爾創(chuàng)新峰會(huì)上提出的愿景。格爾辛格順利獲得在臺(tái)上演示,宣布“人工智能個(gè)人電腦”的問世,該個(gè)人電腦可僅依靠用戶手上的硬件,加速運(yùn)行不斷增多的各種人工智能任務(wù)。
英特爾并不是唯一進(jìn)行相關(guān)研究的公司。包括蘋果公司和高通公司在內(nèi)的消費(fèi)電子設(shè)備科技巨頭都在競(jìng)相優(yōu)化其硬件和軟件,以便在“邊緣環(huán)境”(即本地硬件)而不是遠(yuǎn)程云服務(wù)器上運(yùn)行人工智能。目標(biāo)是什么呢?那就是天衣無縫的個(gè)性化、私人化人工智能,讓你完全忘記它是“人工智能”。
2023年是云端人工智能的輝煌一年。微軟首席執(zhí)行官薩蒂亞?納德拉(Satya Nadella)將小拇指舉到嘴邊,率先向OpenAI投入100億美元,創(chuàng)造了ChatGPT和DALL-E。與此同時(shí),谷歌也匆忙在3月推出了自己的聊天機(jī)器人Bard;9月,亞馬遜宣布向Anthropic投資40億美元,創(chuàng)造了ChatGPT的競(jìng)爭(zhēng)對(duì)手Claude。
這一切都預(yù)示著人工智能將很快在各個(gè)方面徹底改變 ■十大网投正规信誉官网■十大网投靠谱平台 的生活,但是這個(gè)夢(mèng)想在邊緣環(huán)境上被磨損了。如今,強(qiáng)大的人工智能模型在很大程度上要依靠配備昂貴人工智能硬件的數(shù)據(jù)中心,而遠(yuǎn)程訪問這種基于數(shù)據(jù)中心的人工智能必然速度很慢。有時(shí)ChatGPT對(duì)話或DALL-E 2生成的圖像等人工智能生成內(nèi)容可能會(huì)出現(xiàn)停滯,因?yàn)榉?wù)器負(fù)擔(dān)過重,難以跟上。
奧利弗?萊蒙(Oliver Lemon)是愛丁堡赫瑞瓦特大學(xué)的計(jì)算機(jī)科學(xué)教授,同時(shí)也與他人共同領(lǐng)導(dǎo)著位于愛丁堡的英國(guó)國(guó)家機(jī)器人中心,有處理這個(gè)問題的第一手經(jīng)驗(yàn)。萊蒙在對(duì)話式人工智能和機(jī)器人方面有著25年的經(jīng)驗(yàn),他希望在Spring等機(jī)器人中使用最大的語言模型。Spring是其團(tuán)隊(duì)的人形機(jī)器人助理,在醫(yī)院引導(dǎo)訪客和患者。Spring看似受益于現(xiàn)代大語言模型(LLM),富有創(chuàng)造力,具備人性化的對(duì)話功能,而實(shí)際上,它暴露出了云端的局限性。
“(ChatGPT-3.5)太慢了,無法在現(xiàn)實(shí)世界中部署。較小的本地大語言模型要好得多。我的印象是,非常大的大語言模型太慢,無法用于基于語言的交互?!比R蒙說。他樂觀地認(rèn)為,OpenAI能夠找到解決該問題的方法,但需要一個(gè)比包羅萬象的GPT更小、更靈活的模型。
更大規(guī)模仍然意味著“更加智能’如今,為了適應(yīng)筆記本電腦、智能手機(jī)或體積更小的設(shè)備,包括大語言模型在內(nèi)的生成式人工智能正在“瘦身”但僅僅是將人工智能模型壓縮成一個(gè)小軟件包,并不能使其性能與GPT-4媲美。圖中介紹了5個(gè)不同大小的大語言模型(以參數(shù)的數(shù)量為單位)及其按照流行的MMLU基準(zhǔn)的得分(數(shù)字越大表示解決問題的技能水平越高)。盡管大模型和小模型之間仍然存在差距,但便攜式人工智能與GPT-3.5間的性能差距正在縮小。
Spring采用了Vicuna-13B,這是Meta的Llama大語言模型的一個(gè)版本,大型模型系統(tǒng)組織的研究人員對(duì)其進(jìn)行了優(yōu)化。“13-B”表示該模型的130億個(gè)參數(shù),這個(gè)數(shù)字在大語言模型的世界里很小。最大的Llama模型包含了700億個(gè)參數(shù),OpenAI的GPT-3.5模型包含了1750億個(gè)參數(shù)。
減少模型中的參數(shù)可以降低訓(xùn)練成本,這對(duì)萊蒙這樣的研究人員來說是一個(gè)不小的優(yōu)勢(shì)。此外,還有第二個(gè)同樣重要的優(yōu)勢(shì),那就是更快的“推理”,減少將人工智能模型應(yīng)用于新數(shù)據(jù)(例如生成文本提示或照片)所需的時(shí)間。這是機(jī)器人或其他人工智能助手必備的能力,能夠?qū)崟r(shí)地給予幫助。
“仔細(xì)觀察就會(huì)發(fā)現(xiàn),推理市場(chǎng)實(shí)際上比訓(xùn)練市場(chǎng)大得多。進(jìn)行推理的理想地點(diǎn)是數(shù)據(jù)所在的地方?!庇⑻貭柧W(wǎng)絡(luò)與邊緣事業(yè)部的企業(yè)副總裁帕拉維?馬哈詹(Pallavi Mahajan)說,“因?yàn)橛^察什么在驅(qū)動(dòng)人工智能時(shí),你會(huì)發(fā)現(xiàn),是 ■十大网投正规信誉官网■十大网投靠谱平台 的筆記本電腦或手機(jī)上的應(yīng)用程序在驅(qū)動(dòng)人工智能?!?/p>
作為一款個(gè)性化的人工智能助手,Rewind就是這樣的應(yīng)用程序,能夠幫助用戶檢索他們?cè)谧约弘娔X上完成的事情。刪除的電子郵件、隱藏的文件和舊的社交媒體帖子都可以順利獲得基于文本的搜索找到。這些數(shù)據(jù)一旦恢復(fù),就能夠以多種方式得到使用。Rewind可以轉(zhuǎn)錄視頻、在崩潰的瀏覽器網(wǎng)頁中恢復(fù)信息,或創(chuàng)建電子郵件和演示文稿的摘要。
馬哈詹表示,Rewind在Windows上的應(yīng)用是開放人工智能開發(fā)生態(tài)系統(tǒng)OpenVINO的一個(gè)例子。它允許開發(fā)人員調(diào)用本地可用的CPU、圖形處理器和神經(jīng)處理單元(NPU),不需要編寫特定的代碼,可優(yōu)化各種硬件的推理性能。蘋果的Core ML為開發(fā)人員給予了一套類似工具,適用于iPhone、iPad和Mac。
快速本地推理為另一個(gè)目標(biāo)給予了保障:私密,這一目標(biāo)可能是所有個(gè)性化人工智能助手的關(guān)鍵。
Rewind有多種功能。但要實(shí)現(xiàn)這些功能,幾乎需要訪問計(jì)算機(jī)上發(fā)生的所有情況。這并非Rewind所獨(dú)有。所有個(gè)性化人工智能助手都需要廣泛分析你的生活,包括很多敏感信息,比如密碼、語音和視頻記錄,以及電子郵件。
順利獲得單獨(dú)在筆記本電腦上處理訓(xùn)練和推理,Rewind可以解決這個(gè)安全問題,其他注重隱私的人工智能助手可能會(huì)效仿這種方法。這樣做可以展示出更好的性能,在邊緣直接改善個(gè)性化和私密性。以此為基礎(chǔ),開發(fā)人員可以僅借助數(shù)據(jù)中心的力量來實(shí)現(xiàn)功能,然后向那些關(guān)心數(shù)據(jù)去向的人給予橄欖枝。
IDC的研究總監(jiān)菲爾?索利斯(Phil Solis)認(rèn)為,2024年是設(shè)備人工智能蔓延到消費(fèi)電子設(shè)備的一個(gè)關(guān)鍵機(jī)遇。“對(duì)于智能手機(jī)和個(gè)人電腦,這些設(shè)備支持人工智能和生成式人工智能是一件大事?!彼骼拐f,“借助基于網(wǎng)絡(luò)的工具,人們把信息投到網(wǎng)絡(luò)中……網(wǎng)絡(luò)只是把所有內(nèi)容吸進(jìn)去,然后吐出來給其他人。隱私和安全是實(shí)現(xiàn)設(shè)備人工智能的重要原因。”
大型語言模型造就了出色的助手,它們的能力可以進(jìn)入比較模糊的因果推理領(lǐng)域。人工智能模型可以根據(jù)給予的信息得出結(jié)論,如果提出要求,還可以逐步解釋其想法。雖然人工智能對(duì)結(jié)果的理解程度有待討論,但其結(jié)果是有效的。
初創(chuàng)公司Artly正在使用人工智能咖啡師機(jī)器人Jarvis和Amanda,在北美的幾個(gè)地方制作咖啡(即使按照俄勒岡州波特蘭咖啡文化的嚴(yán)格標(biāo)準(zhǔn),它們也能制作出優(yōu)質(zhì)的卡布奇諾咖啡)。該公司的聯(lián)合創(chuàng)始人兼首席執(zhí)行官王萌(Meng Wang,音)希望利用大語言模型來讓其咖啡師隊(duì)伍更加智能、更討人喜歡。
“如果機(jī)器人拿杯子時(shí)傾斜了,我會(huì)告訴它結(jié)果是什么。”王萌說。但可以訓(xùn)練大語言模型使其推測(cè)出這個(gè)結(jié)論,并可應(yīng)用于各種場(chǎng)景。王萌說,機(jī)器人不會(huì)在云遠(yuǎn)端進(jìn)行所有的推理,無論如何,咖啡師機(jī)器人還是需要在線連接,驗(yàn)證付款情況,不過,英偉達(dá)的圖形處理器仍然可以處理設(shè)備的計(jì)算機(jī)視覺任務(wù)。
這種混合方法不應(yīng)被忽略。實(shí)際上,Rewind應(yīng)用程序在概念上也有類似的功能。它能在本地利用用戶個(gè)人數(shù)據(jù)進(jìn)行訓(xùn)練和推理,還能夠選擇使用ChatGPT執(zhí)行要求高質(zhì)量輸出的特定任務(wù),例如撰寫電子郵件。
不過,即便是被迫依賴本地硬件的設(shè)備,也能實(shí)現(xiàn)令人印象深刻的效果。赫瑞瓦特大學(xué)的萊蒙說,Spring找到了一種方法,即使在Vicuna-13B這種小型本地推理人工智能模型中也能執(zhí)行驚人的智能任務(wù)。雖然其推理無法與GPT相比,但可以訓(xùn)練該模型使用與語境相關(guān)的標(biāo)簽,觸發(fā)預(yù)先設(shè)置的表示關(guān)注的形體動(dòng)作和表情。
雖然與“人工智能個(gè)人計(jì)算機(jī)”的愿景相比,機(jī)器人的同理心似乎是微不足道的,但機(jī)器人面臨的性能和隱私挑戰(zhàn)與下一代人工智能助手所面臨的挑戰(zhàn)是相同的。這種人工智能助手正在成為現(xiàn)實(shí),但僅能針對(duì)非常有限的特定任務(wù)?,F(xiàn)在,Mac電腦已經(jīng)可以下載Rewind(很快也可在Windows電腦上使用);新款蘋果手表使用了基于人工智能模型的轉(zhuǎn)換器,實(shí)現(xiàn)離線使用Siri;三星計(jì)劃從2025年開始在其新的家用電器產(chǎn)品中嵌入神經(jīng)網(wǎng)絡(luò)處理器(NPU);高通公司的新款Snapdragon芯片很快會(huì)用于其旗艦手機(jī),它可以完全在智能手機(jī)上處理Meta強(qiáng)大的Llama 2大語言模型,而不需要互聯(lián)網(wǎng)連接或網(wǎng)絡(luò)瀏覽器。
“我認(rèn)為這是一個(gè)來回?cái)[動(dòng)的鐘擺。”英特爾的馬哈詹說,“過去大約20年里,世界的一切都在轉(zhuǎn)向云端?,F(xiàn)在, ■十大网投正规信誉官网■十大网投靠谱平台 看到鐘擺正在擺回來,應(yīng)用正在轉(zhuǎn)回到邊緣。”
作者:Prachi Patel