[技術(shù)前沿]利用生成式人工智能設(shè)計更好的機器人
它沒有向我展示原理圖,但確實激發(fā)了我的創(chuàng)造力。
2023年,或許可以稱為生成式人工智能之年。生成式人工智能是否會讓 ■十大网投正规信誉官网■十大网投靠谱平台 的生活變得更好,仍然沒有答案,但有一點是肯定的:新的人工智能工具正在迅速涌現(xiàn),并將在未來持續(xù)一段時間。工程師們在試驗這些工具的過程中獲益良多,于是將它們納入設(shè)計過程。
這已經(jīng)在某些領(lǐng)域成為現(xiàn)實。以阿斯頓?馬丁的DBR22概念車為例,設(shè)計師們依靠集成在Divergent技術(shù)公司的數(shù)字3D軟件中的人工智能,對后副車架部件的形狀和布局進行優(yōu)化。在此過程中,人工智能探索不同的形式,使得后副車架看起來像是擁有了有機的骨骼架構(gòu)。實際應(yīng)用的部件是順利獲得增材制造工藝生產(chǎn)的。阿斯頓?馬丁表示,這種方法大大減輕了部件的重量,同時又保持了部件的剛性。該公司計劃在即將推出的小批量車型中使用相同的設(shè)計和制造工藝。
人工智能輔助設(shè)計的其他例子可以在美國國家航空航天局的太空硬件中找到,包括行星儀器、太空望遠(yuǎn)鏡和火星樣本返回任務(wù)。美國國家航空航天局工程師萊恩?麥克利蘭(Ryan McClelland)表示,人工智能生成的新型設(shè)計可能“看起來有點陌生和奇怪”,但它們能承受更高的結(jié)構(gòu)載荷,重量卻比傳統(tǒng)組件更輕。此外,與傳統(tǒng)組件相比,設(shè)計只需要花費很小一部分時間。麥克利蘭稱此類新設(shè)計為“進化結(jié)構(gòu)”。這個短語指的是人工智能軟件順利獲得設(shè)計達成迭代突變,實現(xiàn)高性能設(shè)計。
美國國家航空航天局研究工程師萊恩·麥克利蘭使用商業(yè)人工智能軟件設(shè)計了這些3D打印組件,他將此稱之為“進化結(jié)構(gòu)“
在此類工程環(huán)境中,利用生成式人工智能,高質(zhì)量的結(jié)構(gòu)化數(shù)據(jù)和經(jīng)充分研究的參數(shù)聯(lián)合設(shè)計確實能夠帶來更具創(chuàng)意、更有效的新設(shè)計。我決定試一試。
在2022年1月,我開始在網(wǎng)絡(luò)物理系統(tǒng)的部分工作中試驗生成式人工智能。網(wǎng)絡(luò)物理系統(tǒng)涵蓋了廣泛的應(yīng)用,包括智能家居和自動駕駛汽車。它們依賴于物理和計算組件的集成,組件之間通常有反饋回路。要開發(fā)網(wǎng)絡(luò)物理系統(tǒng),設(shè)計師和工程師必須協(xié)同工作并要有創(chuàng)造性的想法。這是一個很耗時的過程,我想知道人工智能生成器能否幫助擴展設(shè)計選擇的范圍、實現(xiàn)更有效的迭代周期,或促進不同學(xué)科之間的合作。
開始進行生成式人工智能實驗時,我想要尋找的并非有關(guān)設(shè)計的具體指導(dǎo),而是靈感。最初,我只是出于好玩而嘗試了文本生成器和音樂生成器,但我最終發(fā)現(xiàn),圖像生成器最合適。圖像生成器是一種機器學(xué)習(xí)算法,可以根據(jù)一組輸入?yún)?shù)或提示詞來創(chuàng)建圖像。我測試了多個平臺,努力分析如何在每個平臺上形成良好的提示詞(即生成器用于生成圖像的輸入文本)。我嘗試過的平臺包括crayyon、DALL-E 2、Midjourney、NightCafé和Stable Diffusion,最后發(fā)現(xiàn)Midjourney和Stable Diffusion的組合最適合我的目標(biāo)。
Midjourney使用專有的機器學(xué)習(xí)模型, Stable Diffusion則免費給予源代碼。Midjourney只能在有互聯(lián)網(wǎng)連接的情況下使用,給予不同的訂購方案。Stable Diffusion可以免費下載到電腦上運行并使用,也可以支付象征性的費用在線使用。我在本地機器上使用Stable Diffusion并訂購了Midjourney。
在生成式人工智能的首次實驗中,我用圖像生成器聯(lián)合設(shè)計了一個水母機器人。 ■十大网投正规信誉官网■十大网投靠谱平台 計劃在瑞典烏普薩拉大學(xué)的實驗室里制造這臺機器人。 ■十大网投正规信誉官网■十大网投靠谱平台 的團隊專門研究受自然啟發(fā)的網(wǎng)絡(luò)物理系統(tǒng)。 ■十大网投正规信誉官网■十大网投靠谱平台 設(shè)想水母機器人從海洋中收集微塑料,并成為海洋生態(tài)系統(tǒng)的一部分。
在早期嘗試生成水母機器人的圖像時,作者使用了這樣的提示詞:水下、自給自足、迷你機器人、珊瑚礁、生態(tài)系統(tǒng)、超現(xiàn)實。(左上)順利獲得進一步完善提示詞,作者得到了更好的結(jié)果。對于(上中),她使用了這樣的提示詞:水母機器人、塑料、白色背景。(右上)結(jié)果源于這些提示詞:未來主義水母機器人、高精度、生活在水下、自給自足、快速、自然靈感。隨著作者在提示詞中添加了更多細(xì)節(jié),她得到的圖像與自己對水母機器人的看法更為一致。(下左、中、右)由這些提示詞產(chǎn)生:未來主義電動水母機器人設(shè)計為自給自足、生活在海底、水狀或彈性玻璃狀材料、變形人、技術(shù)設(shè)計、立體工業(yè)設(shè)計、馬克筆風(fēng)格、影院級高清、超高清、情緒分級、白色背景。
在實驗室中, ■十大网投正规信誉官网■十大网投靠谱平台 通常順利獲得迭代過程來設(shè)計網(wǎng)絡(luò)物理系統(tǒng),包括頭腦風(fēng)暴、繪制草圖、計算機建模、仿真、原型構(gòu)建和測試。 ■十大网投正规信誉官网■十大网投靠谱平台 第一時間建立團隊,根據(jù)系統(tǒng)的預(yù)期目的和限制條件提出原始概念。然后,制作粗略的草圖和基本的CAD模型,實現(xiàn)不同方案的可視化。 ■十大网投正规信誉官网■十大网投靠谱平台 對最有前途的設(shè)計進行仿真,進行動力學(xué)分析并完善機械部件設(shè)計。在構(gòu)建更完善的版本之前, ■十大网投正规信誉官网■十大网投靠谱平台 搭建簡化的原型以進行評估。順利獲得廣泛的測試, ■十大网投正规信誉官网■十大网投靠谱平台 改進系統(tǒng)的物理特性并控制系統(tǒng)。這是一個相互協(xié)作的過程,但很大程度上依賴于設(shè)計師過去的經(jīng)驗。
我想看看使用人工智能圖像生成器是否可以開啟未曾想到的可能性。我開始嘗試各種提示詞,從一句模糊的描述到冗長而詳細(xì)的解釋。一開始,因為不熟悉這一工具和它的功能,我不知道怎么提問,甚至不知道該問什么。最初的嘗試并未成功,這不難理解,因為我選擇的關(guān)鍵字不夠具體,也沒有給予任何關(guān)于風(fēng)格、背景或詳細(xì)要求的信息。
當(dāng)我嘗試更精確的提示詞時,設(shè)計結(jié)果開始看起來與我的設(shè)想同步。然后我嘗試了不同的材質(zhì)和材料,直到我對若干設(shè)計感到滿意。
幾分鐘內(nèi)便能看到原始提示詞的結(jié)果真是令人興奮,但要花數(shù)小時進行修改、重申概念、嘗試新的提示詞,并將成功元素整合到最終的設(shè)計中。
與人工智能共同設(shè)計的體驗頗具啟發(fā)性。提示詞可以包含多種屬性,包括主題、材料、環(huán)境、顏色,甚至是情緒。據(jù)我理解,好的提示詞必須具體,因為設(shè)計要服務(wù)于特定的目的。另一方面,我希望得到令人驚訝的結(jié)果。在所知所想與想要但未知或無法想象之間,需要找到平衡。我知道,任何未在提示詞中指定的內(nèi)容都可能被人工智能平臺隨機分配給圖像。因此,若想某個屬性產(chǎn)生令人驚訝的結(jié)果,便可以不對其加以提示。但若想在結(jié)果中包含某些具體的內(nèi)容,則必須加入在提示詞中,并且你必須清楚重要的上下文或細(xì)節(jié)。你也可以加入關(guān)于圖像組成的說明,如果設(shè)計工程產(chǎn)品,這將很有幫助。
作為調(diào)查研究的一部分,我想看看自己能在多大程度上控制共同創(chuàng)造的過程。結(jié)果是,有時有效,但大多數(shù)時候以失敗告終。
下圖中人形機器人設(shè)計圖中出現(xiàn)的文字并非真正的文字;它只是圖像生成器生成的字母和符號,是技術(shù)繪圖美學(xué)的一部分。當(dāng)我提示人工智能進行“技術(shù)設(shè)計”時,它經(jīng)常會加入此類偽語言,可能是因為訓(xùn)練數(shù)據(jù)包含的技術(shù)圖紙和藍圖示例中具有諸多相似文本。這些字母只是算法與這種風(fēng)格的插圖相關(guān)聯(lián)的視覺元素。因此,人工智能遵循它在數(shù)據(jù)中識別的模式,即使文本本身并無意義。這是一個無害的例子,說明了此類生成器如何在沒有真正理解的情況下,在訓(xùn)練中接受了怪癖或偏見。
為生成人形機器人(左)的圖像,作者從這個簡單的提示詞著手:人形機器人、白色背景。然后她試著生成一個帶有攝像頭雙眼的人形機器人的圖像(右)使用的提示詞為:人形機器人、攝像頭眼睛、技術(shù)設(shè)計、添加文本、全身角度、強壯手臂、V型身體、影院級高清、淺色背景。
當(dāng)我試圖把水母改成章魚的時候,設(shè)計結(jié)果卻變得慘不忍睹。這讓我很驚訝,因為對于工程師而言,水母和章魚看起來很相像——我要為這點向所有讀到這篇文章的海洋生物學(xué)家道歉。為什么生成器設(shè)計的水母很正常,設(shè)計的章魚如此僵硬,仿佛外星生物一般,結(jié)構(gòu)上也不正確?這仍然是個謎。我再次假設(shè)這與訓(xùn)練數(shù)據(jù)集有關(guān)。
作者使用相同的提示詞生成了4張類似章魚的機器人圖像:未來主義電動章魚機器人、技術(shù)設(shè)計、立體工業(yè)設(shè)計、馬克筆風(fēng)格、影院級高清、情緒分級、白色背景。
下方的兩個圖像是在上方圖像創(chuàng)建幾個月后創(chuàng)建的。它們看起來不那么粗糙,但仍然不像章魚。
使用人工智能圖像生成器制作了幾個有希望的水母機器人設(shè)計后,我和團隊一起進行設(shè)計審查,確定是否可以為真正的原型開發(fā)給予信息。 ■十大网投正规信誉官网■十大网投靠谱平台 討論了哪些美學(xué)和功能元素可以很好地轉(zhuǎn)化為物理模型。舉例而言,許多圖像中彎曲的傘形頂部可啟發(fā)選擇機器人保護外殼的材料。流動的觸手可以為實現(xiàn)與海洋環(huán)境相互作用的柔性操縱器給予設(shè)計線索。看到人工智能生成的圖像和抽象的藝術(shù)風(fēng)格中不同的材料和成分,能夠鼓勵 ■十大网投正规信誉官网■十大网投靠谱平台 對機器人的整體形式和運動進行更為大膽的創(chuàng)造性思考。
雖然 ■十大网投正规信誉官网■十大网投靠谱平台 最終決定不直接復(fù)制任何設(shè)計,但人工智能藝術(shù)的生物形狀激發(fā)了許多有益想法,促使 ■十大网投正规信誉官网■十大网投靠谱平台 進行進一步的研究與探索。這是一個重要的結(jié)果,因為工程設(shè)計師都知道,在尚未完成足夠的探索之前就開始執(zhí)行某些內(nèi)容是很誘人的。例如,即使計算機生成概念是空想或不切實際的,也可以作為粗略的原型,服務(wù)早期的工程設(shè)計。設(shè)計公司Ideo的首席執(zhí)行官蒂姆?布朗(Tim Brown)指出,這樣的原型“讓 ■十大网投正规信誉官网■十大网投靠谱平台 為了加快速度而慢下來。順利獲得花時間制作理念原型, ■十大网投正规信誉官网■十大网投靠谱平台 可以避免一些損失嚴(yán)重的錯誤,比如過早進行太過復(fù)雜的設(shè)計,或者長時間堅持軟弱的想法等。”
在另一個場合,我試圖使用圖像生成器來顯示智慧城市中通信的復(fù)雜性。
通常,我會在白板上創(chuàng)建圖表,然后使用微軟Visio、Adobe Illustrator或Adobe Photoshop等繪圖軟件,重新創(chuàng)建繪圖。我可能會在現(xiàn)成的示意圖庫中尋找自己想要納入的組件,包括車輛、建筑物、交通攝像頭、城市基礎(chǔ)設(shè)施、傳感器、數(shù)據(jù)庫。然后我會添加箭頭來顯示這些元素之間的潛在聯(lián)系和數(shù)據(jù)流。例如,在智慧城市插圖中,箭頭可以顯示交通攝像頭如何將實時數(shù)據(jù)發(fā)送到云端,并計算與擁堵相關(guān)的參數(shù),然后將優(yōu)化路線數(shù)據(jù)發(fā)送到聯(lián)網(wǎng)汽車。開發(fā)此類圖表需要仔細(xì)考慮不同系統(tǒng)和需要傳達的信息。這一過程需要完全專注于通信,并不適合自由探索不同視覺風(fēng)格。
作者嘗試創(chuàng)建智慧城市的信息流圖像,以這些提示文字為基礎(chǔ):圖像顯示了智慧城市中不同組件之間通信的復(fù)雜程度、白色背景、干凈的設(shè)計。
我發(fā)現(xiàn)使用人工智能圖像生成器可以比繪圖軟件給予更多的創(chuàng)作自由,但不能準(zhǔn)確描繪智慧城市中復(fù)雜的相互關(guān)聯(lián)。其結(jié)果是可以有效地表示許多單獨的元素,但它們在顯示信息流和交互方面并不成功。圖像生成器無法理解上下文或表示關(guān)聯(lián)性。
在使用圖像生成器數(shù)月之后,并將其推向極限,我得出了這樣的結(jié)論:它們可以用于探索嘗試、尋找靈感和生成快速插圖,在頭腦風(fēng)暴會議上與同事進行分享。即使圖像本身并不是現(xiàn)實或可行的設(shè)計,也可促使 ■十大网投正规信誉官网■十大网投靠谱平台 想象可能沒有考慮到的新方向;即使是不能準(zhǔn)確傳達信息流的圖像,也仍然能夠起到作用,有助于頭腦風(fēng)暴取得成效。
我也分析到,與生成式人工智能共同創(chuàng)作的過程需要毅力和奉獻精神。雖然快速取得良好的結(jié)果是有益的,但如果你有特定的議程且尋求特定的結(jié)果,這些工具就很難管理。此外,人類用戶幾乎無法控制人工智能生成的迭代,迭代的結(jié)果也不可預(yù)測。當(dāng)然,也可以繼續(xù)迭代,以期取得更好的結(jié)果。但就現(xiàn)在而言,幾乎不可能控制迭代在哪里結(jié)束。無論如何,我不能說共同創(chuàng)作的過程完全由人類主導(dǎo),至少不是現(xiàn)在的人類。
我注意到,自己在整個過程中的想法、表達想法的方式,甚至自己對結(jié)果的看法都發(fā)生了變化。很多時候,我在開始設(shè)計時都會有一個特定的想法,例如,分析特定的背景或材料。經(jīng)過幾次迭代后,我發(fā)現(xiàn)自己選擇的基于視覺特征和材料的設(shè)計,往往是我在第一次提示中沒有指定的內(nèi)容。在某些情況下,我的特定提示詞不起作用;相反,我必須使用能夠增加人工智能藝術(shù)自由度的參數(shù),同時降低其他指標(biāo)的重要性。所以,這一過程不僅允許我改變設(shè)計過程的產(chǎn)出,也允許人工智能改變設(shè)計,也許還會改變我的想法。
自從開始實驗以來,我使用的圖像生成器已經(jīng)更新了很多次,我發(fā)現(xiàn)更新的版本使結(jié)果更可預(yù)測。如果你的主要目的是看到非常規(guī)的設(shè)計概念,預(yù)測性往往并不如意,不過我可以理解,在與人工智能合作時需要更多的控制。我認(rèn)為,在未來, ■十大网投正规信誉官网■十大网投靠谱平台 將看到工具在定義良好的約束條件下實現(xiàn)更可預(yù)測的執(zhí)行結(jié)果。更重要的是,我希望看到圖像生成器與許多工程工具集成,看到人們將這些工具生成的數(shù)據(jù)用于訓(xùn)練。
圖片
當(dāng)然,使用圖像生成器會引發(fā)嚴(yán)重的倫理問題。它們可能會放大訓(xùn)練數(shù)據(jù)中的群體偏見和其他偏見。生成的內(nèi)容有可能傳播錯誤信息,侵犯隱私和知識產(chǎn)權(quán)。關(guān)于人工智能生成器對藝術(shù)家和作家生計的影響,許多擔(dān)憂也合情合理。顯然,在數(shù)據(jù)源、內(nèi)容生成和下游使用方面需要透明、監(jiān)督和問責(zé)。我認(rèn)為,任何選擇使用生成式人工智能的人都必須認(rèn)真對待這些問題,以合乎道德的方式使用生成器。
如果能確保生成式人工智能的使用合乎道德,我相信這些工具可以為工程師給予更多東西。與圖像生成器的共同創(chuàng)作可以幫助 ■十大网投正规信誉官网■十大网投靠谱平台 探索未來系統(tǒng)的設(shè)計。這些工具可以改變 ■十大网投正规信誉官网■十大网投靠谱平台 的思維方式,把 ■十大网投正规信誉官网■十大网投靠谱平台 帶出舒適區(qū)——這是在啟動嚴(yán)格的工程設(shè)計秩序之前,設(shè)法制造少許“混亂”的辦法。借助人工智能的力量,工程師們可以開始以不同的方式思考、更清楚地找出關(guān)聯(lián)、考慮未來的影響并設(shè)計出可持續(xù)的創(chuàng)新解決方案,改善世界各地的人們的生活。
作者:Didem Gürdür Broo