關(guān)于 ■十大网投正规信誉官网■十大网投靠谱平台 Company Profile

■十大网投正规信誉官网■十大网投靠谱平台 > 關(guān)于 ■十大网投正规信誉官网■十大网投靠谱平台 > 新聞中心

企業(yè)簡(jiǎn)介企業(yè)文化技術(shù)研發(fā) 質(zhì)量保證產(chǎn)品優(yōu)勢(shì) 新聞中心合作伙伴

[技術(shù)前沿]OpenAI突然發(fā)布的AI文字生成視頻模型Sora

02-19

在大年初七，春節(jié)假期的尾聲，OpenAI突然發(fā)布的AI文字生成視頻模型Sora被全網(wǎng)刷屏，馬斯克甚至感嘆“gg Humans”（gg是good game的縮寫(xiě)，在競(jìng)技游戲中原意為稱(chēng)贊對(duì)方打得不錯(cuò)，但現(xiàn)在主流的含義是代表認(rèn)輸退出）。

文字生成視頻的AI模型其實(shí)之前也有不少，比如去年11月美國(guó)AI初創(chuàng)公司Pika Labs發(fā)布的Pika 1.0；去年Runway推出了文生視頻模型Gen-1，并完成了兩次迭代；還有谷歌團(tuán)隊(duì)發(fā)布的視頻生成模型VideoPoet。但問(wèn)題在于，此前市面上的文生視頻模型只能生成數(shù)秒，最高十多秒的視頻。而Sora一上來(lái)就是60秒的視頻長(zhǎng)度，且生成視頻的細(xì)節(jié)、質(zhì)量幾乎“秒殺”其他文生視頻模型，這足以顛覆現(xiàn)在的視頻生成模型初創(chuàng)公司的格局。

視頻生成質(zhì)量炸裂，好萊塢時(shí)代要結(jié)束了？

Sora生成的視頻效果有多強(qiáng)？下面是OpenAI在官網(wǎng)展示的第一個(gè)視頻，也是最能夠表現(xiàn)Soar實(shí)力的視頻。

這個(gè)視頻的提示詞為“一位時(shí)尚女士走在東京的街道上，街道上充滿了溫暖的霓虹燈和動(dòng)畫(huà)城市標(biāo)志。她穿著黑色皮夾克、紅色長(zhǎng)裙和黑色靴子，拿著一個(gè)黑色錢(qián)包。她戴著太陽(yáng)鏡，涂著紅色口紅。她走路自信而隨意。街道潮濕且反光，形成了五顏六色燈光的鏡面效果。許多行人四處走動(dòng)。”

從視頻中，無(wú)論是運(yùn)鏡還是人物、地面、背景的細(xì)節(jié)，還有拉進(jìn)鏡頭后人物面部上的皺紋、毛發(fā)、墨鏡上的反光，都幾乎可以以假亂真，畫(huà)面穩(wěn)定不錯(cuò)位。在長(zhǎng)達(dá)60秒的視頻里，畫(huà)面隨鏡頭的大幅度運(yùn)動(dòng)并沒(méi)有出現(xiàn)錯(cuò)位的情況，整體風(fēng)格保持了驚人的一致性。

在復(fù)雜場(chǎng)景方面，另一個(gè)演示視頻同樣展現(xiàn)了Sora的炸裂效果。下面這個(gè)視頻使用的提示詞為：“一段美麗的自制視頻展示了2056年尼日利亞拉各斯的人們。用手機(jī)相機(jī)拍攝。”

同樣是運(yùn)鏡幅度巨大的場(chǎng)景，同時(shí)背景有大量的人物。在以往的文生圖模型中，類(lèi)似這種背景有人群的圖片都會(huì)產(chǎn)生很多錯(cuò)位，很容易看出AI的痕跡，而在Sora生成的這個(gè)視頻里，背景人群不仔細(xì)看很難發(fā)現(xiàn)有錯(cuò)誤，特別是在動(dòng)態(tài)的視頻當(dāng)中。另一方面在視頻后半段的人物近景里，大幅度運(yùn)動(dòng)的鏡頭同樣沒(méi)有對(duì)人物造成影響，畫(huà)面細(xì)節(jié)極為穩(wěn)定。

Sora生成視頻的穩(wěn)定，不止于單鏡頭的運(yùn)動(dòng)，即使是多鏡頭的畫(huà)面切換中，依然能夠保持色彩、畫(huà)面風(fēng)格的一致

除了真實(shí)場(chǎng)景之外，Sora還能以動(dòng)畫(huà)風(fēng)格生成視頻。比如使用提示詞：“動(dòng)畫(huà)場(chǎng)景特寫(xiě)了一個(gè)跪在融化的紅燭旁的毛茸茸的小怪物。藝術(shù)風(fēng)格是3D和現(xiàn)實(shí)主義的，重點(diǎn)是照明和紋理。這幅畫(huà)的基調(diào)是驚奇和好奇，因?yàn)楣治锉牬笱劬堉炷曋鹧?。它的姿?shì)和表情傳達(dá)出一種天真和頑皮的感覺(jué)，就好像它是第一次探索周?chē)氖澜?。暖色和戲劇性燈光的使用進(jìn)一步增強(qiáng)了圖像的舒適氛圍。”

生成出的動(dòng)畫(huà)形象與皮克斯電影幾乎不相上下，此前在動(dòng)畫(huà)電影中大費(fèi)周章渲染出的毛發(fā)，如今AI直接一鍵生成！難怪會(huì)有網(wǎng)友表示“好萊塢的時(shí)代要結(jié)束了”。

有博主將Sora跟Pika、Runway、Stable Video等幾個(gè)模型進(jìn)行對(duì)比，對(duì)其輸入同樣的提示詞：“美麗、多雪的東京城熙熙攘攘。鏡頭穿過(guò)熙熙攘攘的城市街道，跟隨幾個(gè)享受美麗的下雪天氣和在附近攤位購(gòu)物的人。絢麗的櫻花花瓣隨著雪花隨風(fēng)飛舞?！?/p>

結(jié)果Sora生成的視頻無(wú)論是時(shí)間長(zhǎng)度、還是運(yùn)鏡、畫(huà)面細(xì)節(jié)，都完勝其他幾個(gè)模型生成出的視頻。比如Pika和Runway生成的視頻在短短幾秒時(shí)間里都只有固定鏡頭畫(huà)面，Stable Video有鏡頭移動(dòng)的變化，但時(shí)長(zhǎng)太短。

Sora還未完美，OpenAI揭秘背后技術(shù)

現(xiàn)在Sora還未對(duì)大眾開(kāi)放，OpenAI表示Sora正在面向部分用戶(hù)開(kāi)放，以評(píng)估關(guān)鍵領(lǐng)域的潛在危害或風(fēng)險(xiǎn)。同時(shí)，OpenAI也邀請(qǐng)了一批視覺(jué)藝術(shù)家、設(shè)計(jì)師和電影制作人加入以有助于模型的開(kāi)展。

當(dāng)然，在驚艷的演示視頻外，Sora的視頻生成也并非完美。OpenAI也表示，現(xiàn)在的模型可能難以準(zhǔn)確模擬復(fù)雜場(chǎng)景的物理特性，也可能不理解因果關(guān)系的具體實(shí)例，比如一個(gè)人咬了一口餅干，餅干上可能沒(méi)有咬痕。Sora生成的視頻還可能混淆提示詞中關(guān)于空間的細(xì)節(jié)（比如左右），并且難以準(zhǔn)確描述隨時(shí)間發(fā)生的事件，比如跟隨特定的鏡頭軌跡等。

比如上面動(dòng)圖中所使用的提示詞為“五只灰狼崽在一條偏僻的碎石路上嬉戲追逐，周?chē)际遣莸亍Ｐ」穫儽寂芴S，相互追逐，相互撕咬，嬉戲玩?！?，但實(shí)際畫(huà)面中灰狼數(shù)量出錯(cuò)，并且部分是憑空出現(xiàn)又憑空消失，出現(xiàn)身體互相重疊等現(xiàn)象。

對(duì)于Sora背后使用的技術(shù)，OpenAI在官網(wǎng)上發(fā)布了一篇報(bào)告進(jìn)行了介紹，但只提到了方便大模型進(jìn)行訓(xùn)練的數(shù)據(jù)處理方式和對(duì)Sora局限性的評(píng)價(jià)，沒(méi)有太多技術(shù)細(xì)節(jié)。

根據(jù)介紹，Sora是一種diffusion模型，它從一個(gè)看起來(lái)像靜態(tài)噪聲的視頻開(kāi)始生成視頻，并順利獲得多個(gè)步驟去除噪聲來(lái)逐漸轉(zhuǎn)換視頻。與GPT相似，Sora算法層面也采用了transformer，以釋放出強(qiáng)大的擴(kuò)展性能。

OpenAI表示，Sora是以過(guò)于公司對(duì)DALL·E和GPT模型的研究作為基礎(chǔ)，使用了DALL·E 3中的重新標(biāo)注技術(shù)。順利獲得用一個(gè)能夠生成詳細(xì)描述的標(biāo)注模型，為訓(xùn)練集中的所有視頻生成詳細(xì)的文字說(shuō)明，這能夠提高文字準(zhǔn)確性的同時(shí)，還能提升視頻的整體質(zhì)量。

與DALL·E 3類(lèi)似，OpenAI也使用了GPT將簡(jiǎn)短的用戶(hù)提示詞轉(zhuǎn)換為更詳細(xì)的文本，所以Sora能夠準(zhǔn)確理解用戶(hù)提示，并生成對(duì)應(yīng)視頻。

另外，OpenAI還透露了Sora的其他能力，包括接受圖像和文本說(shuō)明輸出視頻、能夠以時(shí)間線向前或向后擴(kuò)展視頻、生成圖像、改變視頻風(fēng)格和環(huán)境、無(wú)縫連接兩個(gè)不同視頻等等。

業(yè)界大佬評(píng)價(jià)：“真的非常?！?“中美AI差距進(jìn)一步拉大”

Sora的“刷屏”，引起了多位業(yè)內(nèi)大佬的關(guān)注。前阿里技術(shù)副總裁賈揚(yáng)清也感嘆“Sora真的非常?！?，并認(rèn)為對(duì)標(biāo)OpenAI的公司有一波被其他大廠因?yàn)楹ε洛e(cuò)過(guò)AI而收購(gòu)相關(guān)公司的機(jī)會(huì)。對(duì)于其他算法小廠，賈揚(yáng)清建議“要不就算法上媲美OpenAI，要不就垂直領(lǐng)域深耕應(yīng)用，要不就開(kāi)源”，最后他預(yù)言AI infra（AI基礎(chǔ)設(shè)施）的需求會(huì)繼續(xù)猛增。

360董事長(zhǎng)周鴻祎則回應(yīng)了如何看待Sora的問(wèn)題，他認(rèn)為科技競(jìng)爭(zhēng)最終比拼的是讓人才密度和深厚積累，“很多人說(shuō) Sora的效果吊打Pika和Runway。這很正常，和創(chuàng)業(yè)者團(tuán)隊(duì)比，OpenAl 這種有核心技術(shù)的公司實(shí)力還是非常強(qiáng)勁的。有人認(rèn)為有了AI以后創(chuàng)業(yè)公司只需要做個(gè)體戶(hù)就行，實(shí)際今天再次證明這種想法是非?？尚Φ??！?/p>

周鴻祎還表示，AI不一定那么快顛覆所有行業(yè)，但它能激發(fā)更多人的創(chuàng)作力。關(guān)于國(guó)內(nèi)外的AI大模型差距，周鴻祎認(rèn)為國(guó)內(nèi)大模型開(kāi)展距離GPT-4.0還有一年半的差距，并且相信OpenAl手里應(yīng)該還藏著一些秘密武器。“奧特曼是個(gè)營(yíng)銷(xiāo)大師，知道怎樣掌握節(jié)奏，他們手里的武器并沒(méi)有全拿出來(lái)。這樣看來(lái)中國(guó)跟美國(guó)的AI差距可能還在加大?！?/p>

關(guān)于大模型本身，周鴻祎對(duì)Sora理解為OpenAl利用它的大語(yǔ)言模型優(yōu)勢(shì)，把LLM和 Diffusion結(jié)合起來(lái)訓(xùn)練，讓Sora實(shí)現(xiàn)了對(duì)現(xiàn)實(shí)世界的理解和對(duì)世界的模擬兩層能力，這樣產(chǎn)生的視頻才是真實(shí)的，才能跳出2D的范圍模擬真實(shí)的物理世界。而得益于大量視頻的訓(xùn)練，周鴻祎認(rèn)為AI對(duì)世界的理解將遠(yuǎn)超文字學(xué)習(xí)，可能未來(lái)一到兩年就能實(shí)現(xiàn)AGI（通用人工智能）。

而作為去年年底爆火的AI視頻生成初創(chuàng)公司Pika創(chuàng)始人，郭文景將Sora的發(fā)布視為動(dòng)力，表示“ ■十大网投正规信誉官网■十大网投靠谱平台覺(jué)得這是一個(gè)很振奮人心的消息， ■十大网投正规信誉官网■十大网投靠谱平台已經(jīng)在籌備直接沖，將直接對(duì)標(biāo) Sora?！?/p>

聯(lián)系 ■十大网投正规信誉官网■十大网投靠谱平台

400-033-8869
thzw@rltszb.com
北京市朝陽(yáng)區(qū)望京東路8號(hào)銳創(chuàng)國(guó)際中心B座7層

關(guān)注 ■十大网投正规信誉官网■十大网投靠谱平台

關(guān)注微博
關(guān)注微信
關(guān)注公眾號(hào)
關(guān)注抖音號(hào)

全免费a级毛片免费看网站,人妻互换精品一区二区,亚洲午夜久久久久久久久电影网,久久久无码一区二区三区

■十大网投正规信誉官网■十大网投靠谱平台

功率放大器

變頻器

信號(hào)源

移相器

衰減器

濾波器

射頻線纜及天線

無(wú)線傳輸系統(tǒng)

檢波器

功率合成器

功分器

多工器

耦合器

環(huán)形器

隔離器

避雷器

關(guān)于 ■十大网投正规信誉官网■十大网投靠谱平台 Company Profile

[技術(shù)前沿]OpenAI突然發(fā)布的AI文字生成視頻模型Sora

推薦新聞

■十大网投正规信誉官网■十大网投靠谱平台科技微波小課堂_有損傳輸線和無(wú)損傳輸線簡(jiǎn)介

■十大网投正规信誉官网■十大网投靠谱平台科技微波小課堂_用于車(chē)聯(lián)網(wǎng)的主要無(wú)線技術(shù)

[行業(yè)動(dòng)態(tài)]下一代半導(dǎo)體材料來(lái)襲

[技術(shù)前沿]核能成為航運(yùn)新選擇

[行業(yè)動(dòng)態(tài)]一家本土廠商在電流感測(cè)元件細(xì)分賽道開(kāi)展成了隱形冠軍

大神分享的如何才能成為一名優(yōu)秀的射頻工程師？

聯(lián)系 ■十大网投正规信誉官网■十大网投靠谱平台

關(guān)注 ■十大网投正规信誉官网■十大网投靠谱平台

全免费a级毛片免费看网站,人妻互换精品一区二区,亚洲午夜久久久久久久久电影网,久久久无码一区二区三区

■十大网投正规信誉官网■十大网投靠谱平台

功率放大器

變頻器

信號(hào)源

移相器

衰減器

濾波器

射頻線纜及天線

無(wú)線傳輸系統(tǒng)

檢波器

功率合成器

功分器

多工器

耦合器

環(huán)形器

隔離器

避雷器

關(guān)于 ■十大网投正规信誉官网■十大网投靠谱平台 Company Profile

[技術(shù)前沿]OpenAI突然發(fā)布的AI文字生成視頻模型Sora

推薦新聞

■十大网投正规信誉官网■十大网投靠谱平台 科技微波小課堂_有損傳輸線和無(wú)損傳輸線簡(jiǎn)介

■十大网投正规信誉官网■十大网投靠谱平台 科技微波小課堂_用于車(chē)聯(lián)網(wǎng)的主要無(wú)線技術(shù)

[行業(yè)動(dòng)態(tài)]下一代半導(dǎo)體材料來(lái)襲

[技術(shù)前沿]核能成為航運(yùn)新選擇

[行業(yè)動(dòng)態(tài)]一家本土廠商在電流感測(cè)元件細(xì)分賽道開(kāi)展成了隱形冠軍

大神分享的如何才能成為一名優(yōu)秀的射頻工程師？

聯(lián)系 ■十大网投正规信誉官网■十大网投靠谱平台

關(guān)注 ■十大网投正规信誉官网■十大网投靠谱平台

■十大网投正规信誉官网■十大网投靠谱平台科技微波小課堂_有損傳輸線和無(wú)損傳輸線簡(jiǎn)介

■十大网投正规信誉官网■十大网投靠谱平台科技微波小課堂_用于車(chē)聯(lián)網(wǎng)的主要無(wú)線技術(shù)