
只需輸入一段文字描述,AI大模型Sora 2就能將其生成為電影級(jí)效果的短視頻,由其驅(qū)動(dòng)的短視頻創(chuàng)作應(yīng)用“Sora”,也在ios美區(qū)商店持續(xù)“霸榜”。
9月30日,AI大模型龍頭公司OpenAI發(fā)布最新音視頻生成模型Sora 2,其官方發(fā)布稿稱(chēng),Sora 2相較此前模型在物理上更準(zhǔn)確、更逼真、更可控,它還具有同步對(duì)話和音效的功能。由Sora 2驅(qū)動(dòng)的Sora也在當(dāng)天登陸美區(qū)蘋(píng)果商店,10月3日至今,Sora一直占據(jù)免費(fèi)應(yīng)用下載榜第一位。
文字一鍵生成視頻,更加真實(shí)也更加聰明
2024年9月,OpenAI發(fā)布了Sora 2的上一個(gè)版本,用戶(hù)可以使用文本、圖像或其他視頻生成長(zhǎng)達(dá)20秒的視頻,OpenAI將其稱(chēng)為視頻的GPT-1時(shí)刻。該公司稱(chēng),從那時(shí)起Sora團(tuán)隊(duì)就一直專(zhuān)注于訓(xùn)練具有更高級(jí)模擬真實(shí)世界能力的模型,這需要以大規(guī)模視頻數(shù)據(jù)為基礎(chǔ),進(jìn)行預(yù)訓(xùn)練和后訓(xùn)練。
OpenAI在官方文檔中表示,相比上一代的模型,Sora 2可以生成更為復(fù)雜、更具真實(shí)感的視頻:包括奧運(yùn)體操運(yùn)動(dòng)員式的動(dòng)作,一名運(yùn)動(dòng)者在槳板上進(jìn)行后空翻,準(zhǔn)確呈現(xiàn)現(xiàn)實(shí)世界中浮力和剛度的狀態(tài),以及一位花樣滑冰選手頭頂一只貓完成三周半跳。官方文檔進(jìn)一步解釋?zhuān)饲暗拇竽P蜑榱藞?zhí)行文本給出的指令和描述,會(huì)扭曲物體和現(xiàn)實(shí)世界,例如,當(dāng)籃球運(yùn)動(dòng)員投籃未中時(shí),球可能會(huì)憑空傳送到籃筐。而在Sora 2中,若球員投籃未中,球會(huì)從籃板反彈。
在音響效果和風(fēng)格方面,Sora 2作為一款通用音視頻生成系統(tǒng),它能夠創(chuàng)建高度逼真的復(fù)雜背景音景、語(yǔ)音及音效,Sora 2也更擅長(zhǎng)呈現(xiàn)寫(xiě)實(shí)風(fēng)格、電影風(fēng)格和動(dòng)漫風(fēng)格的視頻。
在蘋(píng)果商店上架的Sora App采用類(lèi)似抖音、快手的豎屏短視頻流形式,用戶(hù)可瀏覽、點(diǎn)贊、評(píng)論AI生成的視頻,用戶(hù)也可通過(guò)文字提示、圖片、Cameo(客串)或Remix(混剪)功能生產(chǎn)并分享視頻。值得注意的是,Sora App所有視頻都是由AI生成的,對(duì)用戶(hù)上傳的素材、文字提示的內(nèi)容有較嚴(yán)格的限制。目前,Sora仍然采取受邀注冊(cè)機(jī)制。
據(jù)媒體報(bào)道,Sora應(yīng)用上線蘋(píng)果商店后,上線首日就迅速實(shí)現(xiàn)約5.6萬(wàn)次安裝,迅速攀升至美國(guó)App Store“整體應(yīng)用榜”第3名。到10月3日,其排名已升至第1位。這一強(qiáng)勁勢(shì)頭使Sora的首發(fā)表現(xiàn)超越了其他主流AI應(yīng)用的推出初期表現(xiàn),包括Anthropic的Claude和微軟的Copilot,并與埃隆?馬斯克旗下xAI推出的Grok應(yīng)用推出時(shí)的表現(xiàn)相當(dāng)。
根據(jù)OpenAI發(fā)布的Sora 2提示詞指南,創(chuàng)作者可以給大模型一段模糊的文字提示,大模型會(huì)即興發(fā)揮生成視頻,創(chuàng)作者也可針對(duì)鏡頭、燈光或動(dòng)作提出具體細(xì)致的要求,大模型則會(huì)嚴(yán)格執(zhí)行這些指令生成視頻,就視頻生成效果而言,兩種方法可謂各有千秋。
視頻生成領(lǐng)域的GPT-3.5時(shí)刻
對(duì)于Sora 2的發(fā)布,OpenAI將其稱(chēng)為視頻生成領(lǐng)域的GPT-3.5時(shí)刻。市場(chǎng)分析認(rèn)為,Sora從模型邁向社交平臺(tái),有望重塑創(chuàng)作者內(nèi)容生態(tài),對(duì)于AI基礎(chǔ)設(shè)施而言,則有望進(jìn)一步拉動(dòng)算力、存儲(chǔ)需求。
華鑫證券研報(bào)認(rèn)為,Sora2模型的在物理真實(shí)感、視頻時(shí)長(zhǎng)、音視頻同步、跨鏡頭連貫等技術(shù)上的飛躍有望推動(dòng)應(yīng)用端的實(shí)用性、可玩性,同時(shí),本次OpenAI把Sora2 App直接打包成面向大眾的社交產(chǎn)品也是AI視頻創(chuàng)作消費(fèi)級(jí)應(yīng)用的一次較好嘗試,每一次技術(shù)的進(jìn)步均有望帶來(lái)時(shí)代的紅利,AI已不再是“輔助”,而成為新成本曲線與盈利曲線的起點(diǎn),打造AI時(shí)代消費(fèi)級(jí)頭部應(yīng)用將成為各家企業(yè)爭(zhēng)相布局方向。
民生證券研報(bào)認(rèn)為,以Sora2為切入點(diǎn),OpenAI或?qū)⑿纬梢浴皟?nèi)容平臺(tái)激發(fā)需求(Sora)—支付渠道保障(Stripe)—電商平臺(tái)供給商品(Shopify/Etsy)”的商業(yè)模式閉環(huán),通過(guò)“代理商務(wù)協(xié)議”(Agentic Commerce Protocol,ACP)構(gòu)建 AI 時(shí)代的全新商業(yè)模型。用戶(hù)的電商購(gòu)物行為自然可能轉(zhuǎn)向 AI 驅(qū)動(dòng)的“對(duì)話式購(gòu)物”,隨著商家覆蓋與支付能力的進(jìn)一步擴(kuò)大,“對(duì)話式購(gòu)物”或許能顛覆傳統(tǒng)電商流量分配規(guī)則。
東莞證券研報(bào)則認(rèn)為,Sora 2在視頻生成能力上實(shí)現(xiàn)重大突破,有望進(jìn)一步拉動(dòng)算力與存儲(chǔ)需求。視頻模型質(zhì)量提升往往以更大的模型、更長(zhǎng)序列或更多訓(xùn)練數(shù)據(jù)為代價(jià),直接增加訓(xùn)練與推理算力需求;存儲(chǔ)方面,高質(zhì)量、長(zhǎng)時(shí)長(zhǎng)的視頻數(shù)據(jù)本身體積龐大,模型訓(xùn)練需處理海量視頻-文本配對(duì)數(shù)據(jù)集,對(duì)存儲(chǔ)容量和I/O帶寬要求極高,隨著Sora 2推向應(yīng)用后,用戶(hù)生成的每一條視頻都會(huì)產(chǎn)生大量數(shù)據(jù),顯著提升對(duì)云存儲(chǔ)和分發(fā)帶寬的需求。
京公網(wǎng)安備 11010802028547號(hào)