Meta 公布 ‘Movie Gen’ 人工智能視頻生成模型 以挑戰 OpenAI 的 Sora 和 Veo 模型

Meta 最近推出了一款先進的視頻生成模型,名為 Movie Gen,隨著 Llama 3.2 多模態模型的發布,該公司的技術再度引起關注。根據 Meta 的說法,這一基礎模型不僅限於人工智能視頻生成,還能生成圖像、音頻,甚至進行視頻編輯。

Movie Gen 被視為一個前沿媒體基礎模型。需要注意的是,Meta 尚未發布該模型或其權重,但已公開了一篇展示 Movie Gen 能力的論文。

meta movie gen ai video editing

首先,Movie Gen 視頻模型是一個擁有 30B 參數的模型,可以根據簡單的文本提示生成長達 16 秒的高清(HD)視頻。Meta 表示,這個模型還可以生成高質量的圖像。在演示中,生成的視頻效果非常驚人,遠超過 Runway、Pika 或 Luma 的人工智能視頻。事實上,其效果與 OpenAI 的 Sora 和 Google 的 Veo 模型相當。

接下來,Movie Gen 音頻模型擁有 13B 參數,功能獨特且強大。用戶可以直接將視頻輸入該模型,Movie Gen 音頻模型能生成長達 45 秒的高保真音樂,並與視頻同步。不僅如此,用戶還可以在視頻中添加自己的提示,以獲得特定類型的聲音。這個模型可以生成環境音、器樂音樂和音效音效。

Movie Gen 還提供精確的人工智能視頻編輯功能。Meta 表示,用戶可以上傳現有的或由人工智能生成的視頻,並進行針對性的編輯。與人工智能圖像編輯類似,用戶可以使用簡單的文本提示添加、刪除或替換視頻中的元素。除此之外,用戶還可以進行更廣泛的更改,例如更改背景或調整風格。

最後,個性化視頻功能允許用戶上傳自己的照片,Movie Gen 可以在保留原始角色的情況下創建視頻。該功能還承諾在視頻中實現自然的動作。總的來看,Meta 似乎已經開發出一個前沿的媒體模型,緊密整合了視頻、音頻和圖像。

 

B4travel 5G 日本電話卡 9日 10GB 無限上網 / B4travel 5G 台灣電話卡 8日 20GB 無限上網

日本電話卡推介 / 台灣電話卡推介
更多儲值卡評測請即睇:SIM Card 大全
https://www.techritual.com/category/sim-card-review/

Henderson
Henderson
Henderson 主要擔任「炒稿記者」的職責,以翻譯最新科技,手機 電動車等消息為每天的工作。