Meta 最近推出了一款先進的視頻生成模型,名為 Movie Gen,隨著 Llama 3.2 多模態模型的發布,該公司的技術再度引起關注。根據 Meta 的說法,這一基礎模型不僅限於人工智能視頻生成,還能生成圖像、音頻,甚至進行視頻編輯。
Movie Gen 被視為一個前沿媒體基礎模型。需要注意的是,Meta 尚未發布該模型或其權重,但已公開了一篇展示 Movie Gen 能力的論文。
首先,Movie Gen 視頻模型是一個擁有 30B 參數的模型,可以根據簡單的文本提示生成長達 16 秒的高清(HD)視頻。Meta 表示,這個模型還可以生成高質量的圖像。在演示中,生成的視頻效果非常驚人,遠超過 Runway、Pika 或 Luma 的人工智能視頻。事實上,其效果與 OpenAI 的 Sora 和 Google 的 Veo 模型相當。
接下來,Movie Gen 音頻模型擁有 13B 參數,功能獨特且強大。用戶可以直接將視頻輸入該模型,Movie Gen 音頻模型能生成長達 45 秒的高保真音樂,並與視頻同步。不僅如此,用戶還可以在視頻中添加自己的提示,以獲得特定類型的聲音。這個模型可以生成環境音、器樂音樂和音效音效。
Movie Gen 還提供精確的人工智能視頻編輯功能。Meta 表示,用戶可以上傳現有的或由人工智能生成的視頻,並進行針對性的編輯。與人工智能圖像編輯類似,用戶可以使用簡單的文本提示添加、刪除或替換視頻中的元素。除此之外,用戶還可以進行更廣泛的更改,例如更改背景或調整風格。
最後,個性化視頻功能允許用戶上傳自己的照片,Movie Gen 可以在保留原始角色的情況下創建視頻。該功能還承諾在視頻中實現自然的動作。總的來看,Meta 似乎已經開發出一個前沿的媒體模型,緊密整合了視頻、音頻和圖像。
B4travel 5G 日本電話卡 9日 10GB 無限上網 / B4travel 5G 台灣電話卡 8日 20GB 無限上網
日本電話卡推介 / 台灣電話卡推介
更多儲值卡評測請即睇:SIM Card 大全
https://www.techritual.com/category/sim-card-review/