Google Flash 2.0:5 種提升 AI 圖像生成藝術的技巧

AI 藝術生成技術正在迅速發展,而 Google 最近推出的 Gemini Flash 2.0 是這一領域中的一個重要競爭者。用戶可以在 Google 的 AI Studio 中體驗這一全新的圖像創作工具。

Gemini Flash 的速度非常快,顯著快於 DALL-E 3 和其他圖像創建工具。這種速度可能會導致圖像質量下降,但在這裡並非如此,因為模型的圖像生成能力經過了多次改進。然而,要獲得優質的結果,使用者必須學會如何與 AI 進行有效的對話。經過多次嘗試,我整理出了五個技巧,以便從 Gemini Flash 2.0 中獲得最佳藝術創作。這些建議可能與其他 AI 藝術創作工具的建議相似,但在這個上下文中同樣有其價值。

講述故事

Gemini Flash 的一個有趣新特性是,它不僅適合單次插圖,還可以幫助用戶創建視覺故事,生成一系列風格、場景和情感一致的相關圖像。要開始創作,只需請求 AI 講述一個故事並告訴它希望每個動作生成插圖的頻率。最終結果將包括伴隨文本的圖像。

在我的項目中,我請求 AI 生成「一隻英勇的小龍保護一位仙女女王免受邪惡巫師的侵害,風格為 3D 卡通動畫。每個場景生成一幅圖像。」隨著請求的發出,相關圖像開始出現。如果出現問題,用戶可以隨時修改故事的某些部分,模型將根據修改重新生成圖像。

具體描述

如果你告訴 Gemini 創建「一隻在公園裡的狗」,你可能會得到一隻模糊的金毛尋回犬坐在某個不明確的綠色地方。但如果你說「一隻蓬鬆的金毛尋回犬坐在中央公園的木長椅上,秋天的地面上散落著紅色和橙色的樹葉」——你將獲得與你想像中的完全一致的圖像。

AI 模型在細節方面表現得尤為出色。提供的細節越多,圖像的質量就越高。因此,對於上面的圖像,我請求「一個復古未來主義的城市風景,在日落時分,霓虹燈發出粉色和藍色的光芒,天空中有飛行汽車,行人穿著復古未來風格的服裝。」七秒鐘後,結果如願而至。

進行對話

我最喜歡 Gemini Flash 的一個功能是,可以與它進行對話而不會損失太多速度。這意味著用戶不必在第一次請求時就完全正確。生成圖像後,用戶可以與 AI 進行對話進行修改。想改變顏色?添加角色?讓燈光更柔和?只需請求即可。

在上面的圖像設置中,我首先請求「一個有壁爐的舒適閱讀角落,書架上滿是小說,還有一把大舒適的扶手椅。」然後我要求它「將燈光調整為柔和的暖色調的夜晚」,接著再請求「在扶手椅上添加一隻睡覺的貓」,最後要求 AI「給房間增添一種復古的維多利亞風格。」最終結果幾乎與我想像中的完全一致,讓 Gemini 感覺像是一位藝術助手,能夠根據我的需求進行調整,而不必每次都從頭開始。

真實世界的知識

Google 自豪地宣稱 Gemini 具備豐富的現實世界知識,這意味著如果用戶請求,將能獲得歷史準確性、真實的文化細節以及逼真的圖像。當然,這需要具體的描述。例如,如果你請求「一位維京戰士」,你可能會得到看起來更像《權力的遊戲》中的角色。但如果你說「一位 9 世紀的歷史準確維京戰士,穿著詳細的鏈甲盔甲,手持圓形木盾,戴著傳統的北歐頭盔」——你將獲得更精確的圖像。

作為測試,我請求 AI 生成「一座在日出時分的古代瑪雅城市,擁有高聳的石頭金字塔、郁郁蔥蔥的叢林環繞,還有穿著傳統瑪雅服裝的人們。」結果雖然不完美,但與之前的版本相比,這次的圖像更接近真實。

快速生成文本

大多數 AI 圖像模型在渲染文本方面長期以來一直存在困難,將文字轉換為難以辨認的潦草字跡。即使是當今較好的模型也需要一些時間來完成這項工作,並且正確生成文本可能需要幾次嘗試。然而,Gemini Flash 在快速且清晰地將文本整合到圖像中方面表現得相當出色。當然,具體的描述會有所幫助。

我就是這樣生成了上面的圖像,請求 AI「製作一張復古風格的旅遊海報,上面用粗體復古字體寫著 ‘Visit London’,並配有城市的風格化插圖。」

【教學】如何在香港申請 Google Gemini 及訂閱 Google Gemini Advanced /
【說明】4 個方法,讓你的 iPhone / Android 在香港無需 VPN 就能用 ChatGPT

十斗
十斗https://www.techritual.com/author/tenten/
十斗在知名大學取得了計算機科學與工程學位,並在學術研究方面表現出色。她的研究領域包括人工智能、機器學習和數據科學。一斗為十升,一升為十合,一合為十分之一升。謝靈運言天下才學一石,曹植占八斗,以此讚譽。後用以比喻才學極高。