Google Flash 2.0：5 種提升 AI 圖像生成藝術的技巧

AI 藝術生成技術正在迅速發展，而 Google 最近推出的 Gemini Flash 2.0 是這一領域中的一個重要競爭者。用戶可以在 Google 的 AI Studio 中體驗這一全新的圖像創作工具。

Gemini Flash 的速度非常快，顯著快於 DALL-E 3 和其他圖像創建工具。這種速度可能會導致圖像質量下降，但在這裡並非如此，因為模型的圖像生成能力經過了多次改進。然而，要獲得優質的結果，使用者必須學會如何與 AI 進行有效的對話。經過多次嘗試，我整理出了五個技巧，以便從 Gemini Flash 2.0 中獲得最佳藝術創作。這些建議可能與其他 AI 藝術創作工具的建議相似，但在這個上下文中同樣有其價值。

講述故事

Gemini Flash 的一個有趣新特性是，它不僅適合單次插圖，還可以幫助用戶創建視覺故事，生成一系列風格、場景和情感一致的相關圖像。要開始創作，只需請求 AI 講述一個故事並告訴它希望每個動作生成插圖的頻率。最終結果將包括伴隨文本的圖像。

在我的項目中，我請求 AI 生成「一隻英勇的小龍保護一位仙女女王免受邪惡巫師的侵害，風格為 3D 卡通動畫。每個場景生成一幅圖像。」隨著請求的發出，相關圖像開始出現。如果出現問題，用戶可以隨時修改故事的某些部分，模型將根據修改重新生成圖像。

具體描述

如果你告訴 Gemini 創建「一隻在公園裡的狗」，你可能會得到一隻模糊的金毛尋回犬坐在某個不明確的綠色地方。但如果你說「一隻蓬鬆的金毛尋回犬坐在中央公園的木長椅上，秋天的地面上散落著紅色和橙色的樹葉」——你將獲得與你想像中的完全一致的圖像。

AI 模型在細節方面表現得尤為出色。提供的細節越多，圖像的質量就越高。因此，對於上面的圖像，我請求「一個復古未來主義的城市風景，在日落時分，霓虹燈發出粉色和藍色的光芒，天空中有飛行汽車，行人穿著復古未來風格的服裝。」七秒鐘後，結果如願而至。

進行對話

我最喜歡 Gemini Flash 的一個功能是，可以與它進行對話而不會損失太多速度。這意味著用戶不必在第一次請求時就完全正確。生成圖像後，用戶可以與 AI 進行對話進行修改。想改變顏色？添加角色？讓燈光更柔和？只需請求即可。

在上面的圖像設置中，我首先請求「一個有壁爐的舒適閱讀角落，書架上滿是小說，還有一把大舒適的扶手椅。」然後我要求它「將燈光調整為柔和的暖色調的夜晚」，接著再請求「在扶手椅上添加一隻睡覺的貓」，最後要求 AI「給房間增添一種復古的維多利亞風格。」最終結果幾乎與我想像中的完全一致，讓 Gemini 感覺像是一位藝術助手，能夠根據我的需求進行調整，而不必每次都從頭開始。

真實世界的知識

Google 自豪地宣稱 Gemini 具備豐富的現實世界知識，這意味著如果用戶請求，將能獲得歷史準確性、真實的文化細節以及逼真的圖像。當然，這需要具體的描述。例如，如果你請求「一位維京戰士」，你可能會得到看起來更像《權力的遊戲》中的角色。但如果你說「一位 9 世紀的歷史準確維京戰士，穿著詳細的鏈甲盔甲，手持圓形木盾，戴著傳統的北歐頭盔」——你將獲得更精確的圖像。

作為測試，我請求 AI 生成「一座在日出時分的古代瑪雅城市，擁有高聳的石頭金字塔、郁郁蔥蔥的叢林環繞，還有穿著傳統瑪雅服裝的人們。」結果雖然不完美，但與之前的版本相比，這次的圖像更接近真實。

快速生成文本

大多數 AI 圖像模型在渲染文本方面長期以來一直存在困難，將文字轉換為難以辨認的潦草字跡。即使是當今較好的模型也需要一些時間來完成這項工作，並且正確生成文本可能需要幾次嘗試。然而，Gemini Flash 在快速且清晰地將文本整合到圖像中方面表現得相當出色。當然，具體的描述會有所幫助。

我就是這樣生成了上面的圖像，請求 AI「製作一張復古風格的旅遊海報，上面用粗體復古字體寫著 ‘Visit London’，並配有城市的風格化插圖。」

【教學】如何在香港申請 Google Gemini 及訂閱 Google Gemini Advanced /
【說明】4 個方法，讓你的 iPhone / Android 在香港無需 VPN 就能用 ChatGPT