Stock / PTTBBS 推薦

[新聞] Gemini 3 Pro Image:「Nano Banana Pro

看板: Stock

作者: empliu (Liu)

標題: [新聞] Gemini 3 Pro Image:「Nano Banana Pro

時間: Fri Nov 21 01:05:41 2025


原文標題:


Gemini 3 Pro Image:「Nano Banana Pro」重新定義 AI 影像生成


原文連結:https://o3o.us/dKrxQ7



發布時間:November 21, 2025


記者署名:TechApple.com 編輯部


原文內容:


在生成式 AI 競爭白熱化的當下,Google DeepMind 再次拋出重磅更新。全新影像生成引

擎——Gemini 3 Pro Image,其核心驅動更是被命名為極具話題性的 「Nano Banana Pro

」。這不僅是畫質的提升,更是對「精準控制」與「工作室級品質」的一次全面宣戰。在

Google AI Studio和AI Studio已經上線,注意有部份地區未必能用。


工作室級的精準控制:從「抽卡」到「設計」

過去的 AI 繪圖往往被戲稱為「抽卡」,但在 Nano Banana Pro 的加持下,Gemini 3

Pro Image 將重點完全轉向了 「Studio-quality control(工作室級控制)」。


這款模型的核心承諾在於「對影像的每一個細節進行精細控制」。這意味著創作者不再需

要反覆嘗試隨機的 Prompt,而是能夠真正像使用專業軟體一樣,對畫面進行精確的調度


角色與場景的完美融合

對於敘事類創作者而言,最大的痛點莫過於角色的一致性。Gemini 3 Pro Image 在這方

面展現了強大的能力。官方資料明確指出,使用者可以 「將你的角色放入全新的場景中

,並更換新的服裝」。這一功能直接打破了過去 AI 生成中「換個場景就換張臉」的魔咒


更進一步,它支援 「混合多張參考圖像」,並能構建出保留了選定細節的複雜構圖。這

不僅僅是簡單的拼貼,而是能夠協助創作者 「在一系列影像中勾勒出完整的故事」。從

單圖生成進化到連貫敘事,這是 AI 進入專業工作流的關鍵一步。


突破文字與知識的邊界:海報與圖表的終極解決方案

長期以來,AI 在生成圖片中的文字時總是「力不從心」,出現亂碼或拼寫錯誤是家常便

飯。Gemini 3 Pro Image 對此進行了針對性的優化。


清晰的文字生成能力

DeepMind 強調,新模型能夠 「為海報和複雜圖表生成清晰的文字」。這對於平面設計師

和行銷人員來說是一個巨大的福音。你不僅可以直接生成帶有正確標語的海報,甚至可

以 「將你的設計翻譯成不同的在地化語言」。這意味著,一個設計稿可以快速裂變為適

應全球不同市場的版本,極大地提升了跨國行銷的效率。


基於現實世界的知識庫

除了文字,模型的「腦子」也更好用了。利用 Gemini 龐大的現實世界知識,該模型能夠

交付 「精確的結果」,這在生成 「複雜的資訊圖表」 或 「歷史精確的場景」 時尤為

重要。它不再是憑空捏造,而是基於數據和事實進行視覺化呈現,這讓它在教育和專業簡

報領域的應用潛力大增。


強大的後期編輯流:修復、光影與混合

Gemini 3 Pro Image 不僅是一個生成器,更是一個強大的編輯器。它引入了進階的創意

工作流支援,讓使用者可以 「測試想法、創建引人注目的設計並製作原型」。


多模態的理解與編輯

透過 「上傳圖像並分享文字指令」,使用者可以用最自然的語言與 AI 溝通。想要微調

?沒問題。你可以利用其 「多模態理解(Multimodal understanding)」 能力,對畫面

進行複雜且詳細的修改。


高階編輯功能

官方特別提到了幾個令人印象深刻的高階功能:


遮罩編輯(Masked editing): 對特定區域進行精準修改。

大幅度光影變換: 例如直接將畫面從 「白天變為黑夜」,這需要模型對光線物理有極深

的理解。

影像混合: 將不同素材無縫拼接,創造出全新的視覺體驗。

這些功能讓 Gemini 3 Pro Image 能夠承擔起「修圖師」的角色,而不僅僅是「畫師」。


誠實的技術報告:不迴避缺陷的透明度

與許多過度包裝的 AI 產品不同,DeepMind 在發布頁面上展現了難得的技術誠實,詳細

列出了模型目前的局限性。這種「自我揭短」反而增加了專業用戶的信任度。


目前的技術瓶頸

儘管冠以 “Pro” 之名,官方坦承 「並非 Gemini 生成的每張圖像都是完美的」。以下

是目前仍可能遇到的挑戰:


細節處理: 模型在處理 「小臉(small faces)」、「準確拼寫」 以及影像中的 「精

細細節」 時仍可能感到吃力。

複雜數據的誤讀: 雖然擁有豐富的知識,但在生成 「資訊圖表、標註圖表或呈現複雜數

據」 時,它可能會 「誤解資訊或產生與事實不符的結果」。官方強烈建議使用者 「務

必驗證數據驅動的輸出結果」。

語言與文化的隔閡: 雖然支援多語言翻譯,但在 「語法、拼寫、文化細微差別或成語

」 方面仍可能遇到困難。

物理邏輯的瑕疵: 在進行如「日夜變換」或「影像混合」等高階操作時,有時會產生 「

不自然的結果、視覺偽影或不連貫的場景」。


心得/評論:


Google高層前幾天就有預告

前天的Gemini 3發布只是前菜而已


今天在圖像領域發表新的香蕉Pro出來炸場了


補一個我在FB中文社群看到極可怕的案例

入門級的美編這個週末夜難眠了


漢化組/台灣出版翻譯漫畫看過吧

來自 Jas Chiang

https://i.imgur.com/Vk4RlEi.mp4.jpg https://i.imgur.com/Vk4RlEi.mp4.jpg



真的變態的可怕


下面的案例感受一下

ChatGPT 888


按摩椅廣告圖(burri3188)

https://i.imgur.com/6BOGzPH.png.jpg https://i.imgur.com/6BOGzPH.png.jpg


https://i.imgur.com/6D04xqA.png.jpg https://i.imgur.com/6D04xqA.png.jpg



Threads 室內設計師 33.shan.design 拿圖做渲染

https://i.imgur.com/drW90TN.jpeg.jpg https://i.imgur.com/drW90TN.jpeg.jpg


https://i.imgur.com/zbRtybW.jpeg.jpg https://i.imgur.com/zbRtybW.jpeg.jpg



廣告圖解說(burri3188)

https://i.imgur.com/X9XIaRC.png.jpg https://i.imgur.com/X9XIaRC.png.jpg


https://i.imgur.com/iRNx1VJ.png.jpg https://i.imgur.com/iRNx1VJ.png.jpg



家常便當菜隨手拍

https://i.imgur.com/dsW95kd.png.jpg https://i.imgur.com/dsW95kd.png.jpg


https://i.imgur.com/zGcNZlm.png.jpg https://i.imgur.com/zGcNZlm.png.jpg



廣告圖

https://i.imgur.com/KPFF64Z.jpeg.jpg https://i.imgur.com/KPFF64Z.jpeg.jpg



===


這是我自己在路邊攤拍的滷肉飯

https://i.imgur.com/eOxnl7M.png.jpg https://i.imgur.com/eOxnl7M.png.jpg



請幫我生成專業的廣告照

https://i.imgur.com/tA6TETn.png.jpg https://i.imgur.com/tA6TETn.png.jpg



請讓金城武代言這碗滷肉飯

https://i.imgur.com/ohT85GX.png.jpg https://i.imgur.com/ohT85GX.png.jpg



其他案例


出師表+石牌

https://i.imgur.com/leh3cW7.jpeg.jpg https://i.imgur.com/leh3cW7.jpeg.jpg



饒河夜市+妹子

https://i.imgur.com/GOcRyhF.png.jpg https://i.imgur.com/GOcRyhF.png.jpg



吹風機廣告

https://i.imgur.com/NjSlNuu.png.jpg https://i.imgur.com/NjSlNuu.png.jpg


https://i.imgur.com/QUFwmEq.png.jpg https://i.imgur.com/QUFwmEq.png.jpg


https://i.imgur.com/2uRfcBu.png.jpg https://i.imgur.com/2uRfcBu.png.jpg


https://i.imgur.com/bBpZPXL.jpeg.jpg https://i.imgur.com/bBpZPXL.jpeg.jpg



手沖咖啡圖 by Fox Hsiao


提示詞 : "請畫出一張手沖咖啡流程圖附上簡單說明,日本流行雜誌風格,但是說明文字

是台灣繁體中文"


https://i.imgur.com/EWUnPKn.png.jpg https://i.imgur.com/EWUnPKn.png.jpg



--

※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 212.102.40.177 (美國) ※ 文章網址 ※
leon1757tw : AI為什麼要加香菜 11/21 01:06
Lenney33 : 幹嘛偷拿我的照片 11/21 01:07
joshddd : 這邊魯豬肉了吧 11/21 01:09
cdplay000 : 要錢嗎,免費可以用嗎 11/21 01:10
baka1412 : 變控肉飯 11/21 01:11
cdplay000 : 如果免費,那GPT就GG 11/21 01:11
他好像很熱衷把滷肉飯變成控肉飯=_=
karta018 : 可以色色嗎 11/21 01:12
cloud1030 : NV 丸子 11/21 01:13
orz811017 : 大安金城武表示憤怒 11/21 01:13
fr75520 : 各方金城武集結 11/21 01:16
lianli1024 : 這灌水太嚴重了 11/21 01:18
cityport : 香菜也太假了吧 11/21 01:20
cityport : 焢肉跟雞蛋也很假 11/21 01:21
strlen : 香菜怎摸惹?香菜很好啊 11/21 01:22
b2209187 : 這個算小控肉或紅燒肉飯,不過有些高級飯店的滷味 11/21 01:23
b2209187 : 飯確實是這種型態 11/21 01:23
permanent27 : 我迷人的笑容 11/21 01:23
suPerFlyK : 做報告 超級好用 11/21 01:29
iverboy : 生成圖,openai還是更好 11/21 01:42
Tatsuya72 : 圖文不符,這樣拿去商業運用跟欺詐有甚麼不同? 11/21 01:42
iverboy : 這openai只好繼續加碼了,最後會不會賣給微軟 11/21 01:42
Tatsuya72 : 哪個客戶會接受這樣搞 不怕被告? 11/21 01:43
baka1412 : 11/21 01:54
abcd255060 : 加香菜真讚 AI很懂! 11/21 01:55
ksjr : 為什麼要加兩盤辣椒醬 11/21 02:23
a8785007 : AI 只有這種可以發揮? 11/21 02:24
shirleyEchi : 這滿滿的AI味 11/21 02:39
ryan8409 : 一看就是AI文 11/21 04:22
補了一些案例
bio5chris : 確實是grok弱點但我生成完美奶子時並不在意文字啥的 11/21 04:24
入門級的美編這個週末夜難眠了
gnnlcb : open光金城武就卡關,哪裡強 11/21 04:28
漢化組/台灣翻譯漫畫看過看過吧
zero00072 : 你還在宮崎駿,人家直接金城武。 11/21 05:34
來自 Jas Chiang
greedypeople : 現在確實是gemini最強


但就跟海浪法師說的一樣 11/21 05:59
greedypeople : 暫時的 11/21 05:59
ksjr : 不過3pro轉好久 雖然我免費仔 11/21 06:08
※ 編輯: empliu (212.102.40.177 美國), 11/21/2025 03:06:29
kevabc1 : 笑死 那滷肉飯明明就超強 肉燥飯還加魚鬆的超惡心好 11/21 06:17
kevabc1 : 嗎(誤 11/21 06:17
bleeza : nano banana不就是奈米屌嗎 11/21 06:26
loleea : 會讓人失業,然後失業率上升 市場就崩了 11/21 07:35
kausan : 美術的要掰了 11/21 08:01
kausan : 連設計的也岌岌可危 11/21 08:02
watchmeisyou : 我照著提示詞作手沖咖啡流程圖 根本就是亂碼 11/21 09:07
LoveSports : 感謝分享 11/21 10:34
hololive45P : 好強== 11/21 10:34
dawsonliu : 確實很強 11/21 11:37
rugia813 : openai現在至少還有sora2領先 11/21 11:47
※ error405:轉錄至看板 AI_Art 11/21 08:15