GPT Image 2 — 融合 16 張圖片、渲染任意文字、編輯任何照片

OpenAI 最新 AI 圖像模型。上傳最多 16 張參考照片並融合為一個連貫場景、在圖像中清晰渲染多語言字體排版，並以自然語言提示詞編輯任何照片 — 盡在 Nano Banana。

GPT Image 2 編輯器

提示詞

0/20000

參考圖（1-16 張）

拖曳圖片至此或點擊選擇

JPEG / PNG / WEBP，每張最大 30MB，最多 16 張

提示詞

0/20000

3積分

載入中...

GPT Image 2 能做什麼 — 附上可直接試用的提示詞

以下是創作者實際運用 GPT Image 2 的十種方式。每一項都是模型的一項具體能力、所能產出的成果，以及可直接複製貼上至上方工具的現成提示詞。

思考模式：從一則提示詞生成多張連貫圖像

不同於舊模型每則提示詞只產出一張圖像，GPT Image 2 能先思考提示詞內容、對照世界知識驗證細節，再從同一則指令產出多張風格一致的圖像。非常適合分鏡圖、行銷素材變體，或任何需要「同一主體以多種視角呈現」的情境。

提示詞

生成同款陶瓷咖啡杯的 4 張一致商品照：白色背景前視圖、側面晨光照、俯視平拍並灑落咖啡豆、以及木質咖啡館桌面的生活感照。保持四張照片中的杯身設計完全相同。

應用場景: 分鏡圖 · 行銷素材變體 · 商品攝影系列 · 一致性角色設定集

多參考圖融合 — 單一提示詞最多支援 16 張輸入圖

上傳最多 16 張照片，並在提示詞中以編號引用（「image 1」、「image 2」…）。GPT Image 2 以高保真度跨圖推理，將主體、風格、背景、光線與構圖融合為一個連貫輸出。對多數創作者而言，這是「以前想要卻做不到」最明顯的關鍵時刻。

提示詞

將 image 1 的角色、image 2 的服裝、image 3 的背景，以及 image 4 的光線氛圍，組合為一張連貫的照片。鏡頭角度比照 image 1。

應用場景: 產品置入 · 虛擬試穿 · 合成場景 · 品牌素材改作

近乎完美的多語言文字渲染

海報標題、商品包裝標籤、招牌、菜單、食譜說明 — GPT Image 2 在圖像中渲染文字的清晰度遠勝先前模型，對非拉丁文字包括日文、韓文、中文、印地文與孟加拉文皆有顯著提升。長年困擾 AI 圖像的「亂碼文字」問題，在中短字串上終於獲得實質解決。

提示詞

設計一張 3:4 直式海報，主題為新款中式珍珠奶茶上市。現代極簡風格搭配鮮明色彩、誘人視覺，粗體中英文字體顯示「春季限定 · Spring Edition」。

應用場景: 海報 · 廣告素材 · 商品包裝 · 菜單板 · 多語言行銷活動

逐步食譜與教學資訊圖表

密集結構化的版面，含標註食材、流程箭頭、份量標示與主視覺擺盤照 — GPT Image 2 一次生成就能全部搞定。每一個標籤都清晰可讀，支援任何語言。

提示詞

製作奶油蒜香蘑菇義大利麵的逐步食譜資訊圖表，俯拍視角、極簡白色背景，食材照片標註精確份量如「200g 義大利麵」與「150g 蘑菇」，每個步驟搭配虛線與圖示，底部放上擺盤完成的料理照，整體乾淨現代風格。

應用場景: 食譜卡 · 教學指南 · 小紅書 / Pinterest 資訊圖 · 教育視覺素材

帶精準 UI 與標籤的教學截圖

產品文件團隊期待已久。GPT Image 2 能生成擬真的軟體 UI — 含正確的工具列標籤、選單文字、編號步驟註解與箭頭引導 — 準確度足以作為教學示意圖，無需真實螢幕截圖。

提示詞

生成擬真的教學截圖，逐步示範如何在 Charles Proxy 中設定網域擷取。每個 UI 元素標示詳細英文標籤，版面乾淨專業，編號 1 至 5 的步驟搭配箭頭，每個步驟下方附簡短說明。

應用場景: 產品文件 · 新手教學 · 說明中心文章 · App Store 截圖

360° 沉浸式與歷史虛擬導覽

一項低調卻掀起病毒式傳播的能力：GPT Image 2 能生成等距長方投影的 360° 全景圖，可直接載入 VR 頭戴裝置或手機瀏覽器。思考步驟會自動帶入時代建築、招牌與文化細節。

提示詞

1900 年伊斯坦堡獨立大街（Istiklal Street）的 360° 等距長方影像，高度細膩的歷史建築、精準的時代招牌與店面文字、擬真氛圍、電影感光線。

應用場景: 虛擬導覽 · 博物館展覽 · 沉浸式敘事 · 時光旅行體驗

組織圖與商業圖表（支援反覆編輯）

複雜的階層、連接線、部門名稱、小字註腳 — 那些過去得在 PowerPoint 裡耗掉一個下午的東西。GPT Image 2 一次生成到位，還能針對細節反覆調整（「修正註腳，在 Engineering 下新增兩個子部門」），同時保持版面其他部分完全不變。

提示詞（初版）

為一間上市科技公司製作專業組織圖，整潔企業風格，部門名稱精確、階層方塊清晰、連接線分明，底部附小字註腳文字。

提示詞（迭代）

編輯前一張組織圖：修正註腳文字，在 Engineering 下新增兩個子部門，更新 CEO 姓名。其餘風格與版面完全保持不變。

應用場景: 組織圖 · 流程圖 · 商業圖表 · 顧問交付文件 · 簡報投影片

商用等級菜單板與雜誌跨頁

大量內文搭配攝影與品牌識別於同一版面。GPT Image 2 產出的成果達到真正的印刷解析度，而非僅能做成縮圖。

提示詞

為一間現代義式咖啡館設計完整詳盡的餐廳菜單板 — 優雅設計搭配誘人的餐點照片、清楚的價格、中英文菜名、可讀的小字說明，高解析度商用品質、可直接印刷。

應用場景: 餐廳菜單 · 產品型錄 · 雜誌編輯 · 品牌手冊 · 印刷品

照片之間的風格轉換

取一張圖像的美學風格，套用到另一張圖像的主體上。GPT Image 2 能保留一張參考圖中主體的身分、構圖與姿勢，同時借用另一張參考圖的色彩、媒材與氛圍。

提示詞

將 image 1 的藝術風格套用至 image 2 的主體。完全保留 image 2 的構圖、面部身分與姿勢。

應用場景: 藝術指導 · 插畫 · 概念探索 · 品牌美學一致性

自然語言照片編輯 — 無需遮罩、無需圖層

上傳任何照片，用白話文描述你想要的改動，GPT Image 2 會定位區域、執行編輯，並保留你沒提到的所有細節。背景替換、物件移除、服裝更換、外擴畫布、照片修復 — 全在同一個提示詞介面完成。

提示詞

將背景替換為夜晚雨中的東京街景。保持主體、服裝與面部特徵完全不變。光線符合新場景 — 背後來自冷藍色的輪廓光、臉上有溫暖的街燈光暈。

應用場景: 背景替換 · 物件移除 · 服裝更換 · 照片修復 · 外擴畫布

GPT Image 2 常見問題

GPT Image 2 是什麼？

GPT Image 2 是 OpenAI 最新的圖像生成與編輯模型。它能將文字提示詞轉為高解析度圖像、以自然語言指令編輯現有照片，並將最多 16 張參考圖 合成為單一連貫輸出 — 全由同一個模型完成。

GPT Image 2 與 Nano Banana 2 有何不同？

兩者都是強大的圖像模型，各有擅長之處。GPT Image 2 在 多參考圖推理、圖像內文字渲染（標籤、海報、商品文案）以及複雜的跨圖合成上更勝一籌。Nano Banana 2 在長系列圖像的角色一致性上具業界頂尖水準，對單張圖像的直接編輯也通常更快。兩者都在你的 Nano Banana 帳戶中 — 同一則提示詞各跑一次，保留最合適的結果。點此試用 Nano Banana 2。

GPT Image 2 支援渲染哪些語言的文字？

拉丁文字（英文、歐洲語系）加上非拉丁文字的顯著進步 — OpenAI 特別指出 日文、韓文、中文、印地文與孟加拉文 這幾個語言有大幅躍升。實務上，模型對其他文字的短字串處理也相當合理，但對較少代表的語言在長段落表現上品質可能有所差異。

GPT Image 2 支援透明背景嗎？

目前不支援 — GPT Image 2 現階段不會輸出透明的 PNG。若需要透明背景，可在後續步驟使用 AI 去背免費工具，或在你的 Nano Banana 帳戶中選擇支援 Alpha 通道的其他模型。

GPT Image 2 輸出多大的解析度？

最高達 4K 等級輸出 — 模型支援長邊最大約 3840px 的解析度，涵蓋 3840×2160 橫向 與 2160×3840 縱向，以及 1:1、3:2、2:3 等靈活比例。超過 2K 的輸出在 OpenAI 端仍屬實驗性質，穩定度可能略有差異。

GPT Image 2 在 Nano Banana 上可以免費使用嗎？

新用戶註冊即可獲得 免費點數，還能透過每日簽到與邀請好友賺取更多。免費點數用完後，每次生成會依輸出品質等級扣除少量點數。最新費率請參考定價頁。

用 GPT Image 2 生成或編輯的圖像可以商用嗎？

可以，在付費方案下生成的圖像可用於 個人、商業或創意 用途。所有輸出都包含隱形的 SynthID 浮水印（依 OpenAI 的責任設計政策）以供溯源，但不會影響視覺品質或使用權利。

多圖編輯的提示詞該怎麼寫？

清楚標註你的參考圖。 例如「將 image 1 的商品放入 image 2 的場景、套用 image 3 的色調風格、鏡頭角度沿用 image 2」遠比「組合這些照片」可靠。告訴 GPT Image 2 每一張圖各自扮演什麼角色（主體、背景、風格、光線、服裝），它就能精準交付。

GPT Image 2 在編輯時真的能保留臉部與 Logo 嗎？

它的保留度遠勝先前的圖生圖模型 — OpenAI 以高保真度處理每一張輸入圖像，特別針對 臉部、Logo 與商品細節 進行保留。並非每次編輯都能做到像素完美，特別強烈的風格轉換可能會稍微弱化身分辨識。若你追求系列編輯中最強的臉部一致性，Nano Banana 2 通常是更優選擇。