🎁新使用者註冊即可獲得免費積分

GPT Image 2 — 融合 16 張圖片、渲染任意文字、編輯任何照片

OpenAI 最新 AI 圖像模型。上傳最多 16 張參考照片並融合為一個連貫場景、在圖像中清晰渲染多語言字體排版,並以自然語言提示詞編輯任何照片 — 盡在 Nano Banana。

GPT Image 2 — 融合多張參考圖的構圖與文字排版渲染
GPT Image 2 編輯器
0/20000

拖曳圖片至此或點擊選擇

JPEG / PNG / WEBP,每張最大 30MB,最多 16 張

0/20000
3積分
載入中...

載入中...

GPT Image 2 能做什麼 — 附上可直接試用的提示詞

以下是創作者實際運用 GPT Image 2 的十種方式。每一項都是模型的一項具體能力、所能產出的成果,以及可直接複製貼上至上方工具的現成提示詞。

同款陶瓷咖啡杯的四張一致商品照

思考模式:從一則提示詞生成多張連貫圖像

不同於舊模型每則提示詞只產出一張圖像,GPT Image 2 能先思考提示詞內容、對照世界知識驗證細節,再從同一則指令產出多張風格一致的圖像。非常適合分鏡圖、行銷素材變體,或任何需要「同一主體以多種視角呈現」的情境。

提示詞
生成同款陶瓷咖啡杯的 4 張一致商品照:白色背景前視圖、側面晨光照、俯視平拍並灑落咖啡豆、以及木質咖啡館桌面的生活感照。保持四張照片中的杯身設計完全相同。

應用場景: 分鏡圖 · 行銷素材變體 · 商品攝影系列 · 一致性角色設定集

融合角色、服裝、背景與光線的多參考圖合成

多參考圖融合 — 單一提示詞最多支援 16 張輸入圖

上傳最多 16 張照片,並在提示詞中以編號引用(「image 1」、「image 2」…)。GPT Image 2 以高保真度跨圖推理,將主體、風格、背景、光線與構圖融合為一個連貫輸出。對多數創作者而言,這是「以前想要卻做不到」最明顯的關鍵時刻。

提示詞
將 image 1 的角色、image 2 的服裝、image 3 的背景,以及 image 4 的光線氛圍,組合為一張連貫的照片。鏡頭角度比照 image 1。

應用場景: 產品置入 · 虛擬試穿 · 合成場景 · 品牌素材改作

直式珍珠奶茶海報,同時搭載中英雙語字體排版

近乎完美的多語言文字渲染

海報標題、商品包裝標籤、招牌、菜單、食譜說明 — GPT Image 2 在圖像中渲染文字的清晰度遠勝先前模型,對非拉丁文字包括日文、韓文、中文、印地文與孟加拉文皆有顯著提升。長年困擾 AI 圖像的「亂碼文字」問題,在中短字串上終於獲得實質解決。

提示詞
設計一張 3:4 直式海報,主題為新款中式珍珠奶茶上市。現代極簡風格搭配鮮明色彩、誘人視覺,粗體中英文字體顯示「春季限定 · Spring Edition」。

應用場景: 海報 · 廣告素材 · 商品包裝 · 菜單板 · 多語言行銷活動

俯拍視角的奶油蒜香蘑菇義大利麵食譜資訊圖表

逐步食譜與教學資訊圖表

密集結構化的版面,含標註食材、流程箭頭、份量標示與主視覺擺盤照 — GPT Image 2 一次生成就能全部搞定。每一個標籤都清晰可讀,支援任何語言。

提示詞
製作奶油蒜香蘑菇義大利麵的逐步食譜資訊圖表,俯拍視角、極簡白色背景,食材照片標註精確份量如「200g 義大利麵」與「150g 蘑菇」,每個步驟搭配虛線與圖示,底部放上擺盤完成的料理照,整體乾淨現代風格。

應用場景: 食譜卡 · 教學指南 · 小紅書 / Pinterest 資訊圖 · 教育視覺素材

展示 Charles Proxy 設定步驟編號的教學截圖

帶精準 UI 與標籤的教學截圖

產品文件團隊期待已久。GPT Image 2 能生成擬真的軟體 UI — 含正確的工具列標籤、選單文字、編號步驟註解與箭頭引導 — 準確度足以作為教學示意圖,無需真實螢幕截圖。

提示詞
生成擬真的教學截圖,逐步示範如何在 Charles Proxy 中設定網域擷取。每個 UI 元素標示詳細英文標籤,版面乾淨專業,編號 1 至 5 的步驟搭配箭頭,每個步驟下方附簡短說明。

應用場景: 產品文件 · 新手教學 · 說明中心文章 · App Store 截圖

1900 年伊斯坦堡獨立大街的 360° 等距長方全景

360° 沉浸式與歷史虛擬導覽

一項低調卻掀起病毒式傳播的能力:GPT Image 2 能生成等距長方投影的 360° 全景圖,可直接載入 VR 頭戴裝置或手機瀏覽器。思考步驟會自動帶入時代建築、招牌與文化細節。

提示詞
1900 年伊斯坦堡獨立大街(Istiklal Street)的 360° 等距長方影像,高度細膩的歷史建築、精準的時代招牌與店面文字、擬真氛圍、電影感光線。

應用場景: 虛擬導覽 · 博物館展覽 · 沉浸式敘事 · 時光旅行體驗

含階層方塊與註腳的企業組織圖

組織圖與商業圖表(支援反覆編輯)

複雜的階層、連接線、部門名稱、小字註腳 — 那些過去得在 PowerPoint 裡耗掉一個下午的東西。GPT Image 2 一次生成到位,還能針對細節反覆調整(「修正註腳,在 Engineering 下新增兩個子部門」),同時保持版面其他部分完全不變。

提示詞(初版)
為一間上市科技公司製作專業組織圖,整潔企業風格,部門名稱精確、階層方塊清晰、連接線分明,底部附小字註腳文字。
提示詞(迭代)
編輯前一張組織圖:修正註腳文字,在 Engineering 下新增兩個子部門,更新 CEO 姓名。其餘風格與版面完全保持不變。

應用場景: 組織圖 · 流程圖 · 商業圖表 · 顧問交付文件 · 簡報投影片

印刷等級的義式咖啡館中英雙語菜單板,含餐點攝影

商用等級菜單板與雜誌跨頁

大量內文搭配攝影與品牌識別於同一版面。GPT Image 2 產出的成果達到真正的印刷解析度,而非僅能做成縮圖。

提示詞
為一間現代義式咖啡館設計完整詳盡的餐廳菜單板 — 優雅設計搭配誘人的餐點照片、清楚的價格、中英文菜名、可讀的小字說明,高解析度商用品質、可直接印刷。

應用場景: 餐廳菜單 · 產品型錄 · 雜誌編輯 · 品牌手冊 · 印刷品

結合某張圖的藝術風格與另一張圖主體的風格轉換

照片之間的風格轉換

取一張圖像的美學風格,套用到另一張圖像的主體上。GPT Image 2 能保留一張參考圖中主體的身分、構圖與姿勢,同時借用另一張參考圖的色彩、媒材與氛圍。

提示詞
將 image 1 的藝術風格套用至 image 2 的主體。完全保留 image 2 的構圖、面部身分與姿勢。

應用場景: 藝術指導 · 插畫 · 概念探索 · 品牌美學一致性

將人像背景替換為夜晚雨中東京街景

自然語言照片編輯 — 無需遮罩、無需圖層

上傳任何照片,用白話文描述你想要的改動,GPT Image 2 會定位區域、執行編輯,並保留你沒提到的所有細節。背景替換、物件移除、服裝更換、外擴畫布、照片修復 — 全在同一個提示詞介面完成。

提示詞
將背景替換為夜晚雨中的東京街景。保持主體、服裝與面部特徵完全不變。光線符合新場景 — 背後來自冷藍色的輪廓光、臉上有溫暖的街燈光暈。

應用場景: 背景替換 · 物件移除 · 服裝更換 · 照片修復 · 外擴畫布

GPT Image 2 常見問題

1

GPT Image 2 是什麼?

GPT Image 2 是 OpenAI 最新的圖像生成與編輯模型。它能將文字提示詞轉為高解析度圖像、以自然語言指令編輯現有照片,並將最多 16 張參考圖 合成為單一連貫輸出 — 全由同一個模型完成。

2

GPT Image 2 與 Nano Banana 2 有何不同?

兩者都是強大的圖像模型,各有擅長之處。GPT Image 2 在 多參考圖推理圖像內文字渲染(標籤、海報、商品文案)以及複雜的跨圖合成上更勝一籌。Nano Banana 2 在長系列圖像的角色一致性上具業界頂尖水準,對單張圖像的直接編輯也通常更快。兩者都在你的 Nano Banana 帳戶中 — 同一則提示詞各跑一次,保留最合適的結果。點此試用 Nano Banana 2

3

GPT Image 2 支援渲染哪些語言的文字?

拉丁文字(英文、歐洲語系)加上非拉丁文字的顯著進步 — OpenAI 特別指出 日文、韓文、中文、印地文與孟加拉文 這幾個語言有大幅躍升。實務上,模型對其他文字的短字串處理也相當合理,但對較少代表的語言在長段落表現上品質可能有所差異。

4

GPT Image 2 支援透明背景嗎?

目前不支援 — GPT Image 2 現階段不會輸出透明的 PNG。若需要透明背景,可在後續步驟使用 AI 去背免費工具,或在你的 Nano Banana 帳戶中選擇支援 Alpha 通道的其他模型。

5

GPT Image 2 輸出多大的解析度?

最高達 4K 等級輸出 — 模型支援長邊最大約 3840px 的解析度,涵蓋 3840×2160 橫向2160×3840 縱向,以及 1:1、3:2、2:3 等靈活比例。超過 2K 的輸出在 OpenAI 端仍屬實驗性質,穩定度可能略有差異。

6

GPT Image 2 在 Nano Banana 上可以免費使用嗎?

新用戶註冊即可獲得 免費點數,還能透過每日簽到與邀請好友賺取更多。免費點數用完後,每次生成會依輸出品質等級扣除少量點數。最新費率請參考定價頁。

7

用 GPT Image 2 生成或編輯的圖像可以商用嗎?

可以,在付費方案下生成的圖像可用於 個人、商業或創意 用途。所有輸出都包含隱形的 SynthID 浮水印(依 OpenAI 的責任設計政策)以供溯源,但不會影響視覺品質或使用權利。

8

多圖編輯的提示詞該怎麼寫?

清楚標註你的參考圖。 例如「將 image 1 的商品放入 image 2 的場景、套用 image 3 的色調風格、鏡頭角度沿用 image 2」遠比「組合這些照片」可靠。告訴 GPT Image 2 每一張圖各自扮演什麼角色(主體、背景、風格、光線、服裝),它就能精準交付。

9

GPT Image 2 在編輯時真的能保留臉部與 Logo 嗎?

它的保留度遠勝先前的圖生圖模型 — OpenAI 以高保真度處理每一張輸入圖像,特別針對 臉部、Logo 與商品細節 進行保留。並非每次編輯都能做到像素完美,特別強烈的風格轉換可能會稍微弱化身分辨識。若你追求系列編輯中最強的臉部一致性,Nano Banana 2 通常是更優選擇。