GPT Image 2 — 16 Bilder fusionieren, jeden Text rendern, jedes Foto bearbeiten

Das neueste KI-Bildmodell von OpenAI. Lade bis zu 16 Referenzfotos hoch und fusioniere sie zu einer stimmigen Szene, rendere mehrsprachige Typografie lesbar direkt im Bild und bearbeite jedes Foto per natürlichsprachlichem Prompt — auf Nano Banana.

GPT Image 2 — fusionierte Multi-Referenz-Komposition mit gerenderter Typografie

GPT Image 2 Editor

Eingabeaufforderung

0/20000

Referenzbilder (1–16)

Bilder per Drag & Drop ablegen oder zum Durchsuchen klicken

JPEG / PNG / WEBP, max. 30 MB pro Bild, bis zu 16 Bilder

Eingabeaufforderung

0/20000

3Credits

Wird geladen...

Was GPT Image 2 kann — mit Prompts zum direkten Ausprobieren

Zehn Anwendungsfälle, mit denen Creator GPT Image 2 bereits im Alltag nutzen. Jeder Punkt beschreibt eine konkrete Fähigkeit des Modells, den typischen Output und einen fertigen Prompt, den du direkt ins Tool oben einfügen kannst.

Vier konsistente Produktaufnahmen derselben Keramik-Kaffeetasse

Denkmodus: Mehrere stimmige Bilder aus einem einzigen Prompt generieren

Anders als frühere Modelle, die pro Prompt nur ein Bild liefern, kann GPT Image 2 eine Anweisung durchdenken, Details anhand von Weltwissen abgleichen und mehrere konsistente Bilder aus einer Anweisung zurückgeben. Ideal für Storyboards, Kampagnen-Varianten und alles, wo „dasselbe Motiv aus mehreren Blickwinkeln" gebraucht wird.

Prompt

Generate 4 consistent product shots of the same ceramic coffee mug: front view on white cyclorama, side view with morning light, top-down flat-lay with coffee beans scattered around, lifestyle shot on a wooden café table. Keep the mug design identical in all four.

Anwendungsfall: Storyboards · Kampagnen-Varianten · Produktfoto-Sets · konsistente Character Sheets

Multi-Referenz-Fusion aus Charakter, Outfit, Hintergrund und Lichtstimmung

Multi-Referenz-Fusion — bis zu 16 Eingabebilder in einem Prompt

Lade bis zu sechzehn Fotos hoch und verweise im Prompt per Nummer darauf („image 1", „image 2"…). GPT Image 2 verarbeitet alle Bilder in hoher Detailtreue und fusioniert Motiv, Stil, Hintergrund, Licht und Bildaufbau zu einem einzigen, stimmigen Ergebnis. Für die meisten Creator ist das der klarste „Genau das wollte ich, ging aber vorher nicht"-Moment.

Prompt

Combine the character from image 1, the outfit from image 2, the background from image 3, and the lighting mood from image 4 into one coherent photograph. Match the camera angle of image 1.

Anwendungsfall: Produktplatzierung · virtuelle Anprobe · Composite-Szenen · Markenasset-Anpassung

Vertikales Bubble-Tea-Poster mit zweisprachiger chinesisch-englischer Typografie

Nahezu perfekte mehrsprachige Textdarstellung

Poster-Headlines, Etiketten auf Verpackungen, Beschilderungen, Speisekarten, Rezept-Captions — GPT Image 2 rendert Text innerhalb von Bildern deutlich lesbarer als frühere Modelle, mit spürbaren Fortschritten bei nicht-lateinischen Schriften wie Japanisch, Koreanisch, Chinesisch, Hindi und Bengalisch. Das bekannte „verstümmelter KI-Text"-Problem ist für kurze bis mittlere Textstellen endlich gelöst.

Prompt

Design a 3:4 vertical poster for a new Chinese bubble tea launch. Modern minimalist style with vibrant colors, appetizing visuals, bold Chinese and English typography reading '春季限定 · Spring Edition'.

Anwendungsfall: Poster · Ad Creatives · Produktverpackung · Menütafeln · mehrsprachige Kampagnen

Draufsicht-Infografik für cremige Knoblauch-Champignon-Pasta

Schritt-für-Schritt-Rezepte und Infografiken

Dichte Layouts mit beschrifteten Zutaten, Prozesspfeilen, Mengenangaben und einem Hero-Shot des fertigen Gerichts — GPT Image 2 erledigt das in einer einzigen Generierung. Jede Beschriftung wird gut lesbar dargestellt, in jeder Sprache.

Prompt

Create a step-by-step recipe infographic for creamy garlic mushroom pasta, top-down view, minimal white background, ingredient photos labeled with exact quantities like '200g spaghetti' and '150g mushrooms', dotted lines and icons for each process step, final plated dish at the bottom, clean modern style.

Anwendungsfall: Rezeptkarten · How-to-Guides · Xiaohongshu- / Pinterest-Infografiken · Lehrgrafiken

Tutorial-Screenshot mit nummerierten Schritten zur Konfiguration von Charles Proxy

Tutorial-Screenshots mit präzisen UIs und Beschriftungen

Auf diese Funktion haben Product-Docs-Teams gewartet. GPT Image 2 kann eine realistische Software-Oberfläche generieren — mit korrekten Toolbar-Beschriftungen, Menütexten, nummerierten Schritt-Annotationen und Pfeil-Markierungen — präzise genug, um ohne echten Screenshot als Tutorial-Illustration zu dienen.

Prompt

Generate a realistic screenshot tutorial showing step-by-step how to configure domain capture in Charles Proxy. Include detailed English labels on every UI element, clean professional layout, numbered steps 1 through 5 with arrows, and a brief caption under each step.

Anwendungsfall: Produkt-Dokumentation · Onboarding-Tutorials · Help-Center-Artikel · App-Store-Screenshots

360°-Equirektangular-Panorama der Istiklal-Straße in Istanbul um 1900

360°-Panoramen und historische Virtual Tours

Eine unterschätzte Fähigkeit, die aktuell eine Welle viraler Posts auslöst: GPT Image 2 erzeugt equirektanguläre 360°-Panoramen, die sich direkt in VR-Headsets oder mobile Viewer laden lassen. Der Denkmodus zieht passende Epoche-Architektur, Beschilderung und kulturelle Details automatisch mit heran.

Prompt

360 equirectangular image of Istiklal Street, Istanbul in 1900, highly detailed historical architecture, accurate period signage and text on shops, realistic atmosphere, cinematic lighting.

Anwendungsfall: Virtual Tours · Museumsausstellungen · immersives Storytelling · Zeitreise-Erlebnisse

Unternehmens-Organigramm mit Hierarchie-Boxen und Fußnoten

Organigramme und Business-Diagramme (mit iterativer Bearbeitung)

Komplexe Hierarchien, Verbindungslinien, Abteilungsnamen, kleine Fußnoten — genau das, was früher einen ganzen Nachmittag in PowerPoint gekostet hat. GPT Image 2 erzeugt es in einem Durchgang und lässt dich dann gezielt nachbessern („Fußnote korrigieren, zwei Tochterfirmen unter Engineering ergänzen") — der Rest des Layouts bleibt identisch.

Prompt (erster Entwurf)

Create a professional organizational chart for a public tech company in clean corporate style, with accurate department names, clear hierarchy boxes, connecting lines, and small footnote text at the bottom.

Prompt (iterieren)

Edit the previous organizational chart: fix the footnote text, add two new subsidiaries under Engineering, update the CEO name. Keep exact same style and layout.

Anwendungsfall: Organigramme · Flowcharts · Business-Diagramme · Consulting-Deliverables · Pitch Decks

Druckfertige zweisprachige Menütafel für ein italienisches Café mit Food-Fotografie

Kommerziell nutzbare Menütafeln und Magazin-Layouts

Dichter Fließtext, Produktfotos und Markenauftritt in einem Layout. GPT Image 2 liefert Ergebnisse, die auch in echter Druckauflösung überzeugen — nicht nur als Thumbnail.

Prompt

Create a full detailed restaurant menu board for a modern Italian café — elegant design with appetizing food photos, clear prices, Chinese and English dish names, readable small-text descriptions, high-resolution commercial quality, print-ready.

Anwendungsfall: Speisekarten · Produktkataloge · Magazin-Editorials · Brand Books · Print-Material

Stilübertragung, die den Kunststil eines Bildes mit dem Motiv eines anderen kombiniert

Stilübertragung zwischen Fotos

Nimm die Ästhetik eines Bildes und übertrage sie auf das Motiv eines anderen. GPT Image 2 bewahrt Identität, Bildaufbau und Pose des Motivs aus der einen Referenz und übernimmt Farbpalette, Medium und Stimmung aus der anderen.

Prompt

Apply the art style from image 1 to the subject in image 2. Keep the composition, facial identity, and pose from image 2 exactly as shown.

Anwendungsfall: Art Direction · Illustration · Konzept-Exploration · Markenästhetik-Konsistenz

Porträt mit ausgetauschtem Hintergrund — regennasse Tokio-Straße bei Nacht

Fotobearbeitung per natürlicher Sprache — ohne Masken, ohne Ebenen

Lade ein beliebiges Foto hoch, beschreibe die gewünschte Änderung in einfachen Worten — GPT Image 2 findet die richtige Bildregion, wendet die Änderung an und bewahrt alles, was du nicht erwähnt hast. Hintergrundtausch, Objekt entfernen, Outfit wechseln, Outpainting, Foto-Restauration — alles über eine einzige Prompt-Oberfläche.

Prompt

Replace the background with a rainy Tokyo street at night. Keep the subject, clothing, and facial features unchanged. Match the lighting of the new scene — cool blue rim light from the back, warm street-lamp glow on the face.

Anwendungsfall: Hintergrundtausch · Objekt entfernen · Outfit wechseln · Foto-Restauration · Outpainting

Häufig gestellte Fragen zu GPT Image 2

Was ist GPT Image 2?

GPT Image 2 ist das neueste Modell von OpenAI zur Bildgenerierung und -bearbeitung. Es wandelt einen Text-Prompt in ein hochaufgelöstes Bild um, bearbeitet bestehende Fotos per natürlichsprachlicher Anweisung und fusioniert bis zu 16 Referenzbilder zu einem einzigen, stimmigen Output — alles im selben Modell.

Worin unterscheidet sich GPT Image 2 von Nano Banana 2?

Beides sind starke Bildmodelle mit unterschiedlichen Stärken. GPT Image 2 ist stärker bei Multi-Referenz-Reasoning, Textdarstellung im Bild (Beschriftungen, Poster, Produkttexte) und komplexer bildübergreifender Komposition. Nano Banana 2 bietet die beste Character-Konsistenz über lange Bildserien und ist bei einfachen Einzelbild-Bearbeitungen meist schneller. Beide Modelle sind in deinem Nano-Banana-Account verfügbar — schicke denselben Prompt durch beide und behalte das passende Ergebnis. Nano Banana 2 hier testen.

In welchen Sprachen rendert GPT Image 2 Text?

Lateinische Schrift (Englisch, Deutsch und weitere europäische Sprachen) sowie deutliche Fortschritte bei nicht-lateinischen Schriften — Japanisch, Koreanisch, Chinesisch, Hindi und Bengalisch werden von OpenAI explizit als stark verbessert genannt. In der Praxis liefert das Modell auch für andere Schriften brauchbare Ergebnisse bei kurzen Texten, bei dichten Absätzen in weniger verbreiteten Sprachen kann die Qualität jedoch schwanken.

Unterstützt GPT Image 2 transparente Hintergründe?

Nein — GPT Image 2 gibt aktuell keine PNGs mit Transparenz aus. Wenn du einen transparenten Hintergrund brauchst, nutze als Folgeschritt das kostenlose AI Remove Background Tool, oder wähle in deinem Nano-Banana-Account ein anderes Modell, das einen Alpha-Kanal unterstützt.

Welche Auflösungen liefert GPT Image 2?

Bis zu 4K-nahem Output — das Modell unterstützt Auflösungen mit einer maximalen langen Kante von rund 3840 px und deckt damit 3840×2160 (Querformat) und 2160×3840 (Hochformat) ab, dazu 1:1, 3:2, 2:3 und flexible Seitenverhältnisse dazwischen. Outputs über 2K gelten bei OpenAI als experimentell und können in der Konsistenz schwanken.

Ist GPT Image 2 auf Nano Banana kostenlos nutzbar?

Neue Nutzer erhalten kostenlose Credits bei der Registrierung, und weitere Credits lassen sich über tägliche Check-ins und Freunde-Einladungen freischalten. Sind die Gratis-Credits aufgebraucht, kostet jede Generierung eine geringe Menge Credits — abhängig von der gewählten Qualitätsstufe. Aktuelle Preise findest du auf der Pricing-Seite.

Darf ich mit GPT Image 2 erstellte oder bearbeitete Bilder kommerziell nutzen?

Ja — sobald du auf einem kostenpflichtigen Plan ein Bild generiert hast, darfst du es für private, kommerzielle oder kreative Projekte verwenden. Alle Outputs enthalten unsichtbare SynthID-Wasserzeichen (gemäß OpenAIs Responsibility-by-Design-Policy) zur Herkunftsnachverfolgung, das beeinträchtigt jedoch weder die visuelle Qualität noch deine Nutzungsrechte.

Wie schreibe ich Prompts für Bearbeitungen mit mehreren Bildern?

Beschrifte deine Referenzen eindeutig. Ein Prompt wie „Platziere das Produkt aus image 1 in die Szene aus image 2. Übernimm den Farbstil aus image 3. Behalte den Kamerawinkel aus image 2 bei." ist deutlich zuverlässiger als „kombiniere diese Fotos". Sag GPT Image 2 konkret, welches Bild welche Rolle liefert (Motiv, Hintergrund, Stil, Licht, Outfit) — dann liefert es auch entsprechend.

Bleiben Gesichter und Logos bei Bearbeitungen wirklich erhalten?

Deutlich besser als bei früheren Image-to-Image-Modellen — OpenAI verarbeitet jedes Eingabebild in hoher Detailtreue, genau um Gesichter, Logos und Produktdetails zu bewahren. Nicht jede Bearbeitung gelingt pixelgenau, und sehr radikale Stilübertragungen können die Identität abschwächen. Für maximale Gesichtskonsistenz über eine Serie von Bearbeitungen ist Nano Banana 2 meist die stärkere Wahl.