GPT Image 2 — 16 Bilder fusionieren, jeden Text rendern, jedes Foto bearbeiten
Das neueste KI-Bildmodell von OpenAI. Lade bis zu 16 Referenzfotos hoch und fusioniere sie zu einer stimmigen Szene, rendere mehrsprachige Typografie lesbar direkt im Bild und bearbeite jedes Foto per natürlichsprachlichem Prompt — auf Nano Banana.

Bilder per Drag & Drop ablegen oder zum Durchsuchen klicken
JPEG / PNG / WEBP, max. 30 MB pro Bild, bis zu 16 Bilder
Wird geladen...
Was GPT Image 2 kann — mit Prompts zum direkten Ausprobieren
Zehn Anwendungsfälle, mit denen Creator GPT Image 2 bereits im Alltag nutzen. Jeder Punkt beschreibt eine konkrete Fähigkeit des Modells, den typischen Output und einen fertigen Prompt, den du direkt ins Tool oben einfügen kannst.

Denkmodus: Mehrere stimmige Bilder aus einem einzigen Prompt generieren
Anders als frühere Modelle, die pro Prompt nur ein Bild liefern, kann GPT Image 2 eine Anweisung durchdenken, Details anhand von Weltwissen abgleichen und mehrere konsistente Bilder aus einer Anweisung zurückgeben. Ideal für Storyboards, Kampagnen-Varianten und alles, wo „dasselbe Motiv aus mehreren Blickwinkeln" gebraucht wird.
Generate 4 consistent product shots of the same ceramic coffee mug: front view on white cyclorama, side view with morning light, top-down flat-lay with coffee beans scattered around, lifestyle shot on a wooden café table. Keep the mug design identical in all four.
Anwendungsfall: Storyboards · Kampagnen-Varianten · Produktfoto-Sets · konsistente Character Sheets

Multi-Referenz-Fusion — bis zu 16 Eingabebilder in einem Prompt
Lade bis zu sechzehn Fotos hoch und verweise im Prompt per Nummer darauf („image 1", „image 2"…). GPT Image 2 verarbeitet alle Bilder in hoher Detailtreue und fusioniert Motiv, Stil, Hintergrund, Licht und Bildaufbau zu einem einzigen, stimmigen Ergebnis. Für die meisten Creator ist das der klarste „Genau das wollte ich, ging aber vorher nicht"-Moment.
Combine the character from image 1, the outfit from image 2, the background from image 3, and the lighting mood from image 4 into one coherent photograph. Match the camera angle of image 1.
Anwendungsfall: Produktplatzierung · virtuelle Anprobe · Composite-Szenen · Markenasset-Anpassung

Nahezu perfekte mehrsprachige Textdarstellung
Poster-Headlines, Etiketten auf Verpackungen, Beschilderungen, Speisekarten, Rezept-Captions — GPT Image 2 rendert Text innerhalb von Bildern deutlich lesbarer als frühere Modelle, mit spürbaren Fortschritten bei nicht-lateinischen Schriften wie Japanisch, Koreanisch, Chinesisch, Hindi und Bengalisch. Das bekannte „verstümmelter KI-Text"-Problem ist für kurze bis mittlere Textstellen endlich gelöst.
Design a 3:4 vertical poster for a new Chinese bubble tea launch. Modern minimalist style with vibrant colors, appetizing visuals, bold Chinese and English typography reading '春季限定 · Spring Edition'.
Anwendungsfall: Poster · Ad Creatives · Produktverpackung · Menütafeln · mehrsprachige Kampagnen

Schritt-für-Schritt-Rezepte und Infografiken
Dichte Layouts mit beschrifteten Zutaten, Prozesspfeilen, Mengenangaben und einem Hero-Shot des fertigen Gerichts — GPT Image 2 erledigt das in einer einzigen Generierung. Jede Beschriftung wird gut lesbar dargestellt, in jeder Sprache.
Create a step-by-step recipe infographic for creamy garlic mushroom pasta, top-down view, minimal white background, ingredient photos labeled with exact quantities like '200g spaghetti' and '150g mushrooms', dotted lines and icons for each process step, final plated dish at the bottom, clean modern style.
Anwendungsfall: Rezeptkarten · How-to-Guides · Xiaohongshu- / Pinterest-Infografiken · Lehrgrafiken

Tutorial-Screenshots mit präzisen UIs und Beschriftungen
Auf diese Funktion haben Product-Docs-Teams gewartet. GPT Image 2 kann eine realistische Software-Oberfläche generieren — mit korrekten Toolbar-Beschriftungen, Menütexten, nummerierten Schritt-Annotationen und Pfeil-Markierungen — präzise genug, um ohne echten Screenshot als Tutorial-Illustration zu dienen.
Generate a realistic screenshot tutorial showing step-by-step how to configure domain capture in Charles Proxy. Include detailed English labels on every UI element, clean professional layout, numbered steps 1 through 5 with arrows, and a brief caption under each step.
Anwendungsfall: Produkt-Dokumentation · Onboarding-Tutorials · Help-Center-Artikel · App-Store-Screenshots

360°-Panoramen und historische Virtual Tours
Eine unterschätzte Fähigkeit, die aktuell eine Welle viraler Posts auslöst: GPT Image 2 erzeugt equirektanguläre 360°-Panoramen, die sich direkt in VR-Headsets oder mobile Viewer laden lassen. Der Denkmodus zieht passende Epoche-Architektur, Beschilderung und kulturelle Details automatisch mit heran.
360 equirectangular image of Istiklal Street, Istanbul in 1900, highly detailed historical architecture, accurate period signage and text on shops, realistic atmosphere, cinematic lighting.
Anwendungsfall: Virtual Tours · Museumsausstellungen · immersives Storytelling · Zeitreise-Erlebnisse

Organigramme und Business-Diagramme (mit iterativer Bearbeitung)
Komplexe Hierarchien, Verbindungslinien, Abteilungsnamen, kleine Fußnoten — genau das, was früher einen ganzen Nachmittag in PowerPoint gekostet hat. GPT Image 2 erzeugt es in einem Durchgang und lässt dich dann gezielt nachbessern („Fußnote korrigieren, zwei Tochterfirmen unter Engineering ergänzen") — der Rest des Layouts bleibt identisch.
Create a professional organizational chart for a public tech company in clean corporate style, with accurate department names, clear hierarchy boxes, connecting lines, and small footnote text at the bottom.
Edit the previous organizational chart: fix the footnote text, add two new subsidiaries under Engineering, update the CEO name. Keep exact same style and layout.
Anwendungsfall: Organigramme · Flowcharts · Business-Diagramme · Consulting-Deliverables · Pitch Decks

Kommerziell nutzbare Menütafeln und Magazin-Layouts
Dichter Fließtext, Produktfotos und Markenauftritt in einem Layout. GPT Image 2 liefert Ergebnisse, die auch in echter Druckauflösung überzeugen — nicht nur als Thumbnail.
Create a full detailed restaurant menu board for a modern Italian café — elegant design with appetizing food photos, clear prices, Chinese and English dish names, readable small-text descriptions, high-resolution commercial quality, print-ready.
Anwendungsfall: Speisekarten · Produktkataloge · Magazin-Editorials · Brand Books · Print-Material

Stilübertragung zwischen Fotos
Nimm die Ästhetik eines Bildes und übertrage sie auf das Motiv eines anderen. GPT Image 2 bewahrt Identität, Bildaufbau und Pose des Motivs aus der einen Referenz und übernimmt Farbpalette, Medium und Stimmung aus der anderen.
Apply the art style from image 1 to the subject in image 2. Keep the composition, facial identity, and pose from image 2 exactly as shown.
Anwendungsfall: Art Direction · Illustration · Konzept-Exploration · Markenästhetik-Konsistenz

Fotobearbeitung per natürlicher Sprache — ohne Masken, ohne Ebenen
Lade ein beliebiges Foto hoch, beschreibe die gewünschte Änderung in einfachen Worten — GPT Image 2 findet die richtige Bildregion, wendet die Änderung an und bewahrt alles, was du nicht erwähnt hast. Hintergrundtausch, Objekt entfernen, Outfit wechseln, Outpainting, Foto-Restauration — alles über eine einzige Prompt-Oberfläche.
Replace the background with a rainy Tokyo street at night. Keep the subject, clothing, and facial features unchanged. Match the lighting of the new scene — cool blue rim light from the back, warm street-lamp glow on the face.
Anwendungsfall: Hintergrundtausch · Objekt entfernen · Outfit wechseln · Foto-Restauration · Outpainting
Häufig gestellte Fragen zu GPT Image 2
Was ist GPT Image 2?
GPT Image 2 ist das neueste Modell von OpenAI zur Bildgenerierung und -bearbeitung. Es wandelt einen Text-Prompt in ein hochaufgelöstes Bild um, bearbeitet bestehende Fotos per natürlichsprachlicher Anweisung und fusioniert bis zu 16 Referenzbilder zu einem einzigen, stimmigen Output — alles im selben Modell.
Worin unterscheidet sich GPT Image 2 von Nano Banana 2?
Beides sind starke Bildmodelle mit unterschiedlichen Stärken. GPT Image 2 ist stärker bei Multi-Referenz-Reasoning, Textdarstellung im Bild (Beschriftungen, Poster, Produkttexte) und komplexer bildübergreifender Komposition. Nano Banana 2 bietet die beste Character-Konsistenz über lange Bildserien und ist bei einfachen Einzelbild-Bearbeitungen meist schneller. Beide Modelle sind in deinem Nano-Banana-Account verfügbar — schicke denselben Prompt durch beide und behalte das passende Ergebnis. Nano Banana 2 hier testen.
In welchen Sprachen rendert GPT Image 2 Text?
Lateinische Schrift (Englisch, Deutsch und weitere europäische Sprachen) sowie deutliche Fortschritte bei nicht-lateinischen Schriften — Japanisch, Koreanisch, Chinesisch, Hindi und Bengalisch werden von OpenAI explizit als stark verbessert genannt. In der Praxis liefert das Modell auch für andere Schriften brauchbare Ergebnisse bei kurzen Texten, bei dichten Absätzen in weniger verbreiteten Sprachen kann die Qualität jedoch schwanken.
Unterstützt GPT Image 2 transparente Hintergründe?
Nein — GPT Image 2 gibt aktuell keine PNGs mit Transparenz aus. Wenn du einen transparenten Hintergrund brauchst, nutze als Folgeschritt das kostenlose AI Remove Background Tool, oder wähle in deinem Nano-Banana-Account ein anderes Modell, das einen Alpha-Kanal unterstützt.
Welche Auflösungen liefert GPT Image 2?
Bis zu 4K-nahem Output — das Modell unterstützt Auflösungen mit einer maximalen langen Kante von rund 3840 px und deckt damit 3840×2160 (Querformat) und 2160×3840 (Hochformat) ab, dazu 1:1, 3:2, 2:3 und flexible Seitenverhältnisse dazwischen. Outputs über 2K gelten bei OpenAI als experimentell und können in der Konsistenz schwanken.
Ist GPT Image 2 auf Nano Banana kostenlos nutzbar?
Neue Nutzer erhalten kostenlose Credits bei der Registrierung, und weitere Credits lassen sich über tägliche Check-ins und Freunde-Einladungen freischalten. Sind die Gratis-Credits aufgebraucht, kostet jede Generierung eine geringe Menge Credits — abhängig von der gewählten Qualitätsstufe. Aktuelle Preise findest du auf der Pricing-Seite.
Darf ich mit GPT Image 2 erstellte oder bearbeitete Bilder kommerziell nutzen?
Ja — sobald du auf einem kostenpflichtigen Plan ein Bild generiert hast, darfst du es für private, kommerzielle oder kreative Projekte verwenden. Alle Outputs enthalten unsichtbare SynthID-Wasserzeichen (gemäß OpenAIs Responsibility-by-Design-Policy) zur Herkunftsnachverfolgung, das beeinträchtigt jedoch weder die visuelle Qualität noch deine Nutzungsrechte.
Wie schreibe ich Prompts für Bearbeitungen mit mehreren Bildern?
Beschrifte deine Referenzen eindeutig. Ein Prompt wie „Platziere das Produkt aus image 1 in die Szene aus image 2. Übernimm den Farbstil aus image 3. Behalte den Kamerawinkel aus image 2 bei." ist deutlich zuverlässiger als „kombiniere diese Fotos". Sag GPT Image 2 konkret, welches Bild welche Rolle liefert (Motiv, Hintergrund, Stil, Licht, Outfit) — dann liefert es auch entsprechend.
Bleiben Gesichter und Logos bei Bearbeitungen wirklich erhalten?
Deutlich besser als bei früheren Image-to-Image-Modellen — OpenAI verarbeitet jedes Eingabebild in hoher Detailtreue, genau um Gesichter, Logos und Produktdetails zu bewahren. Nicht jede Bearbeitung gelingt pixelgenau, und sehr radikale Stilübertragungen können die Identität abschwächen. Für maximale Gesichtskonsistenz über eine Serie von Bearbeitungen ist Nano Banana 2 meist die stärkere Wahl.




