Generative KI

KI Bilder erstellen: Die 12 besten KI-Bildgeneratoren (kostenlos und kostenpflichtig)

Letzte Aktualisierung
26. März 2026

Mit einem KI-Bildgenerator erstellen Sie in Sekundenschnelle hochwertige Bilder und Grafiken. Sie müssen das Bild, das Sie sich vorstellen, nur beschreiben – den Rest übernimmt die KI. Doch die Auswahl an KI-Tools ist mittlerweile groß. Welches erzielt die beeindruckendsten und passendsten Ergebnisse?

Wir stellen einige der aktuell besten KI-Bildgeneratoren vor und verraten, wie viel sie kosten und was mit ihnen möglich ist.

Was sind KI-Bildgeneratoren?

KI-Bildgeneratoren sind Tools, die auf Basis von Texteingaben automatisch Bilder erzeugen. Sie nutzen Methoden aus dem Machine Learning, um aus einer Beschreibung ein visuelles Ergebnis zu erstellen.

Sie geben dafür lediglich einen sogenannten Prompt ein – also eine kurze oder ausführliche Beschreibung des Bildes, das Sie generieren wollen. Die KI analysiert diese Eingabe und greift auf ihr Training mit großen Bilddatensätzen zurück, um daraus ein passendes Bild zu erstellen.

So entsteht in wenigen Sekunden ein Ergebnis, das Ihrer Vorgabe entspricht – etwa ein realistisches Foto, eine Illustration oder ein Bild in einem bestimmten Stil. Hier ein Beispiel:

So sieht die Bildgenerierung bei ChatGPT aus.

Die Einsatzmöglichkeiten sind vielfältig: KI-Bildgeneratoren erstellen unter anderem Grafiken für Websites, Social Media, Marketing-Materialien oder kreative Projekte.

KI-Plattform vs. KI-Modell

Wenn von KI-Bildgeneratoren die Rede ist, können damit sowohl KI-Plattformen als auch die dahinterstehenden KI-Modelle gemeint sein.

  • KI-Plattformen sind Online-Tools, die KI-Modelle für Nutzer zugänglich machen. Sie bieten ein intuitives Frontend, in dem Sie Ihre Text-Prompts eingeben können, um daraus Bilder zu erstellen.

  • Die KI-Modelle selbst sind die Algorithmen, die auf Basis riesiger Datensätze trainiert wurden, um Textvorgaben in Bilder zu verwandeln. Sie liefern die technologische Basis für die Funktionalität von KI-Plattformen.

Manche KI-Plattformen nutzen eigene, proprietäre KI-Modelle, andere „mieten“ sich bekannte KI-Modelle und stellen nur das Frontend bereit. Wir gehen auf beide Kategorien ein.

Was sind die wichtigsten KI-Modelle?

Im Bereich der Bildgenerierung per KI gehören die folgenden Modelle zu den derzeit wichtigsten auf dem Markt:

KI-Modell

Entwickler

Wofür es sich Hersteller eignet

GPT Image 1.5

OpenAI

Produktbilder, Social-Media-Grafiken und Bildbearbeitung für Webseiten oder Präsentationen

Nano Banana 2

Google

Bilder und Bildbearbeitung für Marketing, Blogartikel und andere Online-Inhalte

Midjourney V7

Midjourney

Werbekampagnen, Moodboards und Design-Entwürfe

Firefly Image Model 5

Adobe

Grafiken und Bildmaterial für Designprojekte in der Adobe Creative Cloud

Stable Diffusion 3.5

Stability AI

Eigene Bildprojekte, individuelle Stile und interne Nutzung im Unternehmen

FLUX.2

Black Forest Labs

Realistische Produktdarstellungen und Konzeptbilder

Ideogram 3.0

Ideogram

Poster, Werbegrafiken und Social-Posts mit gut lesbarem Text

Grok Imagine

xAI

Bilder für Social Media, Memes und andere schnell erstellte visuelle Inhalte

MAI-Image-1

Microsoft

Realistische Fotos, Präsentationen, Marketing

Die KI-Modelle sind oft über unterschiedliche Plattformen nutzbar. Einige Anbieter stellen sie sowohl über eigene Web-Oberflächen als auch über Programmierschnittstellen (APIs) bereit. Gleichzeitig integrieren Drittanbieter bestimmte Modelle in ihre eigenen Tools.

Dasselbe KI-Modell kann deshalb je nach Plattform unterschiedliche Funktionen, Preise oder Bedienoberflächen haben. Entscheidend ist daher nicht nur das Modell selbst, sondern auch, über welche Plattform Sie darauf zugreifen.

Welche KI-Bildgeneratoren sind am besten?

Nicht nur KI-Inhalte überschwemmen das Netz – sondern auch die Tools, mit denen Sie KI-Inhalte erstellen können. Es gibt immer mehr KI-Bildgeneratoren, die alle mehr oder weniger dasselbe versprechen.

Wir haben einige der besten, aktuell erhältlichen KI-Bildgeneratoren für Sie zusammengestellt und verraten, was sie auszeichnet.

Unsere Kriterien für den Bildervergleich

Unsere Einschätzung basiert auf mehreren Kriterien, insbesondere auf der Qualität, dem Funktionsumfang, den Kosten und der Benutzerfreundlichkeit der Plattformen. Für einen möglichst direkten Vergleich der Qualität der generierten Bilder, haben wir jeden KI-Bildgenerator mit den vier gleichen Prompts gefüttert:

  • 1.

    Ein einsamer Roboter mit Stofftier in einer neonbeleuchteten Straße einer futuristischen Metropole, kurz nach dem Regen.

  • 2.

    Ein beleuchtetes Baumhaus in einem Fantasy-Wald im Zeichentrickstil.

  • 3.

    Drei frei erfundene, nicht aus Büchern oder Mythologie bekannte Fantasiewesen, die auf einer Klippe vor einem Leuchtturm im Meer versammelt sind, im Pixelart-Stil.

  • 4.

    Ein fotorealistisches Bild von John F. Kennedy während seiner „Ich bin ein Berliner“-Rede.

Darüber hinaus testen wir auch die Tauglichkeit der KI-Programme für geschäftliche Zwecke. Dafür nutzen wir folgende Beispiele:

  • 1.

    Social Media-Bild
    Ein Social Media Asset für eine Tech-Firma, das eine B2B-Kundenreferenz hervorhebt. Der Kunde ist eine Hotelkette, die durch ein innovatives Buchungssystem Zeit und Kosten gespart hat. Das Asset soll eine Illustration eines Miniatur-Hotels in einem modernen Stil mit lebendiger Farbpalette (blau und orange) zeigen, die diese Vorteile visualisiert. In einer Ecke soll prominent der Schriftzug '20 % mehr Direktbuchungen durch Simplibook' integriert sein.

  • 2.

    Geschäftliche Präsentation
    Ein Cover für einen jährlichen Finanzbericht, das Stärke und Wachstum visualisiert, mit einem abstrakten Bild von aufsteigenden Balkendiagrammen und einer Erdkugel im Hintergrund. Der Titel ‚Jahresbericht 2025‘ soll oben im Bild stehen, mit dem Untertitel ‚Globale Expansion und Innovation‘

Hier ist unsere Top 12 der besten KI-Bildgeneratoren auf dem Markt:

1.

Nano Banana 2 in Google Gemini: Starke Bilder auch ohne Abo

  • Kostenlose Version: Ja, mit Einschränkungen

  • Kosten für Premium: ab 7,99 € pro Monat

  • Maximale Auflösung: 1.536 × 1.024 Pixel

Nano Banana 2 ist das neueste Bildmodell von Google. Es ist kostenfrei in der Oberfläche des Google-KI-Assistenten Gemini integriert. Zahlende Nutzer erhalten höhere Tageslimits und können erzeugte Bilder über den Chatbot zusätzlich mit Nano Banana Pro neu berechnen lassen.

Wie funktioniert Nano Banana 2?

Sie nutzen Nano Banana 2 direkt über Gemini im Browser oder in der App. Sie geben einen Prompt ein, lassen ein Bild generieren und können das Ergebnis anschließend in derselben Oberfläche weiterbearbeiten. Gemini unterstützt dabei nicht nur klassische Text-zu-Bild-Prompts: Sie können auch vorhandene Bilder hochladen oder Bilder kombinieren.

Vom gewünschten Stil abgesehen gibt es bei Nano Banana 2 keine weiteren Einstellungen. Stattdessen verwenden Sie natürliche Sprache, um ans Ziel zu kommen. Sie weisen Gemini zum Beispiel an, ein Bild im Format von 4:3 oder 16:9 zu erstellen.

Die einfache Gemini-Oberfläche zur Bildgenerierung.

Wie gut ist die Qualität bei Nano Banana 2?

Nano Banana 2 liefert insgesamt sehr starke Ergebnisse und zählt aktuell zu den leistungsfähigeren Bildmodellen. Prompts werden präzise umgesetzt, Motive bleiben über mehrere Varianten hinweg konsistent und auch komplexere Beschreibungen verarbeitet das Modell zuverlässig.

Auch wenn ein Prompt mehrere Elemente und Stimmungen oder Stile kombiniert, bleibt das Ergebnis meist sehr nah an der Beschreibung. Das können nicht alle KI-Modelle.

Unsere Beispiel-Prompts mit Cartoon-Baumhaus, Roboter und drei Fabelwesen setzt Nano Banana 2 richtig gut um. Der Roboter interagiert als einziger im Vergleich mit seinem Stofftier.

John F. Kennedy in Berlin ist im Vergleich mit anderen Modellen am besten gelungen. Die Google-KI hat sogar von sich aus daran gedacht, dass Kanzler Adenauer und Berlins regierender Bürgermeister Brandt ebenfalls bei der Rede mit dabei waren. Flaggen und Texte passen ebenfalls:

Diese Bilder haben wir mit Nano Banana 2 generiert.

Wie viel kostet Nano Banana 2?

Nano Banana 2 ist Teil der Google-KI-Tarife innerhalb von Gemini. Hier sind die Tarife von Google AI:

Tarif

Kosten pro Monat

Konditionen

Kostenlos

keine

  • bis zu 20 Bilder pro Tag

  • nur Nano Banana 2

Google AI Plus

7,99 €

  • bis zu 50 Bilder pro Tag

  • Zugriff auf Nano Banana Pro

  • 200 GB Cloud-Speicher

Google AI Pro

21,99 €

  • bis zu 100 Bilder pro Tag

  • Zugriff auf Nano Banana Pro

  • 2 TB Cloud-Speicher

Google AI Ultra

274,99 €

  • bis zu 1.000 Bilder pro Tag

  • Zugriff auf Nano Banana Pro

  • 30 TB Cloud-Speicher

Google weist darauf hin, dass die Bildkontingente je nach Auslastung variieren können. Sie werden täglich zurückgesetzt.

Die kostenpflichtigen Gemini-Tarife bündeln darüber hinaus weitere KI-Funktionen sowie zusätzlichen Cloud-Speicher. Wenn Sie ausschließlich Bilder erstellen möchten, zahlen Sie damit auch für Funktionen, die nicht zwingend benötigt werden.

Wie gut ist Nano Banana 2 für geschäftliche Zwecke?

Google beansprucht laut den Terms of Service grundsätzlich kein Eigentum an Inhalten, die Sie erstellen. Das gilt auch für KI-generierte Bilder und Videos.

Gleichzeitig räumen Sie Google aber eine begrenzte Lizenz ein, damit der Konzern Ihre Inhalte über eigene Dienste bereitstellen und dort bewerben kann. Die rechtliche Verantwortung für urheberrechtlich geschützte Motive bleibt laut Google bei Ihnen.

Für geschäftliche Zwecke ist auch die Textdarstellung in Grafiken relevant. Die ist bei Nano Banana 2 in der Regel viel besser als bei den meisten anderen Modellen aus unserem Vergleich, auch wenn sie nicht immer fehlerfrei funktioniert. Einfache Beschriftungen gelingen gut, längere Texte oder typografisch anspruchsvolle Layouts müssen Sie trotzdem weiterhin kontrollieren.

Diese Grafiken haben wir mit Nano Banana 2 generiert.

Was sind Vor- und Nachteile von Nano Banana 2?

  • Sehr hohe Bildqualität auch ohne Abo
    Das leistungsstarke KI-Modell von Google steht Ihnen schon in der kostenlosen Version von Gemini zur Verfügung und liefert trotzdem Ergebnisse auf sehr hohem Niveau.

  • Tageslimit statt Credit-System
    Gemini arbeitet ohne Credit-System. Statt einzelner Guthaben pro Bild gelten Tageslimits je nach Tarif. Das macht die Nutzung einfacher und besser planbar.

  • Gute Textdarstellung in Bildern
    Nano Banana 2 setzt Beschriftungen vergleichsweise sauber um. Perfekt funktioniert das nicht – aber immerhin deutlich besser als bei der Konkurrenz.

  • Direkt in Gemini integriert
    Sie können das Modell im Web oder auf dem Smartphone direkt nutzen, ohne ein separates Bildtool zu benötigen. Auf vielen Android-Handys sind Gemini und damit auch Nano Banana 2 bereits vorinstalliert.

  • Kein spezialisiertes Design-Tool
    Gemini ist in erster Linie ein KI-Assistent mit integrierter Bildfunktion. Für präzise Designarbeit mit festen Exportformaten oder Vektorgrafiken sind spezialisierte Tools besser geeignet.

  • Nur im Bundle-Tarif
    In den kostenpflichtigen Gemini-Abos zahlen Sie automatisch auch für weitere Google-Funktionen und zusätzlichen Cloud-Speicher.

2.

GPT Image bei ChatGPT: Präzises Prompt-Verständnis

  • Kostenlose Version: Ja, mit Einschränkungen

  • Kosten für Premium: ab 23 € pro Monat

  • Maximale Auflösung: 1.536 × 1.024 Pixel

GPT Image 1.5 ist der aktuelle Bildgenerator von OpenAI, dem Unternehmen hinter ChatGPT. Er hat den Vorgänger DALL-E weitgehend ersetzt. Während DALL-E noch als eigenständiges Modell vermarktet wurde, bündelt OpenAI die Bildgenerierung inzwischen innerhalb der GPT-Modellfamilie.

Text- und Bildverarbeitung laufen nicht mehr als getrennte Systeme, sondern innerhalb eines gemeinsamen Modells. Das verbessert laut OpenAI insbesondere das Verständnis komplexer Prompts.

Wie funktioniert GPT Image 1.5?

Sie nutzen GPT Image 1.5 direkt in ChatGPT. Hier geben wie gewohnt einen Prompt ein – als Text oder Sprache – und lassen daraus direkt ein Bild generieren. Je präziser Ihr Prompt formuliert ist, desto besser fällt das Ergebnis aus. Sinnvoll sind Angaben zu:

  • Motiv

  • Perspektive

  • Stilrichtung

  • Lichtverhältnissen

  • gewünschtem Format (hoch oder quer)

Im Unterschied zu DALL-E 3 erlaubt das neuere GPT Image 1.5 direkte Nachbearbeitungen. Sie können einzelne Elemente ändern, Hintergründe ersetzen oder Details anpassen. Das Modell berücksichtigt dabei den bisherigen Kontext.

Nachbearbeitungen sind bei ChatGPT einfach möglich.

Wie gut ist die Qualität bei GPT Image 1.5?

Ausgesprochen gut. GPT Image 1.5 zeigt eine hohe Konsistenz, selbst bei komplexeren Anweisungen. Mehrstufige Beschreibungen setzt das Tool zuverlässig um. Stilbrüche treten selten auf.

Fotorealistische Darstellungen sind überzeugender als bei früheren Versionen, Personen wirken natürlicher. Trotzdem bleiben vereinzelt noch manche KI-Schwächen bestehen. Sehr feine Strukturen oder technische Details können fehlerhaft erscheinen.

Klar verbessert hat sich die Textdarstellung im Bild. Kurze Überschriften oder einfache Beschriftungen funktionieren häufig korrekt. Längere Textpassagen oder kleine Schriftgrößen bleiben jedoch teils problematisch. Für druckfertige Designs empfiehlt sich eine separate Nachbearbeitung.

Diese Bilder haben wir mit GPT Image 1.5 generiert.

Wie gut eignet sich GPT Image 1.5 für geschäftliche Zwecke?

Die Rechte der Bilder, die Sie mit GPT Image 1.5 erstellen, gehören laut OpenAI Ihnen. Sie können damit machen, was Sie möchten – sie also auch für kommerzielle Zwecke nutzen.

Auch im geschäftlichen Bereich hat GPT Image 1.5 viele Einsatzzwecke. Durch das gute Prompt-Verständnis kann es viele unterschiedliche Assets, von Social-Media-Bildern über Grafiken für Präsentationen bis hin zu Produktinformationsblättern und Werbeanzeigen erstellen.

Diese geschäftlichen Assets haben wir mit ChatGPT erstellt.

Wie viel kostet GPT Image 1.5?

Sie können GPT Image 1.5 kostenfrei oder mit einem ChatGPT-Abo nutzen. Die konkreten Nutzungsgrenzen der kostenfreien und der Plus-Variante kommuniziert OpenAI aber leider nicht so transparent, wie wir uns das wünschen würden. Wenn Sie regelmäßig Bilder generieren möchten, benötigen Sie in der Praxis mindestens den Plus-Tarif.

Aktuell stehen Ihnen vier Optionen zur Verfügung:

Tarif

Kosten pro Monat

Konditionen

Free

keine

  • begrenzter Zugriff auf GPT-4o-mini und GPT Image 1.5

  • wenige Bilder pro Tag

  • niedrige Priorität bei hoher Auslastung

  • Werbung möglich

Plus

23 €

  • begrenzter Zugriff auf GPT-5 und GPT Image 1.5

  • ca. 80 Prompts alle 3 Stunden

Business

34 € pro Nutzer

  • unbegrenzter Zugriff auf GPT-5 und GPT Image 1.5

  • Team-Features und Adminkonsole

Pro

229 €

  • unbegrenzter Zugriff auf GPT-5 und GPT Image 1.5

  • erweiterter Sora-Zugriff (Videos)

  • experimentelle Funktionen

Was sind Vor- und Nachteile von GPT Image 1.5?

  • Hohe Treffsicherheit
    Im Vergleich zu früheren Modellen setzt GPT Image 1.5 auch komplexe oder verschachtelte Prompts zuverlässig um.

  • Einfache Bildbearbeitung
    Einzelne Elemente lassen sich nachträglich anpassen, ohne das gesamte Bild neu zu generieren. Das erleichtert Varianten und Detailkorrekturen.

  • Kontext bleibt im Chat erhalten
    Das Modell berücksichtigt frühere Anweisungen im Verlauf. Sie können Anforderungen schrittweise präzisieren, statt sie jedes Mal neu zu formulieren.

  • Direkt in ChatGPT nutzbar
    Sie benötigen kein separates Tool: Die Bildgenerierung funktioniert im gewohnten Chat-Interface im Web oder in der App. Teilweise ist das Modell auch über Drittanbieter verfügbar.

  • Nutzungsgrenzen nicht transparent
    Die Limits für die Bildgenerierung variieren je nach Tarif und Auslastung und werden von OpenAI nicht immer klar kommuniziert.

  • Texte teilweise fehlerhaft
    Auch wenn sich die Darstellung von Schrift stark verbessert hat, können Texte im Bild halluziniert oder inhaltlich falsch sein. Das betrifft sowohl Schreibweisen als auch faktische Aussagen.

3.

FLUX.2 von Black Forest Labs: KI-Bilder für Profis

  • Kostenlose Version: Nein

  • Kosten für Premium: ab 0,014 USD pro Bild

  • Maximale Auflösung: 2.304 × 1.736 Pixel je nach Modell

FLUX.2 ist die aktuelle Bildmodellfamilie von Black Forest Labs. Sie generieren Ihre KI-Bilder entweder direkt beim Anbieter oder über Drittplattformen, die FLUX-Modelle integrieren, z.B. Freepik.

Die FLUX.2-Modelle existieren in verschiedenen Varianten, die sich bei Qualität, Geschwindigkeit, Kosten und Steuerungsmöglichkeiten deutlich unterscheiden.

Der Playground von Black Forest Labs.

Generell richten sich die KI-Modelle eher an fortgeschrittene Nutzer und Unternehmen, die möglichst viel Kontrolle haben möchten. Während ältere Modelle über Drittanbieter teils frei zugänglich sind, stehen die leistungsstärkeren Varianten der FLUX.2-Familie hinter einer Paywall.

Wie funktioniert FLUX.2?

Im Playground von Black Forest Labs starten Sie mit einem Prompt und wählen ein passendes FLUX.2-Modell. Anschließend legen Sie – je nach Bedarf – Seitenverhältnis und Auflösung fest und generieren das Bild.

Für mehr Kontrolle können Sie zusätzlich Referenzbilder hochladen. FLUX.2 verarbeitet auch mehrere Vorlagen gleichzeitig und orientiert sich dabei an Farben, Motiven oder Personen.

Bei den Modellen haben Sie als Nutzer die Wahl zwischen:

  • FLUX.2 [klein] 4B: schnellste und günstigste Variante

  • FLUX.2 [klein] 9B: ebenfalls schnell, etwas leistungsstärker

  • FLUX.2 [pro]: Standardvariante mit guter Qualität

  • FLUX.2 [pro-preview]: neueste Pro-Version

  • FLUX.2 [flex]: mehr Feineinstellungen, besonders für Text und Details geeignet

  • FLUX.2 [max]: höchste Qualität, stärkste Prompt-Treue

Wie gut ist die Qualität bei FLUX.2?

FLUX.2 liefert durchweg hochwertige Ergebnisse, insbesondere in den Pro- und Max-Varianten. Mehrfachreferenzen, präzise Farbsteuerung und hohe Auflösungen ermöglichen eine deutlich kontrolliertere Bildgenerierung als bei vielen einfacheren Tools. Auch Gesichter, Hände und Typografie sind in der Regel sauber umgesetzt.

In unserem Beispiel schafft FLUX.2 bei den drei Fabelwesen die höchste Detailtreue im Vergleich, aber auch der Roboter und das Cartoon-Baumhaus können sich sehen lassen. Der Kennedy von Black Forest Labs ist einer der besten, selbst wenn er sich als „Beriner“ statt als Berliner bezeichnet.

Diese Bilder haben wir mit FLUX.2 generiert.

Wie viel kostet FLUX.2?

Einen kostenlosen Tarif gibt es nicht. Black Forest Labs arbeitet mit einem Credit-System, bei dem ein Credit 0,01 US-Dollar entspricht. Die Kosten pro Bild variieren je nach Modell und Auflösung.

Die folgenden Angaben sind als Mindestpreise zu verstehen:

Modell

Preis Text-zu-Bild

Preis Bildbearbeitung

FLUX.2 [klein] 4B

ab 0,014 USD

ab 0,014 USD

FLUX.2 [klein] 9B

ab 0,015 USD

ab 0,015 USD

FLUX.2 [pro]

ab 0,03 USD

ab 0,045 USD

FLUX.2 [flex]

ab 0,05 USD

ab 0,10 USD

FLUX.2 [max]

ab 0,07 USD pro Megapixel

ab 0,06 USD pro Megapixel

Wie gut ist FLUX.2 für geschäftliche Zwecke?

Für Unternehmen eignet sich FLUX.2 vor allem dann, wenn Bilder über viele Varianten hinweg konsistent bleiben müssen. Das gilt für Produktbilder, Kampagnenmotive, Anzeigen oder Visuals mit festen Farben, wiederkehrenden Figuren oder klaren Layoutvorgaben.

Die FLUX.2-Angebote sind für die kommerzielle Nutzung ausgelegt, solange Sie diese auch über die kostenpflichtigen Services von Black Forest Labs nutzen. Für größere Unternehmen stellt der Anbieter einen eigenen Enterprise-Bereich zur Verfügung.

Bei Text im Bild zeigt FLUX.2 starke Ergebnisse. Das Modell setzt Schrift deutlich zuverlässiger um als viele andere Bildgeneratoren und bleibt auch bei längeren Texten oft gut lesbar:

Diese Grafiken haben wir mit FLUX.2 generiert.

Was sind Vor- und Nachteile von FLUX.2?

  • Starke Bildqualität auch bei komplexen Prompts
    FLUX.2 setzt detaillierte Beschreibungen sehr präzise um und gehört zu den genauesten verfügbaren Bildgeneratoren. Auch bei Szenen mit vielen Elementen, Materialien oder Lichtstimmungen bleibt das Modell noch relativ nah am Prompt.

  • Stark bei wiederkehrenden Visuals
    Die KI-Modelle eignen sich gut für Motive, die über mehrere Varianten hinweg konsistent bleiben müssen. Mehrere Referenzbilder und die hohe Auflösung helfen dabei, Figuren oder Produkte stabil zu reproduzieren.

  • Verschiedene Modelle für unterschiedliche Anforderungen
    Die FLUX.2-Familie deckt verschiedenste Anwendungsfälle ab. Schnellere Varianten eignen sich für große Bildmengen, teurere Modelle bieten mehr Qualität.

  • Gute Ergebnisse bei Text im Bild
    Beschriftungen gelingen bei FLUX.2 vergleichsweise zuverlässig. Selbst längere Textpassagen bleiben häufig gut lesbar, was bei vielen anderen Bildgeneratoren nicht der Fall ist.

  • Kein kostenloser Einstieg
    Einen Gratis-Tarif gibt es nicht: Wenn Sie FLUX.2 direkt beim Anbieter einsetzen möchten, führt an kostenpflichtigen Credits kein Weg vorbei.

  • Nichts für Gelegenheitsnutzer
    FLUX.2 verlangt etwas mehr Einarbeitung. Schon die Modellwahl ist erklärungsbedürftig. Dazu kommt eine Preislogik, die eher an Produktions-Tools als an einfache Kreativ-Apps erinnert.

4.

Grok Imagine: KI-Bilder nicht nur für X

  • Kostenlose Version: Ja, mit Einschränkungen

  • Kosten für Premium: ab 30 USD pro Monat

  • Maximale Auflösung: 2.048 × 2.048 Pixel

Grok Imagine ist das Bild- und Videomodell von xAI. Sie verwenden es direkt im KI-Assistenten Grok auf grok.com, in den Grok-Apps oder über X (ehemals Twitter). Die Bildgenerierung ist dabei nicht als separates Kreativprogramm, sondern als Teil von Grok zu verstehen.

Bereits in der kostenlosen Variante des KI-Modells erlaubt Grok die Erstellung von rund 10 Bildern alle 2 Stunden. Für die gelegentliche Generierung muss es also kein kostenpflichtiges Abo sein, das im Vergleich mit anderen Anbietern recht teuer ist.

Die Oberfläche von Grok Imagine.

Für die Bildgenerierung steht ausschließlich Grok Imagine zur Verfügung. Das ältere Modell Aurora spielt praktisch keine Rolle mehr. Sie wechseln also nicht zwischen verschiedenen Bildmodellen, sondern arbeiten mit einem festen Standardmodell.

Wie funktioniert Grok Imagine?

Sie geben einen Prompt ein und lassen daraus Bilder erzeugen. Zusätzlich können Sie bestehende Bilder bearbeiten oder Varianten aus einer Vorlage ableiten. Grok Imagine ist nicht nur ein reines Text-zu-Bild-Tool, sondern auch ein Werkzeug für Korrektur und Inspiration.

Die Bedienung ist bewusst einfach gehalten. xAI setzt auf natürliche Sprache statt auf viele Regler und Einstellungen. Das erleichtert den Einstieg und beschleunigt den Workflow, schränkt aber die Feinsteuerung ein.

Wie gut ist die Qualität bei Grok Imagine?

Grok Imagine liefert insgesamt starke Ergebnisse. Prompts werden sauber umgesetzt und die generierten Bilder wirken oft stimmig. Wenn Sie jedoch sehr präzise mit Layout, Stil oder Markenlogik arbeiten möchten, sind spezialisierte Tools besser geeignet.

Das Bild mit den drei Fabelwesen ist gut gelungen: Die Figuren passen zusammen, unterscheiden sich klar und wirken trotzdem wie Teil derselben Szene. Auch das Cartoonhaus überzeugt durch konsistente Formen und Farben.

Das Kennedy-Motiv ist ebenfalls gelungen und klar erkennbar. Gleichzeitig zeigt sich, dass Grok Imagine bei Nebenfiguren weniger präzise arbeitet.

Diese Bilder haben wir mit Grok Imagine generiert.

Wie viel kostet Grok Imagine?

Grok Imagine ist Teil des größeren Grok-Angebots von xAI, das über verschiedene Zugangswege verfügbar ist. Je nach Plattform unterscheiden sich Funktionen, Verfügbarkeit und Tarifstruktur. Die genauen Limits für Bildgenerierungen werden nicht immer transparent kommuniziert.

Über grok.com stehen Ihnen aktuell folgende Tarife zur Verfügung:

Tarif

Kosten pro Monat

Konditionen

Free

keine

  • ca. 10 Bildgenerierungen pro 2 Stunden

SuperGrok

30 USD

  • ca. 200 Bild- und Videogenerierungen pro Tag

  • früherer Zugriff auf neue Funktionen

Grok Business

30 USD pro Nutzer

  • gemeinsame Arbeitsbereiche

  • zentrale Abrechnung und Nutzerverwaltung

Enterprise

individuell

  • unbegrenzte Nutzer, SSO, SCIM, eigene Rollen und Rechte, individuelle Datenaufbewahrung

Wie gut ist Grok Imagine für geschäftliche Zwecke?

xAI regelt die Nutzungsrechte vergleichsweise klar: Sie sind der Besitzer des generierten Outputs und dürfen die erzeugten Bilder auch kommerziell nutzen. Gleichzeitig weist xAI darauf hin, dass Inhalte als „mit Grok erstellt“ gekennzeichnet werden sollen.

Für Teams bietet xAI eigene Business- und Enterprise-Tarife. Sie bieten Funktionen wie gemeinsame Arbeitsbereiche, eine zentrale Abrechnung, eine Nutzerverwaltung, Domain-Verifizierung sowie (in Enterprise) SSO, SCIM und benutzerdefinierte Rollen.

Auch bei Text im Bild schneidet Grok Imagine gut ab. Beschriftungen bleiben häufig lesbar und enthalten weniger Fehler als bei vielen anderen Modellen.

Diese Grafiken haben wir mit Grok Imagine generiert.

Was sind Vor- und Nachteile von Grok Imagine?

  • Einfacher Einstieg
    Die Bedienung ist durch den begrenzten Funktionsumfang angenehm unkompliziert: Sie geben einen Prompt ein, erzeugen ein Bild und bessern es bei Bedarf direkt nach.

  • Starke kostenlose Version
    Bereits ohne Abo lassen sich viele Bilder generieren. Das reicht aus, um das Tool sinnvoll zu testen und gelegentliche KI-Bilder zu nutzen.

  • Hohe Bildqualität bei unterschiedlichen Motiven
    Auch bei verschiedenen Stilrichtungen liefert Grok Imagine überzeugende Ergebnisse. Die Generierung erfolgt zudem vergleichsweise schnell.

  • Über viele Plattformen erreichbar
    Grok Imagine ist direkt im KI-Assistenten Grok integriert. Sie müssen kein separates Bildtool öffnen, sondern arbeiten über grok.com, in den Grok-Apps, bei X oder Drittanbietern.

  • Kein reines Bild-Abo
    Wenn Sie ausschließlich Bilder erstellen möchten, zahlen Sie dennoch für das gesamte Grok-Angebot. Das macht das Tool als reinen Bildgenerator weniger attraktiv.

  • Preise und Limits nicht ganz transparent
    Die Tarifstruktur ist durch die unterschiedlichen Zugangswege etwas komplexer. Limits werden nicht so klar kommuniziert wie bei anderen Tools.

5.

Adobe Firefly: KI für das Photoshop-Ökosystem

  • Kostenlose Version: Ja, mit Einschränkungen

  • Kosten für Premium: ab 9,29 € pro Monat

  • Maximale Auflösung: 2.304 × 1.792 Pixel je nach Modell

Firefly von Adobe ist kein einzelner KI-Bildgenerator, sondern eine Plattform mit mehreren Modellen innerhalb des Adobe-Ökosystems. Sie erstellen Bilder im Browser, bearbeiten sie weiter und übertragen Ergebnisse bei Bedarf direkt in Adobe Express oder andere Adobe-Tools.

Adobe positioniert vor allem die eigenen Firefly-Modelle für die kommerzielle Nutzung, ergänzt die Plattform aber zusätzlich um zahlreiche Partnermodelle. Firefly eignet sich damit gut, um verschiedene Modelle an einem Ort zu testen.

Wie funktioniert Adobe Firefly?

Sie melden sich mit einem Adobe-Account an und geben Ihren Prompt in der Firefly-Weboberfläche ein. Das KI-Tool erzeugt daraufhin je nach Modell mehrere Varianten.

Zusätzlich stehen Ihnen Einstellmöglichkeiten für Format, Stil, Bildwirkung und weitere Parameter zur Verfügung. Die Oberfläche bleibt dabei übersichtlich und leicht verständlich.

Sie steuern das Ergebnis außerdem über Referenzbilder und gewünschte Effekte, ohne sich mit komplexen technischen Einstellungen beschäftigen zu müssen. Das erleichtert den Einstieg im Vergleich zu Tools mit vielen Reglern und Parametern.

Die Weboberfläche von Adobe Firefly.

Adobe Firefly lässt Ihnen als KI-Plattform die Wahl zwischen mehreren Modellen. Diese stammen teils von Adobe selbst, teils von Drittanbietern wie Google und OpenAI:

  • Firefly Image 3, 4 (Ultra), 5

  • GPT-Image-1.0, -1.5

  • Nano Banana, 2, Pro

  • FLUX.1 Kontext (Pro, Max), FLUX.1.1 (Pro), FLUX.2 Pro

  • Imagen 3, 4

  • Ideogram 3.0

  • Runway Gen-4 Image

Wie gut ist die Qualität bei Adobe Firefly?

Firefly setzt Prompts in der Regel sauber um und erzeugt stimmige Bilder. Komposition, Farben und Motividee passen meist gut zur Beschreibung. Die Ergebnisse wirken insgesamt solide, bleiben aber oft eher unauffällig.

Besonders gelungen sind das Cartoon-Baumhaus und der Roboter mit Stofftier. Die Bilder wurden mit Adobes aktuellem Modell Firefly Image 5 erstellt und zeigen saubere Formen, Farben und eine konsistente Bildsprache.

Diese Bilder haben wir mit Adobe Firefly generiert.

Mit dem Kennedy-Bild hat Firefly ein Problem. Den Prompt akzeptiert das System nicht, da es sich angeblich um einen Künstlernamen handelt. Auch ein zweiter Versuch mit abgewandeltem Prompt führt nicht zum gewünschten Ergebnis.

Statt eines Bildes gibt Firefly nur eine Fehlermeldung aus:

Adobe Firefly weigert sich, ein realistisches Kennedy-Bild zu erstellen.

Wie gut ist Adobe Firefly für geschäftliche Zwecke?

Adobe bewirbt die eigenen Firefly-Modelle gezielt für den kommerziellen Einsatz. Achten Sie aber genau darauf, welches Modell Sie gerade verwenden: Für Partnermodelle können andere Bedingungen gelten.

Für klassische Business-Assets ist Firefly nur bedingt geeignet. Die Plattform liefert zwar passende Bildrichtungen, setzt die inhaltliche Absicht komplexer Prompts jedoch nicht immer sauber um. Das gilt insbesondere für Motive mit klaren Aussagen oder Textbestandteilen.

Diese geschäftlichen Assets haben wir mit Adobe Firefly erstellt.

Wie viel kostet Adobe Firefly?

Adobe nutzt ein Credit-System. Die Anzahl der benötigten Credits variiert je nach Modell und gewünschter Funktion. Eine einfache Bildgenerierung kostet einen Credit, während größere Bilder oder externe Modelle deutlich mehr Credits verbrauchen.

Es stehen drei kostenpflichtige Firefly-Abos zur Auswahl. Bei jährlicher Zahlung ergeben sich folgende monatliche Preise:

Tarif

Kosten pro Monat

Credits

Konditionen

Free

keine

10

  • Nutzer erhalten Credits einmalig

  • Creative-Cloud-Nutzer bekommen je nach Plan 25 bis 500+ Credits monatlich zusätzlich

Standard

9,29 €

2.000 Credits pro Monat

  • unbegrenzte Bildgenerierung mit Firefly Image Model 4

  • Zugriff auf Partnermodelle

Pro

18,59 €

4.000 Credits pro Monat

  • unbegrenzte Bildgenerierung mit Firefly Image Model 4

  • Zugriff auf Partnermodelle

  • Adobe Express Premium und Photoshop enthalten

Premium

186,98 €

50.000 Credits pro Monat

  • unbegrenzte Bild- und Videogenerierung mit Firefly-Modellen

  • Zugriff auf Partnermodelle

  • Adobe Express Premium und Photoshop enthalten

Was sind Vor- und Nachteile von Adobe Firefly?

  • Einfache Bedienung ohne technische Hürden
    Der Bildgenerator von Adobe Firefly ist übersichtlich, bietet aber genug Einstellungen für Format, Stil und Referenzen.

  • Nahtlose Integration in Adobe-Tools
    Firefly ist eng mit Adobe Express und weiteren Adobe-Anwendungen verzahnt. Das erleichtert die Weiterbearbeitung, weil Bilder ohne Umwege übernommen werden können. Nutzer mit Adobe-Abo erhalten zusätzlich monatliche Credits.

  • Solide Ergebnisse bei Standardmotiven
    Für allgemeine Motive liefert Firefly zuverlässig saubere und stimmige Ergebnisse. Die Plattform eignet sich damit gut für illustrative Inhalte, bei denen ein sauberes Ergebnis wichtiger ist als eine besonders markante Bildsprache.

  • Bilder wirken austauschbar
    Firefly erzeugt zwar brauchbare Bilder, aber am Ende entsteht häufig Einheitsbrei. Im Vergleich zu stärkeren Bildgeneratoren fehlt oft eine klare Bildwirkung oder ein markanter Stil.

  • Schwächen bei realen Personen
    Firefly bildet reale Personen nicht zuverlässig ab oder blockiert entsprechende Prompts vollständig. Das schränkt die Nutzung bei historischen Motiven oder bekannten Persönlichkeiten ein.

  • Text im Bild sehr unzuverlässig
    Textvorgaben werden oft nur ungenau umgesetzt. Selbst bei einfachen Präsentationsgrafiken, Anzeigen oder Infomaterial ist oft noch viel Nachbearbeitung nötig.

6.

Recraft: KI-Bildgenerator für Designer

  • Kostenlose Version: Ja, mit Einschränkungen

  • Kosten für Premium: ab 10 USD pro Monat

  • Maximale Auflösung: 2.048 × 2.048 Pixel je nach Modell

Recraft richtet sich stärker als andere Bildgeneratoren an Designer und Kreative. Die Plattform generiert nicht nur Rasterbilder, sondern auch editierbare Vektorgrafiken.

Das macht Recraft interessant für Logos, Icons, Illustrationen, Anzeigenmotive und andere Gestaltungsaufgaben. Recraft verwendet dafür das eigene Modell Recraft V4, bietet Ihnen in Bezahl-Tarifen aber auch Zugriff auf eine enorme Anzahl weiterer Modelle von Drittanbietern.

Wie funktioniert Recraft?

Sie nutzen Recraft im Browser über das Recraft Studio. Dort geben Sie Ihren Prompt ein und wählen anschließend Modell, Seitenverhältnis und Bildtyp. Das neueste Modell Recraft V4 steht auch im Free-Tarif in den Varianten Standard, Pro, Vector und Vector Pro bereit.

Recraft kombiniert Bildgenerierung mit klassischen Designfunktionen. Sie können Bilder hochladen, Hintergründe entfernen, Motive freistellen, hochskalieren, Mockups bauen, Farben anpassen oder Rasterbilder in SVG-Dateien umwandeln. Beim Export unterstützt Recraft SVG, PNG, JPG, PDF, TIFF und Lottie.

Illustrationen im Recraft Studio.

In den Bezahl-Tarifen bietet Recraft Zugriff auf eine ungewöhnlich große Auswahl an KI-Modellen von Drittanbietern:

  • GPT-Image-1.5, -1.0, -4o

  • Nano Banana, Pro, 2

  • Flux 1 (Schnell, Dev, Pro, Kontext Max, Kontext Pro)

  • Flux 2 (Max, Dev, Pro, Flex)

  • Imagen 4, 4 Ultra

  • Grok Imagine

  • Ideogram V3 (Default, Quality, Turbo)

  • Qwen-Image, 2, 2 Pro

  • Seedream 4, 4.5, 5.0 Lite

  • Z-Image Turbo

  • HiDream I1 Dev

Wie gut ist die Qualität bei Recraft?

Recraft liefert insgesamt starke Ergebnisse – vor allem dann, wenn ein Bild wie ein gestaltetes Motiv wirken soll und nicht wie ein klassisches Stockfoto. Farben, Komposition und Details setzt das Modell meist kontrollierter um als viele einfache Chat-basierte Bildgeneratoren.

Entsprechend eignet sich Recraft besonders für Illustrationen und Designs, bei denen Gestaltung wichtiger ist als maximale fotografische Natürlichkeit.

Diese Bilder haben wir mit Recraft generiert.

Wie viel kostet Recraft?

Im vergleichsweise großzügigen Free-Tarif erhalten Sie 30 Credits pro Tag, was für etwa 15 bis 30 Bilder reicht. Auf Modelle von Drittanbietern haben Sie jedoch erst in den kostenpflichtigen Tarifen Zugriff.

Hier sind die Kosten pro Monat bei jährlicher Zahlung.

Tarif

Kosten pro Monat

Konditionen

Free

keine

  • 30 Credits pro Tag

  • öffentliche Bilder

  • nur Recraft-Modelle

  • keine kommerzielle Nutzung

Pro

10 USD

  • mindestens 1.000 Credits pro Monat

  • private Bilder

  • kommerzielle Nutzung erlaubt

  • 4K-Upscaling

Team

55 USD

  • 9.000 Credits pro Nutzer und Monat

  • private Bilder

  • kommerzielle Nutzung erlaubt

  • gemeinsamer Workspace mit zentraler Verwaltung

Wie gut ist Recraft für geschäftliche Zwecke?

Im kostenlosen Tarif liegen die Rechte an den erzeugten Bildern bei Recraft. Eine kommerzielle Nutzung ist nicht erlaubt. Erst mit einem kostenpflichtigen Tarif erhalten Sie volle Eigentums- und Nutzungsrechte an den generierten Bildern. Diese bleiben laut Recraft auch dann privat, wenn Ihr Abo später endet.

Wie erwartet eignet sich Recraft inhaltlich auch bei geschäftlichen Zwecken vor allem für Vektorgrafiken, Icons, Logos und Plakate, bei denen Gestaltung wichtiger ist als fotorealistische Darstellung.

Auch Text im Bild gehört zu den Stärken. Kurze bis mittlere Texte setzt das Modell zuverlässiger um als viele andere Bildgeneratoren:

Diese Grafiken haben wir mit Recraft generiert.

Was sind Vor- und Nachteile von Recraft?

  • Echte Vektorgrafiken statt nur Rasterbilder
    Recraft generiert nicht nur PNGs oder JPGs, sondern auch editierbare SVG-Dateien. Das ist für Logos, Icons, Illustrationen und Brand-Assets ein wichtiger Vorteil.

  • Viele KI-Modelle zur Auswahl
    Neben den eigenen Modellen können Sie auf zahlreiche Modelle anderer Anbieter zugreifen. So lassen sich unterschiedliche Stile und Qualitätsniveaus direkt vergleichen.

  • Gutes Zusammenspiel mit Design-Workflows
    Die Plattform kombiniert Generierung, Bearbeitung, Mockups, Vektorisierung und Export in einer Oberfläche. Das reduziert Wechsel zwischen verschiedenen Tools.

  • Gute Kontrolle über Stil und Marke
    Mit Referenzbildern, Farbpaletten und wiederverwendbaren Stilen behalten Sie die Kontrolle über visuelle Konsistenz. Damit eignet sich Recraft besonders gut für Kampagnen oder Serienformate.

  • Fotorealismus keine Stärke
    Recraft eignet sich gut für Designmotive, erreicht bei fotorealistischen Szenen aber nicht immer das Niveau spezialisierter Modelle.

  • Recraft behält Bildrechte im Gratis-Tarif
    Im kostenlosen Tarif bleiben die Rechte bei Recraft und die Bilder sind öffentlich. Für kommerzielle Projekte ist der Gratis-Tarif dadurch ungeeignet.

7.

Microsoft Bing Image Creator mit DALL-E und MAI-Image-1

  • Kostenlose Version: Ja, mit Microsoft-Konto

  • Kosten für Premium: keine, optional für Copilot Pro

  • Maximale Auflösung: 1.792 × 1.024 Pixel je nach Modell

Microsoft bietet mehrere Plattformen zur Bildgenerierung. Der einfach zu bedienende Bing Image Creator ist kostenfrei und verfügt über drei KI-Modelle. Sie wählen aus, welches Modell Ihre Bilder erzeugt. Für unseren Vergleich nutzen wir MAI-Image-1, das Microsoft im Oktober 2025 veröffentlicht hat.

Der Microsoft Bing Image Creator

Wie funktioniert der Bing Image Creator?

Sie melden sich mit einem Microsoft-Konto an. Danach geben Sie Ihren Prompt ein, wählen ein Modell aus, legen bei Bedarf das Seitenverhältnis fest und starten die Generierung. Bing zeigt je nach Modell entweder mehrere Varianten pro Durchlauf oder ein einzelnes Bild.

Bing Image Creator bietet drei Modelloptionen:

  • MAI-Image-1 (Microsoft)

  • DALL-E 3 (OpenAI)

  • GPT-4o (OpenAI)

Auffällig ist die klare Trennung zwischen Bildgenerierung und Bildbearbeitung. Wenn Sie ein Bild hochladen, um es zu verändern oder zu erweitern, übernimmt automatisch GPT-4o die Bearbeitung. In diesem Modus können Sie nicht zwischen DALL-E 3 oder MAI-Image-1 wählen.

Wie gut ist die Qualität beim Bing Image Creator?

Die Qualität fällt im Test gemischt aus. Über MAI-Image-1 entstehen brauchbare Bilder, allerdings setzt Bing Prompts nicht immer präzise um. Schon bei etwas komplexeren Motiven zeigt sich, dass einzelne Elemente anders interpretiert werden als beschrieben.

Das Bild mit dem Baumhaus gehört zu den stärkeren Ergebnissen. Stil, Beleuchtung und Umgebung wirken stimmig und entsprechen weitgehend der Beschreibung. Schwächer fällt hingegen das Bild mit den drei Fabelwesen aus.

Diese Bilder haben wir mit dem Bing Image Creator generiert.

Ein fotorealistisches Bild von John F. Kennedy lässt sich nicht erzeugen. Der Bing Image Creator blockiert entsprechende Prompts konsequent und gibt eine allgemeine Content-Warnung aus. Auch leicht veränderte Formulierungen führen nicht zum gewünschten Ergebnis.

Der Bing Image Creator weigert sich, Kennedy darzustellen.

Wie gut eignet sich Bing Image Creator für geschäftliche Zwecke?

Microsoft beansprucht kein Eigentum an Ihren Prompts oder Bildern. Gleichzeitig räumen Sie Microsoft eine Lizenz ein, Ihre Prompts sowie die erzeugten Bilder im Zusammenhang mit Microsofts Diensten zu nutzen. Exklusivität ist damit nicht garantiert.

Zudem kann Bing identische oder sehr ähnliche Bilder auch für andere Nutzer erzeugen. Eine Einzigartigkeit der Ergebnisse wird nicht zugesichert. Zusätzlich versieht Microsoft die Bilder mit einem sichtbaren Wasserzeichen und hinterlegt Herkunftsinformationen in den Metadaten (Content Credentials).

Mit Texten haben alle bei Microsoft angebotenen KI-Modelle Probleme:

Diese geschäftlichen Assets haben wir mit dem Bing Image Creator erstellt.

Wie viel kostet der Bing Image Creator?

Der Bildgenerator von Microsoft ist kostenlos. Er bietet Ihnen zwei Geschwindigkeiten:

  • 1.

    Fast Creation

  • 2.

    Standard Creation

Jeden Tag erhalten Sie 15 kostenlose Fast Creations. Danach erzeugt Bing weiterhin Bilder, reduziert aber die Geschwindigkeit (Standard Creation). Zusätzliche Fast Creations erhalten Sie optional beim Einlösen von Punkten über Microsoft Rewards.

Unabhängig davon gilt ein Tageslimit: Der Bing Image Creator akzeptiert bis zu 200 Prompts innerhalb von 24 Stunden. Jede Bildbearbeitung wird dabei ebenfalls als Prompt gezählt.

Was sind Vor- und Nachteile des Bing Image Creator?

  • Kostenlos nutzbar
    Der Bing Image Creator steht ohne Abo zur Verfügung. Sie können täglich mehrere Bilder erzeugen, ohne zusätzliche Kosten.

  • Mehrere KI-Modelle in einer Oberfläche
    Microsoft vereint verschiedene Bildgeneratoren in einem Tool. Sie können Ergebnisse vergleichen und je nach Bedarf das Modell wechseln.

  • Viele Bildformate auswählbar
    Sie können unterschiedliche Seitenverhältnisse wählen und Bilder direkt im passenden Format für Social Media, Präsentationen oder Websites erstellen.

  • Strenge Inhaltsfilter
    Microsoft blockiert bestimmte Motive konsequent. Die Plattform verhindert etwa die Generierung von Bildern realer Personen in bestimmten Kontexten.

  • Verwirrende Produktstruktur
    KI-Bildgenerierung ist bei Microsoft auf mehrere Dienste verteilt (Bing Image Creator, Copilot, Designer). Welche Plattform welche Funktionen bietet, ist nicht immer klar.

  • Bildbearbeitung nur mit einem Modell
    Für Bearbeitungen steht ausschließlich ein Modell zur Verfügung. Ein Wechsel zwischen den Modellen ist in diesem Modus nicht möglich.

  • Wenig Kontrolle und Einstellungen
    Im Vergleich zu spezialisierten Tools bietet Bing weniger Parameter. Sie steuern das Ergebnis hauptsächlich über den Prompt.

8.

Freepik: Umfangreicher KI-Modell-Agregator

  • Kostenlose Version: Ja, mit Einschränkungen

  • Kosten für Premium: ab 5 € pro Monat

  • Maximale Auflösung: 2.048 × 2.048 Pixel je nach Modell

Freepik ist ein KI-Modell-Agregator. Die Plattform bietet kein eigenes Modell an, sondern bündelt stattdessen rund 30 Modellversionen von Drittanbietern in einer Oberfläche. Neben Bildern können Sie bei Freepik auch Videos und Audio generieren.

Wie funktioniert Freepik?

Im Bildgenerator von Freepik geben Sie zunächst Ihren Prompt ein und erzeugen daraus erste Varianten. Anschließend können Sie das verwendete Modell jederzeit wechseln und so weitere Generatoren ausprobieren, wenn ein Ergebnis nicht überzeugt.

Ein paar Bearbeitungs- und Designfunktionen gibt es auch: Sie können Bilder hochskalieren, anpassen, Hintergründe ersetzen oder Inhalte in gemeinsamen Arbeitsbereichen organisieren. Im Video-und Audio- Bereich funktioniert die Plattform ähnlich.

Die Oberfläche von Freepik.

In den Bezahl-Tarifen bietet Freepik Zugriff auf eine große Auswahl an KI-Modellen von Drittanbietern:

  • GPT-Image-1.5, -1.0

  • Nano Banana, Pro, 2

  • Seedream 4, 4.5, 5 Lite

  • Flux 1 (Fast, Kontext Max, Kontext Pro)

  • Flux 2 (Pro, Max, Flex, Klein)

  • Google Imagen 3, 4, 4 Fast, 4 Ultra

  • Recraft V4 (Standard, Pro)

  • Runway

  • Z-Image

  • Reve

  • Qwen-Image

  • Grok Imagine

  • Mystic 2.5 Fluid

Wie gut ist die Qualität bei Freepik?

Die Bildqualität bei Freepik schwankt stark. Der Automodus, bei dem die Plattform selbst ein passendes Modell auswählt, hinterlässt keinen sonderlich guten Eindruck. Das hat uns ein bisschen überrascht, weil Freepik schließlich Zugriff auf viele leistungsfähige Modelle hat.

Das Baumhaus-Motiv ist ein gutes Beispiel: Der Prompt verlangt klar ein Baumhaus, das Ergebnis zeigt jedoch lediglich ein Haus im Wald. Auch beim Kennedy-Prompt setzt Freepik die Vorgabe nicht korrekt um und generiert statt des ehemaligen US-Präsidenten eine beliebige Person.

Besser gelungen sind der Roboter mit Stofftier sowie die drei Fabelwesen im Pixelstil. Hier wirken die Motive stimmig, die Stilvorgaben werden eingehalten und die Bildsprache bleibt konsistent:

Diese Bilder haben wir mit Freepik generiert.

Wie viel kostet Freepik?

Jeder Tarif enthält ein gemeinsames Credit-Kontingent für Bild-, Video- und Audiogenerierung. Die Credits bleiben bis zu ein Jahr gültig und werden nicht monatlich zurückgesetzt. Der Verbrauch hängt stark vom gewählten Modell ab und ist nicht immer nachvollziehbar.

Im kostenlosen Tarif erhalten Sie 20 Credits pro Tag, was je nach Modell für etwa 10 bis 20 Bilder reicht. Das Kontingent setzt sich täglich zurück.

Hier sind die Kosten pro Monat bei jährlicher Zahlung:

Tarif

Kosten pro Monat

Konditionen

Free

keine

  • 20 Credits pro Tag

  • begrenzter Zugriff auf KI-Modelle

Essential

5 €

  • 84.000 Credits pro Jahr

  • voller Zugriff auf Bild-, Video- und Audiomodelle

  • kommerzielle Lizenz

Premium

10 €

  • 216.000 Credits pro Jahr

  • voller Zugriff auf Bild-, Video- und Audiomodelle

  • zusätzlich Zugriff auf Premium-Stockmaterial

Premium+

22,50 €

  • 540.000 Credits pro Jahr

  • voller Zugriff auf Bild-, Video- und Audiomodelle

  • unbegrenzte Generierung bei ausgewählten Modellen

Pro

143,75 €

  • 3.600.000 Credits pro Jahr

  • voller Zugriff auf Bild-, Video- und Audiomodelle

  • unbegrenzte Generierung bei ausgewählten Modellen

Wie gut ist Freepik für geschäftliche Zwecke?

Laut den Usage Guides dürfen Sie die mit Freepik erstellten Bilder auch kommerziell verwenden, bearbeiten und monetarisieren. Nutzen Sie Freepik kostenlos, müssen Sie bei kommerzieller Verwendung jedoch „Designed by Freepik“ als Quelle angeben. Mit einem kostenpflichtigen Tarif entfällt diese Pflicht.

Die Textdarstellung funktioniert mal gut, mal weniger gut. Buchstaben sind teils verändert, ganze Wörter fehlen oder sind komplett falsch geschrieben. Manche Fehler fallen auch erst auf den zweiten Blick auf:

Diese Grafiken haben wir mit Freepik generiert.

Was sind Vor- und Nachteile von Freepik?

  • Große Auswahl an KI-Modellen
    Freepik bündelt rund 30 Modellvarianten verschiedener Anbieter. Sie können Ergebnisse einfach vergleichen und flexibel zwischen Modellen wechseln.

  • Plattform für mehrere KI-Formate
    Neben Bildern unterstützt Freepik auch Video- und Audiogenerierung. Alle Formate greifen auf dasselbe Credit-Kontingent zu. Die Plattform eignet sich so für ganz unterschiedliche Content-Formate.

  • Generierung und Design-Assets in einer Umgebung
    Freepik verbindet KI-Tools mit einer umfangreichen Bibliothek aus Bildern, Videos und Vektorgrafiken. Generierte Inhalte lassen sich direkt mit vorhandenen Assets kombinieren.

  • Unklare Modellverfügbarkeit
    Freepik macht teils widersprüchliche Angaben zur Verfügbarkeit einzelner Modelle. Es ist nicht immer sofort ersichtlich, welche Modelle im eigenen Tarif enthalten sind.

  • Tarife bündeln viele Funktionen
    Alle Tarife umfassen Bild-, Video- und Audiogenerierung. Wenn Sie nur Bilder erstellen möchten, zahlen Sie automatisch für Funktionen, die Sie möglicherweise nicht benötigen.

  • Credit-System könnte transparenter sein
    Der Verbrauch hängt stark vom gewählten Modell und Tool ab. Es ist daher schwierig abzuschätzen, wie viele Bilder ein bestimmtes Kontingent tatsächlich ermöglicht.

9.

Ideogram: Gut für KI-Bilder mit Texten

  • Kostenlose Version: Ja, mit wenigen Einschränkungen

  • Kosten für Premium: ab 15 USD pro Monat

  • Maximale Auflösung: 1.152 × 864 Pixel je nach Modell

Ideogram ist besonders dann interessant, wenn Ihre Bilder häufiger Text enthalten sollen. Das gilt für Poster, Social-Media-Grafiken, Anzeigenmotive oder einfache Präsentationsfolien.

Gleichzeitig sollten Sie bei den eigenen Modellen des Anbieters keine fehlerfreien Ergebnisse erwarten. Ideogram verändert weiterhin Wörter, Zahlen oder Schreibweisen, wenn Prompts komplexer werden.

Positiv fällt auf, dass die kostenlose Version im Vergleich zu anderen KI-Bildgeneratoren weniger stark eingeschränkt ist.

Wie funktioniert Ideogram?

Wenn Sie Ihren Account angelegt haben, nutzen Sie Ideogram direkt im Browser. Die Plattform bietet ein Prompt-Feld mit zusätzlichen Einstellungen für Modell, Bildanzahl, Render-Geschwindigkeit und Format.

Die Benutzeroberfläche von Ideogram.

Ideogram verwendet ein eigenes Bildmodell, das in mehreren Versionen verfügbar ist. Sie können zwischen Ideogram 3.0 (aktuell), 2a, 2.0 und 1.0 wählen. Zusätzlich gibt es einen Automatikmodus, bei dem die Plattform selbst entscheidet, welches Modell am besten passt.

Standardmäßig sind Ihre Generierungen öffentlich sichtbar. Einen privaten Modus gibt es erst ab dem Plus-Tarif. Auch beim Download gibt es Unterschiede: Im Gratis-Tarif laden Sie Bilder nur als komprimierte JPG-Dateien herunter, in den Bezahlplänen zusätzlich als PNG.

Wie gut ist die Qualität bei Ideogram?

Ideogram liefert bei stilisierten Motiven häufig gute Ergebnisse. Realistische Bilder sind möglich, erreichen aber nicht immer die Detailtiefe und Natürlichkeit spezialisierter Fotorealismus-Modelle. Das zeigt sich besonders bei Haut, Händen, feinen Strukturen und komplexen Gesichtszügen.

Das Baumhaus und die Fabelwesen hat Ideogram am besten getroffen. Der Roboter mit Stofftier wirkt hingegen eher starr – und John F. Kennedy hat es anscheinend nicht persönlich nach Berlin geschafft:

Diese Bilder haben wir mit Ideogram generiert.

Wie gut ist Ideogram für geschäftliche Zwecke?

Ideogram erlaubt die kommerzielle Nutzung der erzeugten Bilder. Der Anbieter beansprucht keine Eigentumsrechte am Output und schränkt die Nutzung grundsätzlich nicht ein. Eine Unterscheidung zwischen kostenfrei und kostenpflichtig erzeugten Bildern gibt es nicht.

Text im Bild, eigentlich eine Stärke von Ideogram, bleibt in der Praxis leider nicht fehlerfrei: Die Plattform setzt zwar kurze Begriffe oft sauber um, verändert aber bei längeren Texten weiterhin Buchstaben, Abstände oder Inhalte.

Für Logos, Preise, Produktnamen oder rechtlich relevante Hinweise sollten Sie Text daher immer prüfen und gegebenenfalls in einem separaten Layout-Tool nachbearbeiten.

Diese geschäftlichen Assets haben wir mit Ideogram erstellt.

Wie viel kostet Ideogram?

Im Free-Tarif können Sie täglich bis zu 12 Prompts in Bilder umwandeln. Die Generierung erfolgt dabei langsamer, und alle Bilder sind öffentlich sichtbar.

Darüber hinaus stehen drei kostenpflichtige Tarife zur Auswahl. Bei jährlicher Abrechnung ergeben sich folgende monatliche Preise:

Tarif

Kosten pro Monat

Konditionen

Free

keine

  • 12 Slow Credits pro Tag

  • nur öffentliche Generierung

  • eingeschränkter Canvas-Zugang

Plus

15 USD

  • 1.000 Priority Credits pro Monat

  • private Generierung möglich

  • unbegrenzte Slow Credits

Pro

42 USD

  • 3.500 Priority Credits pro Monat

  • private Generierung möglich

  • unbegrenzte Slow Credits

  • Batch-Generierung

Team

20 USD pro Nutzer

  • 1.500 Priority Credits pro Nutzer und Monat

  • private Generierung möglich

  • begrenzte Slow Credits

  • eigene Verwaltung und Abrechnung

Was sind Vor- und Nachteile von Ideogram?

  • Nützliche Gratis-Version
    Der Free-Tarif reicht aus, um das Modell unter realistischen Bedingungen zu testen. Sie arbeiten mit denselben Grundfunktionen wie in den Bezahlplänen, inklusive vieler Einstellmöglichkeiten.

  • Gut für Layouts und Poster
    Ideogram eignet sich besonders für Motive, bei denen Bild und Text zusammenspielen sollen. Für Poster, Social-Media-Grafiken oder Präsentationsfolien liefert das Modell oft schnell brauchbare Entwürfe.

  • Texte weiterhin fehleranfällig
    Ideogram erzeugt häufiger lesbaren Text als viele andere Modelle – aber immer noch nicht zuverlässig genug für finale Freigaben. Das betrifft vor allem längere Texte, Zahlen oder komplexe Typografie.

  • Fotorealismus nicht die stärkste Disziplin
    Ideogram kann realistische Motive erzeugen, erreicht bei schwierigen Szenen aber nicht immer die gewünschte Natürlichkeit.

  • Privater Modus kostenpflichtig
    Im Gratis-Tarif sind die erstellten Bilder öffentlich sichtbar. Für vertrauliche Inhalte benötigen Sie mindestens den Plus-Tarif.

10.

Stable Diffusion bei Dream Studio: Open Source und lokal installierbar

  • Kostenlose Version: Ja (lokal), eingeschränkt (im Web)

  • Kosten für Premium: ab 12 USD pro Monat

  • Maximale Auflösung: 1.216 × 832 Pixel (im Web)

Stable Diffusion von Stability AI unterscheidet sich von vielen anderen Bildgeneratoren. Das KI-Modell ist Open Source und kann kostenfrei lokal installiert werden. Sie können Bilder auf Ihrem Rechner ohne Cloud-Service generieren.

Stability AI betreibt mit DreamStudio zusätzlich eine Webplattform, die den Einstieg erleichtert. Dort ist die kostenfreie Variante aber sehr eingeschränkt.

Wie funktioniert Stable Diffusion?

Stable Diffusion lässt sich auf zwei Arten nutzen.

  • 1.

    Web-Version (z.B. DreamStudio)
    DreamStudio stellt eine einfache Oberfläche im Browser bereit. Sie geben einen Prompt ein, wählen das Modell sowie das Bildformat und starten die Generierung. DreamStudio erzeugt anschließend mehrere Bildvarianten, die Sie herunterladen oder weiter bearbeiten können.

  • 2.

    Lokale Installation
    Sie können Stable Diffusion auch direkt auf Ihrem eigenen Rechner ausführen. Dafür laden Sie ein Modell herunter und starten eine Oberfläche wie Automatic1111 oder ComfyUI. Diese Variante bietet deutlich mehr Kontrolle über die Bildgenerierung, erfordert jedoch eine leistungsfähige GPU und etwas technisches Verständnis.

DreamStudio ist ein Cloud-basierter Service für Stable Diffusion.

Wie gut ist die Qualität bei Stable Diffusion?

Die Qualität ist insgesamt hoch. DreamStudio erzeugt detailreiche Bilder und trifft Farbgebung sowie Stilrichtung meist zuverlässig. In einzelnen Fällen interpretiert Stable Diffusion Prompts jedoch nicht vollständig – Details fehlen oder werden verändert dargestellt.

Die Textdarstellung hat sich im Vergleich zu früheren Versionen verbessert. Kurze Wörter oder einfache Beschriftungen erscheinen häufiger korrekt im Bild. Längere Texte bleiben jedoch fehleranfällig („Ich bin ein Berler“).

DreamStudio hat jedes Bild standardmäßig viermal generiert. Hier sehen Sie jeweils die beste Version:

Diese Bilder haben wir mit Stable Diffusion bei DreamStudio generiert.

Wie gut ist Stable Diffusion für geschäftliche Zwecke?

Stable Diffusion eignet sich besonders dann, wenn Sie Wert auf Kontrolle, Datenschutz und Anpassbarkeit legen. Bei einer lokalen Installation bleiben Ihre Prompts und Bilder vollständig auf Ihrem eigenen System.

Die Lizenz hängt vom verwendeten Modell ab. SDXL steht unter einer Open-Rail-Lizenz, die eine kommerzielle Nutzung grundsätzlich erlaubt. Stable Diffusion 3.5 nutzt eine Community-Lizenz. Unternehmen mit mehr als 1.000.000 US-Dollar Jahresumsatz benötigen dafür eine separate Lizenz.

Bei Text in Bildern zeigt Stable Diffusion solide Ergebnisse – insbesondere bei einfachen Beschriftungen:

Diese geschäftlichen Assets haben wir mit Stable Diffusion erstellt.

Wie viel kostet Stable Diffusion?

DreamStudio arbeitet mit einem Credit-System im Rahmen eines monatlichen Abonnements. Die Anzahl der benötigten Credits hängt von Modell und Aktion ab. Eine Bildgenerierung verbraucht beispielsweise etwa 3 bis 6,5 Credits pro Bild. Funktionen wie Upscaling oder weitere Bildbearbeitung verbrauchen zusätzliche Credits.

Tarif

Kosten pro Monat

Credits pro Monat

Free Trial

kostenlos

100 Credits

Basic

12 USD

1.200 Credits

Plus

29 USD

2.900 Credits

Enterprise

individuell

individuell

Was sind Vor- und Nachteile von Stable Diffusion?

  • Volle Kontrolle bei lokaler Installation
    Bei lokaler Nutzung bestimmen Sie selbst, welche Modelle, Erweiterungen und Einstellungen Sie verwenden. Das ermöglicht deutlich mehr Anpassungen als bei geschlossenen Systemen.

  • Keine Nutzungslimits bei lokaler Nutzung
    Eine lokale Installation erzeugt Ihre Bilder ohne Credit-Verbrauch oder monatliche Limits durch den Anbieter. Die einzige Grenze ist die Leistung Ihrer eigenen Hardware.

  • Qualität schwankt stark
    Die Ergebnisse hängen stärker von den gewählten Parametern ab als bei vielen anderen Bildgeneratoren. Nicht jede Kombination liefert sofort gute Resultate.

  • Weniger Komfortfunktionen im Web
    Im Vergleich zu anderen Tools sind Workflows weniger automatisiert. Gerade in der Web-Version sind oft mehrere Anpassungen nötig, bis das gewünschte Ergebnis erreicht ist.

  • Kostenlose Web-Version stark eingeschränkt
    DreamStudio bietet zwar einen kostenlosen Einstieg, die enthaltenen Credits reichen jedoch nur für wenige Generierungen.

11.

Midjourney: Etwas aus der Zeit gefallen

  • Kostenlose Version: Nein

  • Kosten für Premium: ab 10 USD pro Monat

  • Maximale Auflösung: 2.912 × 1.632 Pixel nach Auto-Upscale

Midjourney ist ein Bild- und Videogenerator mit eigenem KI-Modell, der ausschließlich über ein kostenpflichtiges Abo verfügbar ist. Sie erzeugen Inhalte aus Textprompts, wählen passende Varianten aus und entwickeln Motive bei Bedarf über mehrere Schritte weiter.

Wie funktioniert Midjourney?

Sie erstellen Bilder entweder über die Website von Midjourney oder über das Chat-Tool Discord. In beiden Fällen benötigen Sie einen kostenpflichtigen Zugang.

Auf der Website geben Sie Ihren Prompt in das Eingabefeld ein, Midjourney erzeugt daraufhin mehrere Bildvarianten. Anschließend wählen Sie eine Variante aus und entwickeln sie weiter.

Die Weboberfläche von Midjourney.

Sie können Bilder vergrößern, Details anpassen oder neue Varianten auf Basis eines Motivs generieren. Anders als bei klassischen KI-Chat-Systemen gibt es jedoch keinen fortlaufenden Dialog – Midjourney reagiert immer nur auf den aktuellen Prompt.

Zusätzlich können Sie Referenzbilder hochladen. Midjourney übernimmt dann Merkmale aus diesen Vorlagen, etwa Stil, Farbgebung oder Motivstruktur. Das hilft, wenn mehrere Bilder visuell zusammenpassen sollen.

Alternativ nutzen Sie Midjourney über Discord. Dort steuern Sie die Generierung über den Midjourney-Bot. Der Ablauf ist inhaltlich identisch, die Bedienung jedoch weniger intuitiv.

Standardmäßig sind generierte Bilder immer öffentlich sichtbar. Wenn Sie Bilder privat erzeugen möchten, benötigen Sie einen Tarif mit Stealth-Modus oder arbeiten in einem entsprechend geschützten Bereich.

Wie gut ist die Qualität bei Midjourney?

Die Qualität fällt gemischt aus. Licht, Farben und Komposition wirken häufig stimmig. Besonders bei atmosphärischen Motiven, Illustrationen oder szenischen Darstellungen entstehen schnell visuell ansprechende Ergebnisse.

Midjourney setzt Prompts aber nicht immer vollständig um. Einzelne Bestandteile der Beschreibung ignoriert das Tool oder interpretiert es anders als vorgegeben. Das betrifft nicht nur Details, sondern teilweise zentrale Vorgaben.

Von einer fotorealistischen Darstellung des berühmten Kennedy-Auftritts in Berlin (erstes Bild) kann keine Rede sein. Die drei Fantasiewesen (drittes Bild) sind zudem nicht erkennbar:

Diese Bilder haben wir mit Midjourney generiert.

Midjourney eignet sich eher für Motive, bei denen Stil und Atmosphäre wichtiger sind als eine exakt kontrollierte Umsetzung. Wenn ein Bild sehr konkrete Anforderungen erfüllen muss, benötigen Sie oft mehrere Iterationen.

Wie gut eignet sich Midjourney für geschäftliche Zwecke?

Auch Midjourney räumt Ihnen – mit wenigen Ausnahmen – die vollen Rechte an den generierten Bildern ein. Dass Midjourney ein schlechteres Prompt-Verständnis aufweist, macht die Generierung von Bildern, die genau zum gewünschten Einsatzbereich passen, aber etwas schwieriger.

Exakter Text im Bild bleibt problematisch. Midjourney kann kurze Wörter darstellen, produziert jedoch weiterhin falsche Buchstaben, vertauschte Begriffe oder veränderte Inhalte.

Zahlen, Produktnamen oder rechtliche Hinweise sollten Sie deshalb immer prüfen und bei Bedarf außerhalb des Bildgenerators ergänzen.

Diese geschäftlichen Assets haben wir mit Midjourney erstellt.

Wie viel kostet Midjourney?

Midjourney arbeitet nicht mit festen Bildlimits, sondern mit GPU-Zeit. Diese beschreibt, wie lange die Server Rechenleistung für die Bildgenerierung bereitstellen.

Jeder Tarif enthält ein monatliches Kontingent an schneller GPU-Zeit („Fast Mode“). Sobald dieses Kontingent verbraucht ist, können Sie – je nach Tarif – weiterhin Bilder im langsameren „Relax Mode“ erzeugen.

Im Basic-Tarif steht ausschließlich schnelle GPU-Zeit zur Verfügung. Wenn das Kontingent aufgebraucht ist, können Sie keine neuen Bilder mehr generieren, bis der Monat zurückgesetzt wird oder Sie zusätzliche GPU-Zeit kaufen.

Ab dem Standard-Tarif ermöglicht Midjourney zusätzlich den Relax-Modus. In diesem Modus können Sie unbegrenzt Bilder generieren, müssen jedoch mit längeren Wartezeiten rechnen.

Hier sind die aktuellen Tarife von Midjourney:

Tarif

Kosten pro Monat

Fast GPU-Zeit pro Monat

Weitere Funktionen

Basic

10 USD

ca. 3,3 Stunden

alle Bilder öffentlich

Standard

30 USD

ca. 15 Stunden

zusätzlicher Relax-Modus

Pro

60 USD

ca. 30 Stunden

Relax-Modus und Stealth-Modus

Mega

120 USD

ca. 60 Stunden

mehr GPU-Zeit und Stealth-Modus

Was sind Vor- und Nachteile von Midjourney?

  • Starke Bildwirkung bei atmosphärischen Motiven
    Midjourney kann stimmige Bilder erzeugen. Bei Illustrationen oder szenischen Motiven entstehen schnell visuell überzeugende Ergebnisse.

  • Viele Varianten möglich
    Midjourney generiert mehrere Varianten eines Motivs und ermöglicht anschließend weitere Anpassungen. Sie können einzelne Versionen auswählen, vergrößern oder daraus neue Varianten entwickeln.

  • Prompts werden nicht vollständig umgesetzt
    In unserem Test hat Midjourney Teile der Beschreibung ignoriert oder uminterpretiert. Das betraf nicht nur kleine Details, sondern teilweise auch zentrale Anforderungen.

  • Fotorealismus nicht zuverlässig
    Mit fotorealistischen Darstellungen hatte Midjourney in unserem Test starke Probleme.

  • Textdarstellung bleibt fehleranfällig
    Midjourney produziert oft falsche Buchstaben, vertauschte Begriffe oder erfundene Inhalte.

  • Private Bildgenerierung kostet extra
    Standardmäßig sind alle Bilder öffentlich sichtbar. Für private Generierung benötigen Sie einen deutlich teureren Tarif mit Stealth-Modus.

12.

Leonardo.Ai: Große KI-Plattform mit schwachem Auto-Modus

  • Kostenlose Version: Ja, mit Einschränkungen

  • Kosten für Premium: ab 10 USD pro Monat

  • Maximale Auflösung: 1.536 × 1.536 Pixel je nach Modell

Leonardo.Ai ist eine umfangreiche KI-Plattform, die besonders viele Einstellungsmöglichkeiten bietet. Sie geben nicht nur einen Prompt ein, sondern wählen zusätzlich Modell, Format, Qualität und weitere Parameter. Die Plattform ist damit flexibler als einfache Chat-Bildgeneratoren – der Einstieg erfordert jedoch etwas mehr Einarbeitung.

Wie funktioniert Leonardo.Ai?

Wie bei anderen Plattformen geben Sie einen Prompt in die Weboberfläche ein, wählen ein Modell und starten die Generierung. Anschließend wählen Sie passende Varianten aus, bearbeiten diese weiter oder skalieren sie hoch. Alternativ können Sie Leonardo.Ai die Modellwahl automatisch überlassen.

Bei KI-Modellen Leonardo.Ai bietet eine große Auswahl.

Sie legen unter anderem Seitenverhältnis, Bildanzahl und Stilvorgaben fest und können Referenzbilder hochladen. In kostenpflichtigen Tarifen haben Sie zusätzlich die Möglichkeit, eigene Modelle und Stile zu trainieren.

Bereits in der kostenlosen Version zeigt sich ein zentraler Vorteil: die große Modellauswahl. Leonardo.Ai bündelt eigene Modelle sowie Modelle von Drittanbietern in einer Oberfläche. Zur Auswahl stehen unter anderem folgende Modelle von Drittanbietern:

  • Nano Banana, 2, Pro

  • Seedream 4.0, 4.5

  • GPT Image-1, 1.5

  • FLUX.1 Kontext (Dev, Schnell, Max), FLUX.2 Pro

  • Ideogram 3.0

Zusätzlich bietet Leonardo.Ai eigene Modelle:

  • Lucid Origin, Realism

  • Phoenix 0.9, 1.0

Wie gut ist die Qualität bei Leonardo.Ai?

Im Automatikmodus, bei dem die Plattform selbst das passende Modell auswählt, bleibt die Qualität hinter den Erwartungen zurück. Leonardo.Ai erzeugt zwar ansprechende Bilder mit stimmigen Farben und solidem Detailgrad, setzt Prompts jedoch nicht immer zuverlässig um.

Das zeigt sich beim Roboterbild, dem die Plattform zwei Schafe statt des geforderten Stofftiers an die Seite gestellt hat. Das gewünschte Baumhaus steht auf dem Boden. Fotorealistische Motive gehören im Automatikmodus ebenfalls nicht zu den Stärken. Gelungen sind dagegen die drei Fabelwesen im Pixelstil, bei denen Stil und Gesamtwirkung gut umgesetzt werden:

Diese Bilder haben wir mit Leonardo.ai generiert.

Wie gut ist Leonardo.Ai für geschäftliche Zwecke?

Die Nutzungsrechte unterscheiden sich je nach Tarif. In den kostenpflichtigen Plänen behalten Sie die Rechte an Ihren Bildern. Im kostenlosen Tarif sind Ihre Bilder öffentlich sichtbar, und Leonardo.Ai behält weitergehende Nutzungsrechte. Für vertrauliche oder exklusive Projekte ist der Free-Tarif daher nur eingeschränkt geeignet.

Für Business-Assets mit klaren Detailvorgaben arbeitet Leonardo.Ai zuverlässiger als viele andere Plattformen. Text im Bild ist aber auch hier nicht immer fehlerfrei:

Diese geschäftlichen Assets haben wir mit Leonardo.Ai erstellt.

Wie viel kostet Leonardo.Ai?

Die Bildgenerierung erfolgt über sogenannte Fast Tokens. Der Verbrauch hängt vom gewählten Modell, der Bildqualität und zusätzlichen Funktionen ab. Die 150 Fast Tokens pro Tag im kostenlosen Tarif reichen in der Praxis nur für wenige Bilder.

Sind die Tokens verbraucht, können Sie in kostenpflichtigen Tarifen weiterhin Bilder generieren – allerdings langsamer und mit eingeschränkter Modellauswahl. Jahresabos sind dabei günstiger als monatliche Zahlungen.

Tarif

Kosten pro Monat

Tokens

Free

keine

150 Fast Tokens pro Tag

Essential

12 USD

8.500 Fast Tokens pro Monat

Premium

30 USD

25.000 Fast Tokens pro Monat

Ultimate

60 USD

60.000 Fast Tokens pro Monat

Was sind Vor- und Nachteile von Leonardo.Ai?

  • Große Modellauswahl in einer Oberfläche
    Leonardo.Ai bündelt zahlreiche eigene und externe Modelle. Sie vergleichen verschiedene Ansätze direkt im selben Tool, ohne zwischen Plattformen wechseln zu müssen.

  • Viele Konfigurationsmöglichkeiten
    Die Plattform bietet deutlich mehr Einstellmöglichkeiten als einfache Bildgeneratoren. Sie können Parameter gezielt anpassen und den Output steuern.

  • Teils schwaches Prompt-Verständnis
    Im Test ignoriert Leonardo.Ai mehrfach wichtige Bestandteile von Prompts. Das betrifft sowohl Stilvorgaben als auch zentrale Motivelemente.

  • Kosten schwer planbar
    Der Tokenverbrauch hängt stark von Modell, Qualität und Zusatzfunktionen ab. Gerade für neue Nutzer lässt sich schwer einschätzen, wie lange ein Tarif ausreicht.

  • Gratis-Tokens schnell aufgebraucht
    Mit seinen Gratis-Tokens ist Leonardo.Ai weniger großzügig als andere Plattformen – vor allem, wenn Sie mehrere hochwertige Bilder erstellen möchten.

  • Rechte unterscheiden sich nach Tarif
    Im Gratis-Tarif sind Ihre Bilder öffentlich sichtbar und die Nutzungsrechte eingeschränkt. Für professionelle oder vertrauliche Projekte sind kostenpflichtige Tarife notwendig.

Was sollte man bei der Nutzung von KI-Bildgeneratoren beachten?

KI-Bildgeneratoren sind zweifelsohne beeindruckend – und sie werden immer besser. Sie sind bereits heute in der Lage, fotorealistische Bilder und komplexe Kunstwerke in verschiedensten Stilen zu erstellen, und werden zunehmend vielseitiger in der Anwendung.

Die innovativen KI-Tools haben damit das Potenzial, Design-Prozesse zu revolutionieren und ganze Branchen zu transformieren. Doch wie jede neue Technologie bergen sie auch Gefahren, sowohl technisch als auch gesellschaftlich.

Hier sind ein paar Aspekte, die Sie beachten sollten, wenn Sie KI-Bildgeneratoren nutzen:

  • Gute Ergebnisse erfordern gute Prompts
    Talent und Hirnschmalz machen auch bei der KI-Bildgenerierung einen Unterschied. Die Qualität und Relevanz der erzeugten Bilder hängen nämlich stark von der Qualität und Spezifität der eingegebenen Prompts ab. Schlechte oder unpräzise Prompts können zu unerwarteten oder irrelevanten Ergebnissen führen.

  • KI-Inhalte sind oft sofort erkennbar
    Auch wenn KI ihre Spuren immer besser versteckt – was neue Probleme verursacht –, lassen sich viele KI-Inhalte aktuell noch auf den ersten Blick erkennen. Sie haben oft einen ganz bestimmten, sterilen KI-Look, charakterisiert durch eine gewisse Glätte oder unnatürliche Perfektion.

  • Visuelle Unstimmigkeiten: 8 Finger, unmögliche Perspektiven
    Aber auch Imperfektionen können KI-Inhalte verraten. Oft sieht auf den ersten Blick alles gut aus – doch bei genauerem Hinsehen zeigt sich, dass Menschen drei Beine haben oder die Perspektive merkwürdig verzerrt ist.

  • Probleme mit Texten
    Es gibt KI-Textgeneratoren und KI-Bildgeneratoren – doch eine Kombination der beiden Elemente bekommt bisher niemand so richtig hin. Texte sind teils falsch platziert und haben Rechtschreibfehler oder sind komplettes Kauderwelsch.

  • Wie war das mit dem Urheberrecht?
    KI-generierte Bilder stellen uns vor neue urheberrechtliche Herausforderungen. Plattformen räumen Nutzern oft volle Rechte an generierten Bildern ein, doch weil sie häufig auf bestehenden Werken basieren, die die KI im Training „gesehen“ hat, bleiben viele Fragen offen.

  • Ethik und Verantwortung
    KI-Bilder werfen aber nicht nur rechtliche, sondern auch ethische Fragen auf. Die Fähigkeit, realistische Bilder von Personen ohne deren Zustimmung zu erstellen, ist etwa problematisch. Auch können diese Tools zur Erstellung von Desinformation oder manipulativen Inhalten missbraucht werden. Dazu kommt der Schaden, den sie auf dem Arbeitsmarkt anrichten können – beispielsweise, wenn Designer durch KI ersetzt werden.

KI-Bildgeneratoren sind also ein zweischneidiges Schwert. Wer sie nutzt, sollte sich ihrer Schwächen und Gefahren bewusst sein.

Eins ist aber klar: Die KI-Tools sind hier, ob wir das möchten oder nicht, und wie viele Maschinen und Automatisierungen werden sie unseren (Arbeits-)Alltag in der einen oder anderen Form verändern. Wer die Augen davor verschließt, riskiert, den Anschluss zu verlieren.

Fazit

Nicht nur KI-Inhalte überfluten das Internet – auch die Tools, die diese KI-Inhalte produzieren, schießen wie Pilze aus dem Boden. Was die Kosten, die Qualität der Inhalte, das Verständnis von Prompts und die Bearbeitungsmöglichkeiten angeht, gibt es zwischen den Programmen teils große Unterschiede.

Aktuell gehören Nano Banana 2, GPT Image 1.5 und FLUX.2 zu den besten Modellen. Googles Nano Banana 2 punktet mit starker Textdarstellung und hoher Geschwindigkeit, ChatGPTs Bildgenerator mit hervorragendem Prompt-Verständnis, FLUX.2 mit viel Kontrolle und hoher Bildqualität.

Wenn Sie viele KI-Modelle in einer Plattform nutzen möchten, finden Sie mit Adobe Firefly, und Recraft starke Plattformen.

Egal, für welches Programm Sie sich entscheiden: Verwenden Sie KI-Bildgeneratoren mit Bedacht – besonders, wenn es um kommerzielle Zwecke geht. Urheberrechtsfragen, ethische Bedenken, Fehlinterpretationen von Anweisungen: KI-Tools können eine große Hilfe sein, aber auch schnell großen Schaden anrichten. Gehen Sie also vorsichtig damit um.

KI kann heute nicht nur Bilder und Texte, sondern auch Apps erstellen. Wie das genau funktioniert, lesen Sie hier:

Simon Stich arbeitet als IT-Journalist und Webentwickler mit Schwerpunkt WordPress. Sein eigenes Unternehmen hat er 2009 gegründet. Nach mehreren Stationen im In- und Ausland lebt er heute in Freiburg im Breisgau.
Mehr zum Thema
Generative KI
KI-Bildgeneratoren
KI-Textgeneratoren
Weitere Sprachen