Stable Diffusion Titelbild

Bilderstellung mit Stable Diffusion – was kann die künstliche Intelligenz?

Wer Kunstwerke kreieren möchte, muss heutzutage nicht mehr selbst den Pinsel schwingen. Möglich macht es Stable Diffusion: eine künstliche Intelligenz, die Texteingaben in Bilder verwandelt. Bereits jetzt sind die Ergebnisse beeindruckend, und wenn es nach Chip-Hersteller Qualcomm geht, wird Stable Diffusion bald sogar auf dem Smartphone laufen.

Leider bringt die Medienrevolution auch Probleme mit sich: Kritiker warnen vor Missbrauch durch Fake-Bilder, Urheberrechtsverletzungen und der Entwertung menschlicher Arbeit. Ist Stable Diffusion am Ende also mehr Fluch als Segen? In diesem Artikel wagen wir ein Urteil.

Außerdem stellen wir Dir einige Apps vor, mit denen Du Stable Diffusion und andere Bildgeneratoren selbst ausprobieren kannst.

Stable Diffusion Beispiel

Wie funktioniert Stable Diffusion?

Stable Diffusion ist ein Text-zu-Bild-Generator, der auf dem Prinzip des Deep Learning beruht. Genauer gesagt wird eine künstliche Intelligenz darauf trainiert, Muster und Strukturen in vorhandenen Bild-Text-Paaren zu erkennen und zu rekonstruieren. Der verwendete Datensatz umfasst mehrere Millionen Bilder aus verschiedenen Quellen: darunter Pinterest, Flickr, DeviantArt oder Wikimedia.

Durch das Training ist die KI in der Lage, selbst Bilder zu generieren – und zwar mithilfe sog. Prompts. Dabei kann es sich um einzelne Wörter oder eine Reihe von Stichwörtern handeln. Ein Beispiel: Im ersten Schritt hat Stable Diffusion anhand unzähliger Fotos gelernt, wie eine Katze aussieht. Gibt der Nutzer also „Katze“ im Textfeld ein, erstellt die Software ein entsprechendes Bild.

Nun fängt die wahre Magie an: Mit Stable Diffusion lassen sich nämlich auch mehrere Prompts kombinieren: z. B. „Katze auf Baum“ oder „Katze bei Sonnenuntergang“. Die KI kopiert dafür Versatzstücke aus bereits vorhandenen Bildern und fügt diese zu einem neuen Ergebnis zusammen.

Eine weitere Möglichkeit stellen Bild-Prompts dar. Wenn Du beispielsweise ein eigenes Foto hochlädst, wird sich die künstliche Intelligenz bei der Bilderstellung daran orientieren.

Als wäre das noch nicht genug, ist Stable Diffusion in der Lage, verschiedene Kunststile zu imitieren. Unsere oben genannte Katze ließe sich so z. B. realistisch, als Cartoonfigur oder im abstrakten Look á la Salvador Dali erstellen.

Stable Diffusion – bald auch für das Smartphone?

Um Bilder mit Stable Diffusion zu generieren, ist eine enorme Rechenleistung nötig. Genauer gesagt brauchen Nutzer eine Grafikkarte mit mindestens 8 GB Arbeitsspeicher. Zwar gibt es Apps, die die Bilderstellung auch mit dem Smartphone ermöglichen. Diese laufen jedoch nicht auf dem Gerät selbst, sondern auf externen Servern, was gleich mehrere Nachteile mit sich bringt:

  • Stable Diffusion ist Open Source, und damit kostenlos. Für Apps, die diese Technologie nutzen, musst Du jedoch in den allermeisten Fällen bezahlen.
  • Je nach Auslastung des Servers kann die Bildbearbeitung eine Minute oder länger dauern.
  • Werden eigene Bilder an den Server geschickt, stellt sich die Frage nach dem Datenschutz.

Zum Glück ist bereits Hoffnung in Sicht – und diese kommt von Qualcomm. Im Februar 2023 gelang es dem Chip-Hersteller, Stable Diffusion erstmals auf einem Android Smartphone zum Laufen zu bringen.

Das Ergebnis siehst Du in diesem Video:

Im Testversuch sollte die KI eine „super-süße Katze in Ritterrüstung“ erstellen: realistisch, in 4K und im Stil der Unreal Engine. Dabei kann sich nicht nur das Ergebnis sehen lassen, sondern auch die Geschwindigkeit: In gerade einmal 14,42 Sekunden wurden die Prompts verarbeitet – ein echter Quantensprung im Vergleich zu aktuellen Bildgeneratoren. Diese benötigen für ein ähnliches Bild meist viermal so lang.

Das Video zeigt: Smartphone-Nutzer könnten ihre Bilder schon bald lokal erstellen, ohne auf externe Server zurückzugreifen. Das wäre nicht nur schneller, sondern auch günstiger. Wann es allerdings so weit ist, lässt sich aktuell nur schwer sagen; Fürs erste handelt es sich bei Qualcomms Test nur um eine Machbarkeitsstudie.

Dazu kommt: Trotz aller Optimierungen stellt Stable Diffusion nach wie vor hohe Anforderungen an die Hardware. Qualcomm etwa verwendete den hauseigenen Snapdragon 8 Gen 2: einen der schnellsten Smartphone-Chips auf dem Markt. Für viele Nutzer dürfte dies Grund genug sein, schon jetzt ein High End Phone á la Samsung Galaxy S23 oder Xiaomi 13 Pro zu kaufen.

Stable Diffusion Beispiel

Stable Diffusion – Alternativen für Dein Smartphone

Du möchtest nicht warten, bis Stable Diffusion für Smartphones zur Verfügung steht? Kein Problem! Bereits jetzt existieren zahlreiche Apps, mit denen Du die Bilderstellung selbst ausprobieren kannst. 5 der beliebtesten stellen wir Dir im Folgenden vor:

1. Starry AI

Ein äußerst populärer Bildgenerator für Smartphones ist Starry AI. Die Funktionsweise ähnelt dabei Stable Diffusion – das heißt, Du gibst im Textfeld Deine Prompts ein und lässt das Bild von der KI erstellen. Alternativ kannst Du auch Bilder als Prompts verwenden. 5 Kreationen am Tag sind mit der kostenlosen Version möglich. Für mehr benötigst Du die Premiumversion. Diese schaltet außerdem zusätzliche Kunststile frei und beschleunigt die Bilderstellung. 

Link: Starry AI für Android

Link: Starry AI für iOS

2. Wombo Dream

Ein weiteres Schwergewicht unter den Bildgeneratoren ist Wombo Dream. Diese App punktet nicht nur mit zahlreichen Kunststilen. Bilder lassen sich auch in unterschiedlichen Größen erstellen. Außerdem kannst Du ein Bild als Prompt hinzufügen und entscheiden, wie sehr sich die App bei der Bildgenerierung daran orientiert. Wombo Dream ist als kostenlose Version verfügbar – jedoch mit häufigen Werbeeinblendungen und Wasserzeichen auf den erstellten Kunstwerken.

Link: Wombo Dream für Android

Link: Wombo Dream für iOS

3. MidJourney

MidJourney ist streng genommen keine eigene App. Stattdessen läuft die Software über einen Discord-Server, sodass Du Dich dort registrieren musst. Die Funktionsweise bleibt gleich: Prompts eingeben, einige Zeit warten, schon spuckt der MidJourney-Bot das gewünschte Kunstwerk aus – und das in einer Qualität, die viele Konkurrenten übertrifft. Ebenfalls praktisch: Wenn Du mit dem Vorschaubild zufrieden bist, kannst Du es „upscalen“, also die Auflösung erhöhen. 25 Bilder sind in der Probeversion kostenlos. Jedoch steht diese nicht immer zur Verfügung.

Link: Midjourney

Link: Discord für Android

Link: Discord für iOS

4. AI Art Generator

Die meisten Bildgeneratoren verlangen ein kostenpflichtiges Abonnement: beispielsweise 200 Bilder für 10 Euro. Dass es auch anders geht, zeigt der AI Art Generator. Für einen einmaligen Betrag von etwa 6 Euro kannst Du so viele Bilder erstellen, wie Du möchtest. Damit handelt es sich um eine der günstigsten Bilder-Apps auf dem Markt. Der Haken: Um brauchbare Ergebnisse zu kreieren, benötigt die App genaue Texteingaben. Das macht eine Einarbeitung unumgänglich.

Link: AI Art Generator für Android

Link: AI Art Generator für iOS

5. Lensa

Möchtest Du Dich selbst in Szene setzen – beispielsweise als Astronaut, Superheld oder Cartoonfigur? Mit Lensa geht das super-einfach. Du musst lediglich 10–20 Fotos von Dir hochladen. Anschließend generiert die App künstlerische Avatare, die Du beispielsweise für Dein Facebook- oder Instagram-Profil verwenden kannst. Lensa nutzt Stable Diffusion und gehört mittlerweile zu den beliebtesten Bildgeneratoren überhaupt. Leider ist die App nicht kostenlos. Für ein Abo werden etwa 30–100 Euro im Jahr fällig. Dazu kommen Kosten für die Erstellung der Avatare.

Link: Lensa für Android

Link: Lensa für iOS

Stable Diffusion Beispiel

Kritik an Stable Diffusion

Sobald Stable Diffusion auf dem Smartphone nutzbar ist, dürfte die Beliebtheit dieser Software noch zunehmen. Doch nicht alle sind begeistert. Trotz der zahllosen Möglichkeiten gibt es Kritikpunkte an der Bilderstellung per KI:

Entwertung künstlerischer Arbeit

Stable Diffusion ist noch kein Jahr alt, doch bereits jetzt erstellt die KI-Software Bilder in beeindruckender Qualität. Da verwundert es kaum, dass viele Grafiker, Zeichner und Maler um ihren Job fürchten. Echte Menschen stellen zwar nach wie vor das „Rohmaterial“ bereit, mit dem Stable Diffusion trainiert wird. Sie könnten jedoch auf lange Sicht überflüssig werden – denn wer ist schon bereit, einen Grafiker zu bezahlen, wenn künstliche Intelligenz die Arbeit schneller und günstiger erledigt? Im schlimmsten Fall machen Stable Diffusion und Co. Kunst zur seelenlosen Massenware.

Wie bereits erwähnt, greift Stable Diffusion auf echte Kunstwerke zurück, um dazuzulernen. Doch scheinbar bleibt es nicht immer beim „Lernen“. Auch grobe Plagiate kommen vor – wie z. B. eine Klage von GettyImages zeigt. Laut dieser kopierte Stable Diffusion mehr als 12 Millionen Fotos, ohne deren Urheber um Erlaubnis zu fragen oder dafür zu bezahlen. Peinlicherweise wurden oft sogar die Wasserzeichen übernommen. Dazu kommen rechtliche Grauzonen: Liegt beispielsweise eine Urheberrechtsverletzung vor, wenn Stable Diffusion den Stil echter Maler übernimmt – und wem gehören die per KI erstellten Kreationen eigentlich? Diese Fragen dürften Gerichte für die nächsten Jahre beschäftigen.

Potenzial für Missbrauch

Die Verhaftung Donald Trumps, der Papst in Balenciaga-Jacke oder Emmanuel Macron als Müllmann – diese Beispiele zeigen: Deep Fakes werden nicht nur immer realistischer. Sie lassen sich per KI-Apps wie Stable Diffusion auch relativ einfach erstellen. Zukünftig könnte ein Smartphone genügen, um die sozialen Netzwerke mit Fake-Bildern zu überschwemmen. Fakt ist auch: Was für die einen ein harmloser Zeitvertreib ist, lässt sich ebenso für Diffamierung und politische Propaganda nutzen. Wie die Entwickler von Bildgeneratoren dies unterbinden wollen, bleibt unklar.

Einschränkung der Kunstfreiheit

Natürlich hat Stability AI das Missbrauch-Potenzial seiner Software längst erkannt. Um die sexualisierte Darstellung von Kindern zu unterbinden, entfernte das Unternehmen beispielsweise alle Nacktbilder aus der Trainingsdatenbank. Kritiker sehen darin einen Eingriff in die Kunstfreiheit. Schließlich stellt sich auch die Frage, wer in Zukunft die Hoheit über das Medium Bild haben wird: Künstler oder Programmierer, die die nötigen Werkzeuge bereitstellen.

Stable Diffusion: Fluch oder Segen?

An der Verbreitung von Stable Diffusion und Co. dürften die Kritikpunkte nichts ändern. Es bleibt jedoch abzuwarten, in welche Bahnen die KI gelenkt wird:

Auf der einen Seite könnte Stable Diffusion allen Menschen die Möglichkeit bieten, kreativ zu werden – unabhängig vom Talent oder den finanziellen Mitteln. Eine echte „Demokratisierung“ der Kunst scheint damit zum Greifen nah.

Auf der anderen Seite jedoch wird der Umgang mit dem Medium Bild wesentlich schwieriger: Wer hat ein Bild erstellt – Mensch oder Maschine? Wem gehört es? Zeigt es überhaupt die Wirklichkeit? Die Zeiten, in denen man Bildern bedingungslos vertrauen konnte, sind mit Stable Diffusion endgültig vorbei.