Unbekannte Weihnachtswelten ins Leben rufen

Nach dem recht arbeitsreichen und angestrengten Samstag gestern kam der Sonntag einem Ruhetag recht nahe. Und wieder haben mich motivisch Weihnachten und technisch die künstliche intelligente Bildgenerierung beschäftigt und herausgefordert. Das Thema und die Technik sind gleichermaßen gewöhnungsbedürftig wie spannend. Vor allem sind die Gestaltungs- und Erfindungsmöglichkeiten geradezu unbegrenzt. Es kommt dabei vor allem auf die ganz feinen Nuancen an. Deshalb sind diese Generierungen auch in der Regel mit ganzen Reihen von Variantengenerierungen durch denselben Prompt verbunden. Kleine Textänderungen können dann die Nuancen hervorbringen und so kann man sich dem eigentlich vorgestellten Ergebnis nähern. Heute war meine Motividee die ästhetische Weihnacht, wie ich es in den Titeln bezeichnet habe. Und da spielen neben hübschen Personen auch Weihnachtsbäume, Adventskränze, Weihnachtslichter und andere für die Ästhetik der Weihnachtszeit typische und bestimmende Symbole eine Rolle. Mit manchmal verblüffenden Ergebnissen, die tatsächlich unbekannte, aber denkbare Welten ins Leben rufen.

Weihnachtsäshtetik: Weihnachtsfrau in festlicher Kleidung vor Weihnachtsbaum

Bildquelle: Dieses Bild wurde mittels generativer KI erstellt.

Virtuelle Weihnachtserfindungen

Die Weihnachtsmotive, insbesondere eine atmosphärische weihnachtliche Szene mit der feierlichen kindlichen Betrachtung des Adventskranzes mit seinen brennenden Kerzen, hat mich auch heute wieder sehr beschäftigt und zu zahlreichen Variationen und Bearbeitungen angeregt. Ich bin inzwischen wirklich erstaunt über die Gestaltungsmöglichkeiten im Bereich der KI-Bildgenerierungen, weil mit viel Mühe und Differenzierung wirklich eindrucksvolle Ergebnisse möglich sind. In der nächsten Zeit werde ich insbesondere das Weihnachtsthema, auf jeden Fall enggeführt an den großen Weihnachtssymbolen, wie dem Weihnachtsbaum und dem Adventskranz, weiterverfolgen. Denn da kommen mir sehr viele Motive in den Sinn, die in realiter kaum umsetzbar sind und die virtuellen Möglichkeiten der KI insofern sinnvoll nutzen können, um überhaupt in Bilder umgesetzt werden zu können.

Weihnachtliche Kreationen im Hochsommer

Bei den generativen Bildkreationen, mit denen ich zurzeit experimentiere, sind die atmosphärischen Weihnachtsszenen heute am wichtigsten gewesen. Es hängt da von sehr vielen detaillierten Beschreibungselementen ab, ob ein wirklich überzeugendes Ergebnis zu erzielen ist. Aber ich habe festgestellt, dass die Beschreibungsdetails durchaus Sinn machen, anders als man vielerorts im Netz nachlesen kann. Teilweise ist es sogar möglich, technische Vorgaben wie Blende und Brennweite der Beschreibung beizufügen. Auch das wird bei den Ergebnissen berücksichtigt. Natürlich standen die weihnachtlichen Lichter und speziell die Hintergrundbeleuchtung durch den geschmückten Weihnachtsbaum bei den Bilderfindungen im Zentrum. Bei den heutigen Kreationen habe ich das mit der Darstellung eines kleinen Jungen kombiniert, der fasziniert die Kerzen eines Adventskranzes betrachtet. Mit dieser Serie bin ich noch nicht am Ende, ich denke, es lassen sich noch bessere Ergebnisse erzielen.

Generative Visualisierung einer Waldelfe

Das Thema der Bilderstellung mittels generativer KI beschäftigt mich derzeit sehr. Auch weil ich die Entwicklung in dem Bereich absolut faszinierend finde. Und wie gestern schon angedeutet, meine ich bei Kompositionen, die Menschen und insbesondere menschliche Porträts integrieren, die weitaus spannendsten Ergebnisse erzielen zu können. So u. a. in einer Reihe von Versuchen, eine Wald-Elfengestalt mit hyperrealistischen menschlichen Zügen zu erschaffen, die sich im Dunkelgrün des Walds sichtlich zuhause fühlt.

Eine mittels KI erzeugte fotografische Illustration einer Waldelfe

Bildquelle: Dieses Bild wurde mittels generativer KI über wirestock.io erstellt.

KI Bilder mit Menschen sind oft am überzeugendsten

Das Experimentieren mit dem Generieren von Bildern mittels KI und Sprachdefinition der Bildidee finde ich enorm spannend. Da hat man tatsächlich das Gefühl, dass sich eine neue Dimension von Möglichkeiten eröffnet, im bildnerischen Bereich kreativ zu arbeiten. Die Qualität und Individualität der Ergebnisse ist jetzt schon verblüffend. Und mein Lernen bezüglich der Kriterien, die bei der sprachlichen Definition des Bildwunsches einen Unterschied machen, ist schon weiter fortgeschritten. Ein großer Überraschungsfaktor ist dennoch dabei. Restriktionen sehe ich derzeit vor allem bei der Auflösung bzw. reinen Pixelgröße der ausgegebenen Formate. Die sind bei den erschwinglichen Angebote noch nicht so umwerfend. Aber es ist ja nicht ausgeschlossen, dass auch diesbezüglich das Spektrum der Gestaltungsansätze weiter wächst und auch komfortabler wird. Was ich bezüglich der Bildideen und Motivfelder aus der eigenen Erfahrung schon sagen kann: Bildkreationen, in denen Personen, insbesondere Porträts im Mittelpunkt stehen, führen meist zu den hochwertigsten und eindrucksvollsten Ergebnisse. Bei meinem früheren Lieblingsmotivfeld „Bäume“, überhaupt bei allem Natürlichen außerhalb der Menschengestalt, scheint es generell schwieriger zu sein, zu wirklich überzeugenden Ergebnisse zu gelangen. Oft sind bei diesen Motivfelder die Differenzierung und Raffinesse der Zeichnung und Modellierung nicht ganz so umwerfend, wie ich es häufig bei Menschenbildern feststelle.

Künstlich intelligent erzeugte Bilder nach aktuellem Entwicklungsstand

Mit KI basierter Technik erzeugtes Bild einer Baumscheibe

Mit dieser Baumscheibe habe ich erstmals ein ernstzunehmendes fotografisches Motiv mit generativer KI erstellt. Es lehnt sich gestalterisch an meine früheren Baumscheibenfotografien an, setzt bei den Jahresringen aber kontrastreichere Strukturen ein. So ganz bin ich in meiner Einschätzung der aktuellen Möglichkeiten künstlich intelligenter Bildverarbeitung noch nicht zu einem klaren Schluss gekommen. Verblüffend scheinen mir die Techniken immer nur im allerersten Augenblick zu sein, und in Bezug auf die oft in Windeseile erstellbaren Variationen der gleichen Bildidee. Aber im Ergebnis erfüllt die Technik nicht wirklich meine Qualitätsvorstellungen. Vor allem sind die entweder kostenfrei verfügbaren Ansätze oder die an eine Mitgliedschaft oder Kundschaft bei kommerziellen Anbietern, etwa im Bereich der Microstock-Agenturen, geknüpften Möglichkeiten sehr ungenau. Gerade die Kongruenz mit sprachlich definierten Vorgaben lässt oft zu wünschen übrig, selbst wenn man die Beschreibung sehr detailliert anlegt. Oft bleiben bestimmte Gestaltungswünsche einfach unberücksichtigt, selbst wenn sie explizit ausgesprochen und betont werden. Und oft ist die technische Umsetzung nicht dem entsprechend, was man von guten „echten“ Fotografien erwarten kann. Ich denke, die eigentliche Stärke wird sich bei KI basierter Bildverarbeitung erst dann zeigen, wenn sie in kommerzielle Bildbearbeitungssoftware als Funktion integriert ist. In Ansätzen, auf bestimmte Bearbeitungsfunktionen bezogen, findet man das ja auch schon. Wenn es aber möglich sein wird, eigene gute Fotografien durch KI noch perfekter oder raffinierter zu machen, als es mit „normaler“ Bildbearbeitung möglich ist, wird die Technik sicher auch für mich eine akzeptierte Rolle spielen können.

KI Modelle und Bildideen

Nicht alle, aber doch den größten Teil der avisierten Wochenendaufgaben konnte ich heute lösen. Obwohl nichts Spektakuläres darunter war, haben die vielen kleineren Einzelaufgaben doch den Tag restlos ausgefüllt. Immerhin bin ich am Abend noch dazu gekommen, ein mir bisher noch nicht bekanntes neueres KI Modell zu Bildgenerierung aus Texteingaben zu testen. Wie ich schon aus anderen ähnlichen Modellen heraus vermutet hatte, waren die ersten Experimente durchaus verblüffend. Im Detail hat sich aber auch an diesem Modell gezeigt, dass die kostenfreien Lösungen zahlreiche Haken mit sich bringen, von Wasserzeichen über niedrige Auflösung bis zu einer sehr eingeschränkten Funktionalität bzw. sehr eingeschränkten Optionen. Das Themenfeld und die Entwicklungen darin sind gerade in rasantem Tempo befindlich, aber eben deshalb ist es auch schwierig, einen Überblick zu gewinnen und das einzelne so richtig einzuordnen, gerade auf seinen Nutzen für die eigene kreative Arbeit hin. Immerhin hatte ich heute die Gelegenheit, ein KI generiertes Bild basierend auf einer textlich formulierten Bildidee mit meinem Lebensbaum, dem Baumkreis und gewissen gestalterischen Ideen als Vorgaben zu erzeugen. Das macht schon Lust auf weitere Experimente, v. a. darauf zu verfolgen, wie und wann sich die Technik einer wirklich kreatives Arbeiten nicht einschränkenden Lösung entwickelt.

KI, Bedeutungstiefe und ästhetische Vielfalt

Die neuen Möglichkeiten und Entwicklungen im Bereich der KI basierten Bildbearbeitung finde ich weit faszinierender als die künstlich intelligente Bearbeitung bzw. das Generieren von Texten. Zu letzterem habe ich gerade einen eigenen Text geschrieben und veröffentlicht, der sich mit den Chancen der Generierung von Grundlagentexten mit Softwareunterstützung beschäftigt, und zwar aus meiner eigener Erfahrung mit ganz und gar menschlich erlernter Textproduktion. Und meine Einschätzung fällt in dem Bereich ziemlich eindeutig aus: Der Primat erlebter und erfahrener Sprachverwendung zwischen Menschen kann mit KI Tools nicht aufgelöst werden. Das Auflösungsvermögen, die Zielgenauigkeit in Abhängigkeit von Situationen, Kontexten und den feinen Bedeutungsunterschieden kann künstlich erzeugter Textcontent niemals erreichen. Für wirklich professionelle Anwendungen können die Tools deshalb bestenfalls erste Orientierungshilfen bieten. Vielleicht können sie auch als Lernmittel im pädagogischen Umfeld eine Rolle entwickeln, sofern das gut reguliert wird. Aber die Entwicklungen und jetzt schon z. B. bei einigen Microstock-Agenturen integrierten Variationsoptionen mittels KI Tools, die Bilder automatisiert verarbeiten und ganz neue Bildsynthesen erstellen können, die scheinen mir schon heute eine wirkliche Spektrumserweiterung bereitzustellen. Nicht vorstellbar, diese Syntheseleistung mit normaler Bildbearbeitung, auch wenn man sie noch so gut beherrscht, auch nur annähernd zu erreichen. Der Fortschritt liegt vor allem in der sehr variablen Kombinierbarkeit unterschiedlicher Bildideen und in der visuellen Kreativität, die komplexe Be- und Verarbeitungsprozesse in Sekundenschnelle ausführt, mit z. T. wirklich neu anmutenden Bildergebnissen. Es können so Bilder entstehen, die als Synthese mit den Ursprungsbildern kaum noch etwas gemein haben, eine künstliche und in dem Fall tatsächlich künstlerische Leistung inklusive. Ich kann mir vorstellen, dass dadurch auch für die Kunst selbst neue Ausdrucks- und Darstellungsmöglichkeiten sich auftuen und perfektionieren werden. Und natürlich denke ich darüber nach, wie ich für meine Wunschbaum-Projekte KI Tools nutzen kann, nicht für die Textproduktionen, nein für die bildhafte Illustration der Baumsymbolik. Vor allem von technischer Seite aus will ich mich zunächst eingehender mit dieser Entwicklung auseinandersetzen. Um irgendwann einschätzen zu können, inwiefern Sinnbilder des natürlichen Lebens mit künstlicher Intelligenz in ihrer Bedeutungstiefe und ästhetischen Vielfalt erfasst, verarbeitet und dargestellt werden können.

Symbolvermittlung über elektronische Doppelgänger

Ich bin froh, dass ich wenigstens an den Sonntagen noch die Lektüre meiner jüngst erhaltenen neuen Textausgaben aus dem Werk Rudolf Steiners weiterverfolgen kann. Heute die Mitschriften zu Vorträgen aus dem Jahre 1917 zum „elektronischen Doppelgänger“. Der Titel ist eine moderne Adaption und gleichzeitig Interpretation des Themas, das natürlich so nicht zur Zeiten Steiners betitelt wurde und viel allgemeiner und grundsätzlicher aufgebaut ist. Aber es geht tatsächlich um eine Form der Konvergenz von Mensch und Maschine, die Steiner schon für über 100 Jahren für bestimmte Bereiche der Gesellschaft vorausgesagt hat. An das, was uns heute über elektronische Datenverarbeitung und vor allem internetbasierte Interaktion begegnet, konnte er aus seiner Zeit wahrscheinlich noch nicht in der Form denken. Aber dass aus diesen Entwicklungen einer Art partieller Auslagerung menschlicher Intelligenz auf externe Maschinen große soziale und moralische Probleme entstehen können, darauf hat er bereits hingewiesen. Ganz so pessimistisch, wie diese Entwicklungen damals erscheinen mussten, will ich es heute aber nicht einschätzen. Denn gerade meine Wunschbaum-Projekte sind ohne elektronische Vermittlung speziell über das Internet so nicht vorstellbar. Und auf diesem Wege transportiere ich eben Ideen, Gedanken und Formen, die dem Grundlegenden, wie es Rudolf Steiner seiner Anthroposophie zugrunde gelegt hat, durchaus Raum verschaffen, auf eine sehr moderne Art. So kann auch der „elektronische Doppelgänger“ dazu beitragen, symbolische Formen zur Grundlage themenorientierter Kommunikation zu machen und damit Menschen zu erreichen, die ich persönlich niemals kennenlernen könnte.