AI: Die neue Welt der Inhalte in unserer Hand

Was wäre, wenn Dein nächstes Kunstwerk Dir innerhalb von zwei Minuten gelingt und Dir in digitalen Marktplätzen mehrere tausend Euro einbringt? Was wäre, wenn ein einfaches Chat-Tool Deine Schreibblockade überwindet und Dir somit einen Journalistenpreis einbringt?

Alles von dem erscheint möglicher denn je. Ende 2022 wurden Dienste, die künstliche Intelligenz (oder AI, „Artificial Intelligence“) zur Erstellung von Content nutzen, der breiten Öffentlichkeit bekannt. Speziell hierzulande sind ChatGPT zur Texterstellung und die App „Lensa“ (App Store / Play Store), die mittels AI eigene Profilbilder erstellt, zu nennen. Etwas spezialisierter, aber umso mächtiger, ist Midjourney, das über einen Discord-Channel als Beta-Version zur Bilderstellung verwendet werden kann.

Beispiele für AI-erstellte Inhalte

Die Hürde zum Einstieg ist niedrig

Das Prinzip ist simpel: In allen hier genannten Diensten kann jeder mit natursprachlichen Eingaben (oder im Fall von „Lensa“ mit Bildern) die AI füttern und so relativ schnell Texte und Bilder erstellen. Mit jeder Eingabe lernt die AI dazu, was dazu führt, dass die Ergebnisse immer besser werden. Der Vorstellungskraft sind keine Grenzen gesetzt, wie etwa der folgende Tweet zeigt.

Berlin 2060, erdacht von Sven Weizenegger (Twitter).

So weit, so gut. Es hilft, sich einige Inspirationen für Texte und Bilder zu holen. Richtigerweise macht Jürgen Brautmeier den Einwurf, dass es keinesfalls das menschliche Denken und Urteilsvermögen ersetzen soll („Sapere aude!“ rief Immanuel Kant immerhin schon 1784 aus), und dass der Nutzung aus Risiken zugrunde liegen. Wie das im Extremfall aussehen kann, hat der Contentproduzent Kyle Vorbach aufgezeigt. Er nutzte die Stable Diffusion AI und trainierte diese, um mit Bildern seinen Freunden einen Monat lang einen Jobwechsel samt Umzug and die Westküste der USA und viele Erlebnisse währenddessen vorzugaukeln. (Schaut euch den Clip unbedingt an, sehr witzig erzählt!)

Vernetzte AI für mehr Relevanz in Werbung?

Spinnen wir das ein wenig weiter: Was wäre, wenn etwa digitale Werbeschaltung voll automatisiert und gleichermaßen hoch individuell zugeschnitten einem einzelnen Nutzer gezeigt wird, etwa in Instagram oder TikTok? Durch die Anmeldung und Nutzung liegen bereits Nutzer- und Verhaltensdaten vor, da „dankenswerterweise“ den AGB bei der Anmeldung zugestimmt wurde. Nehmen wir gerne noch einen Wetter-Vorhersagedienst wie den von IBM dazu, um wetterabhängige Produktplatzierungen zu ermöglichen — schließlich haben wir uns kürzlich in einer Story über das nasse Wetter beschwert, weswegen uns nun — einen Tap entfernt — die neue Outdoorjacke im Feed anlächelt. Es würde mich wundern, wenn es noch Zukunftsmusik wäre. Sicher arbeiten die ersten großen Marken schon längst daran.

Digitale Werbemittel und Konzepte sind schnell erstellt

Auch im Bereich des User Interfaces (UI, also Grafik- und Bedienkonzepte für Websites, Apps und vieles mehr) kann Midjourney eine Inspiration sein. In diesem Twitter-Thread zeigt Davis Taylor Brown, Product Designer bei Adobe, welche vielfältigen Designs die AI-Software jetzt schon erstellen kann und welche Prompts dabei geholfen haben. Natürlich ist da der Weg bis zu fertigen Interaktionskonzepten oder „nur“ Prototypen noch weit. Die Frage ist nur, wie weit es weg ist.

AI in Video und Metaverse

Video fehlt noch in diesem Mix der Erstellung mittels AI. Denn im europäischen Raum etwa müssen 24 Bilder in einer passenden Abfolge für eine Sekunde generiert und zusammengefügt werden — das macht 1.440 Bilder für einen 60sekündigen Clip. Das ist derzeit schon „per Hand“ möglich, wie dieses Video von Thoughtverse (YouTube Shorts, siehe Screenshot) zeigt: Die weitere (und ehrlich gesagt sehr dystopische) Vision der künstlichen Intelligenz zur weiteren Evolution des Homo Sapiens. Videoskripte dagegen sind jetzt schon ohne weiteres möglich (Link zu Twitter / Video).

Treiben wir es auf die Spitze, dann werden AI-generierte Inhalte unsere Mixed-Reality-Erlebnisse der Zukunft, etwa im Metaverse (zu dem ich Anfang 2022 einen Gastbeitrag auf Horizont veröffentlicht habe), auf eine gänzlich neue Ebene heben.

Risiken sind durchaus vorhanden

Risiken und Nebenwirkungen sind nicht ausgeschlossen und müssen in der weiteren Entwicklung unbedingt beachtet werden. Denn davon gibt es reichlich.

Fehlerhaftes Training

Schon 2016 machte Microsoft etwa seine Versuche mit AI, in dem mit „Tay“ ein Twitter-Bot ins Leben gerufen wurde — und binnen eines Tages abgeschaltet wurde. Denn im Dialog mit anderen Twitterern lernte die AI, sich zunehmend rassistisch zu äußern. Selbst heute scheitert ChatGPT an Rechenaufgaben.

AI und Studium

Auch im akademischen Bereich gibt es Diskussionsbedarf, wie etwa hier auf Twitter. Können Studierende künftig so ihre Hausarbeiten und Referate schreiben? Wie sieht es mit Referenzen aus? Was bedeutet es für Leistungsanforderungen — werden Prüfungen in Präsenz nun wichtiger, um den Leistungsstand eines Studierenden adäquat erfassen zu können?

Ressourcenverbrauch

Worauf ich schon beim Thema „Metaverse“ hingewiesen habe und was weiterhin Hauptkritikpunkt bei der Erstellung von „Non-Fungible Tokens“ (NFT) ist: Der Ressourcenverbrauch. Für die reine Bilderstellung mittels Stable Diffusion und Dreambooth (GitHub) wird ein starker Rechner benötigt. Die Hauptlast trägt dabei eine Grafikkarte, die mindestens 8 Gigabyte, besser 12 Gigabyte Speicher mitbringen muss. Neben dem Kostenpunkt ab 400 Euro aufwärts (excl. dem übrigen System samt Speicherplatz) kann die Leistungsaufnahme im Spitzenbereich über 300 Watt betragen, was im rechenintensiven Dauerbetrieb nicht unbeachtet bleiben soll. Dazu rechnet der Twitterer und ehemalige Google-Mitarbeiter „Deedy“ vor, dass eine ChatGPT-Anfrage 3 US-Cent kostet, hochgerechnet auf etwa 1 bis 3 Millionen US$ pro Monat.

Die Zukunft der Arbeit

Das Thema „Digitalisierung und Automation“ begleitet uns eigentlich schon seit den 90er Jahren, als das Internet massenkompatibel wurde und neuere, bessere Technologien auf den Markt kamen — 3D-Druck sei als Beispiel genannt. Gerade in Deutschland wird, manchmal mit einem subtil-panischen Unterton, aufgelistet, welche Jobs demnächst der Axt zum Opfer fallen, etwa bei der WirtschaftsWoche. Vor diesem Hintergrund stellt der niederländische Historiker Rutger Bregman in seinem Buch „Utopien für Realisten“ (2017) wichtige Fragen. Etwa, was wir mit der Freizeit, die wir Dank weniger Arbeit (die nun die AI übernimmt, siehe die vorangegangenen Beispiele) nun haben, überhaupt machen wollen. Oder, viel wichtiger, was wir unseren Kindern beibringen wollen, damit sie in der Welt von morgen ihren Platz finden. Wenn wir versuchen zu erahnen, welche Fähigkeiten sie dafür benötigen (als Beispiel diene das World Economic Forum), würde dies laut Bergman nur dazu führen, dass wir beim Versuch, mit den Maschinen mitzuhalten, nur auf der Strecke bleiben können. Vielmehr wären laut Bregman Werte und Haltung wichtig, oder auch „Mindset“, wie man auf Neudeutsch sagt.

Mensch und Technologie als Risiko

Und, zu guter Letzt: Das Thema „Mensch und Technologie“. Brautmeier warnt zurecht, dass die gedankliche Leistung heute noch weiter das Maß aller Dinge ist. Allen digitalen Helfern zum Trotz ist es erforderlich, sich mit den erstellten Inhalten auseinanderzusetzen und auch seine kreative Persönlichkeit einzubringen. Denn sonst laufen wir Gefahr, dass auf kurz oder lang Text- und Bildwerke sehr einheitlich aussehen und sämtliche persönliche Merkmale, die entstehen, wenn wir kreativ sind, nicht mehr vorhanden sind. Überspitzt auf eine künftige Mixed Reality würden wir alle zwar in einer individualisierten, aber doch irgendwie nach Einheitsbrei aussehenden Welt wandeln. Speziell dann, wenn bewusst mißbräuchlich trainierte AI uns nach und nach in eine dystopische, xenophobe Realität zieht. Das kann niemand wollen.

Übrigens: Das Titelbild ist bei Midjourney (v4) entstanden. Ich wollte eine Frau darstellen, die in der Stadt Köln der Zukunft vor einem futuristischem Gebäude sitzt und mittels einer Mixed-Reality-Brille mit ihrem Mann spricht. Recht gelungen, finde ich, auch wenn das theoretisch jede Großstadt sein könnte 😉 Der Prompt dazu war:

/imagine dystopia, woman wearing augmented reality glasses, futuristic, Cologne, resident, digital billboards, woman viewing hologram of husband, augmented reality, apartment building, smart home features, automated lighting, temperature control, personal transportation device, hoverbike, self-driving car, futuristic building in background, rooftop garden, beggar sitting in front of building, ultra realistic, 4k resolution, --v 4 --ar 3:2