Thema der Woche #231: AI Revolution

Ich weiß nicht wie es euch so geht, in der Vergangenheit gab es immer schon mal großmundige Ankündigungen, das in einer App irgendeine AI werkelt um Ergebnisse zu verbessern oder die ToDo List besser zu verwalten, nach kurzer Versuchsphase hab ich die aber immer wieder abgeschaltet, weil ich keinen wirklichen Vorteil darin erkennen konnte. So ab ca. November hörte ich dann zum ersten Mal von MidJourney und Dall-E und dann ging es auch schon mit Chat GPT los. Natürlich habe ich gleich alles ausprobiert und stand, wie wahrscheinlich die meisten, mit einer Mischung aus Begeisterung und Beklemmung davor. Einerseits wahnsinnige Ergebnisse, gerade mal von Künstlern wie z.B. Guli Silberstein, aber auch ich als 0815 Novize konnte da schon beachtliches kreieren, ohne jegliche Vorkenntnisse, zumindest solange z.B. MidJourney noch über Discord kostenlos nutzbar war. Beklemmung kam aus den gleichen Gründen auf und weil die Missbrauchsgefahr so offen auf der Hand lag. Auf jeden Fall kommt da etwas sehr disruptives auf uns zu.

Einerseits ist das alles total faszinierend, teilweise auch von der Qualität her, andererseits kann man den Impact, den diese Entwicklung hat, besonders in dieser Geschwindigkeit, noch gar nicht abschätzen. Ich habe noch keine Entwicklung erlebt, die so schnell um sich griff und die Zukunft derart durchrütteln kann. Nichtmal Internet oder Smartphone haben so schnell und durchgreifend Wirkung erzeugt. Von daher wundert mich wie lapidar das von vielen noch gesehen wird. Wir reden hier von einem halben Jahr, seitdem das mehr oder weniger aus der Nerdecke in die Allgemeinheit vorgedrungen ist. Bislang fühlt sich das alles noch etwas an wie zu der Frühzeit des Internet, als man dieses noch nicht so ernst nahm und dachte, man überlässt diesen Spielplatz mal diesen komischen Nerds. Jetzt kommen die bekannten Reflexe, von „Das betrifft mich eh nicht“ bis zu „Das muß reguliert oder verboten werden“. Von ersterem würde ich nicht ausgehen, es sei denn man arbeitet in einem Handwerksberuf und auch da wäre ich mir meiner Sache nicht mehr so sicher. Der zweite Reflex ist zwar verständlich, schließlich kommen die meisten bis heute nichtmal mit Social Media klar, geschweige denn das die Medienkompetenz allgemein so ausgebildet ist, das sie die Fakenews dort von echten Meldungen unterscheiden könnte und die können zukünftig quasi maschinell und im Akkord erstellt werden, bzw. werden es ja schon und wenn sich schon staatliche Stellen darum bemühen Deepfakes zu legalisieren dann sollte es einen auch nicht wundern wenn andere aus ebenso unlauteren Gründen ebenso machen wollen.  Das die EU als Reflex mit dem weltersten Entwurf zur Regulierung um die Ecke kommt, hätte man sich ja denken können, das dabei ausgerechnet Open Source Software im Fokus stehen soll anstatt sie zu fördern ebenso, das dürfte uns in Europa bezüglich Digitalisierung noch weiter zurück werfen als es bislang schon der Fall ist und den großen Playern wie Google und Microsoft gut gefallen. Wird aber den Vorteilen dieser Technik nicht gerecht und dieser Versuch einiger Vertreter u.a. Elon Musk’s, die Entwicklung für 6 Monate zu stoppen, halte ich lediglich für einen fadenscheinigen Versuch, mit der Rückständigkeit der eigenen Schritte auf diesem Gebiet aufzuholen. Eine, wie auch immer geartete, Regulierung wird kommen, aber da hätte ich vorher schon gern eine gesellschaftliche Debatte, was, wie und vor allem international abgestimmt, sonst taugt das höchstens zum selber auf die Schulter klopfen.. Das sie reguliert werden muß steht außer Frage, wenn man bedenkt in bis zu welche Bereiche des Lebens AI demnächst Einzug halten wird und wie unvorbereitet das viele Menschen treffen wird. Momentan ist das wirklich noch wilder Westen, in dem versucht wird zu machen was halt geht und das in einem sich gegenseitig überbietendem Wettlauf, der sogar den Schöpfer dieser Technik oft übereilt erscheint. Aber auch was sich da alles mittlerweile dranhängt und mit halbgaren me too Produkten und komplett überteuerten Abos auf den Markt drängt, lässt das zuweilen durchaus wünschenswert erscheinen.
Das alles geht natürlich wieder einher mit gewaltigen Verwerfungen, Jobs wie z.B. Promptdesigner können momentan so viel verlangen wie sie wollen, nur wie lange diese Jobs Bestand haben, das weiß keiner und da es mittlerweile schon KI Promptdesigner gibt, oder Propmtlibrarys zunehmend schon in Apps integriert werden, würde ich nicht damit rechnen, diesen Job in 5 Jahren noch auszuüben. Es wird geschätzt das in den nächsten Jahren zwischen 80.000 bis zu 300.000.000 Jobs durch AI wegfallen werden, diesmal aber nicht im Bereich wo man es eh gewohnt ist, sondern das zieht sich von Banking über Management bis in die kreativen Bereiche, in denen man sich bislang noch recht sicher fühlte. Copywriter, Anlageberater bis zu CEOs dürften sich in den demnächst warm anziehen und stehen dann beim Jobcenter in der Reihe mit Kassieren und LKW Fahrern, denen die Automatisierung zum Verhängnis wurde. Vielleicht wird das ja auch mal der Moment, wo man mal inne hält. Man dachte ja mal das uns Roboter und Rechner die Arbeit irgendwann abnehmen auf das wir uns mehr den geistigen Dingen widmen können. Jetzt sieht es erstmal so aus, das die KI die Kunst macht und wir Menschen dafür noch mehr und länger arbeiten, anstatt mal zu überdenken ob dieses Konzept langfristig überhaupt noch Sinn macht. In der Euphorie sprechen zwar viele AI Evangelisten davon, das AI in den nächsten Jahren mehr Millionäre hervorbringen wird als je zuvor, ich befürchte allerdings, das es aufgrund der immer noch nötigen Rechenpower hauptsächlich die bereits Reichen noch reicher machen wird. Trotzdem denke ich, das wir die AI noch sehr brauchen werden, wenn ich mir die Komplexität der zukünftigen Aufgaben anschaue, die wir als Menschheit zu meistern haben.
Andererseits und wiederum, kann das eben auch zu Höhen führen, die nicht nur in noch größeren, händelbareren Komplexitäten erschöpft. Fast täglich kommen mir neue Apps, Anwendungen, Plugins und Webseiten unter, die alle irgendwas mit AI drin haben. Von Webseitenerstellung, bis Youtubezusammenfassungen, natürlich alles was mit Marketing zu tun hat, Contentwriting für Shoppingsysteme, Bildverbesserung, Text zu Musik, Text zu Bild, Text zu Video,, Bilder zu Video animieren, Taskmanagement, Speech to Text und mit Plagiatcheckprogrammen ob der Text von ChatGPT geschrieben wurde schließt sich dann der Kreis. Die Liste ist endlos und es wird täglich mehr, ich habe schon lange aufgegeben bei der Menge mithalten zu wollen.
Auch im Audiobereicht tut sich da fast expotentiell mehr, neben den bekannteren wie Riffusion oder dem angekündigten MusicLM sind mir nun den letzten Wochen unter anderem diese Anwendungen untergekommen: Magneta (wenn der Name mal nicht Ärger mit der Telekom gibt!) von Google, Aiva – Melodie Generator, Lemnonaid.ai -Midi Generator, Neutone, WAVTool DAW mit KI . Für den Mainstream Audio User mag das reichen, aber überzeugen kann mich da überraschenderweise noch nichts so richtig, was ich ein wenig verwunderlich finde, da auf anderen Gebieten wie z.B. Bildern oder Video durchaus schon Ergebnisse zu erzielen sind, die mit herkömmlichen Mitteln noch nicht möglich waren, da scheint mir Audio eine härtere Nuss zu knacken zu sein, zumindest wenn es über das hinausgehen soll, was man ohne AI schon kennt, die Tonqualität hinkt da noch sehr hinterher. Was mich auch wundert, das es im Gegensatz zu Video noch kein Tool zu geben scheint, das ein Arrangement zu erstellen vermag, die Schwachstelle vieler Produzenten und ich warte quasi täglich darauf, das z.B. ein M4L Device dafür am Horizont erscheint. Das einzige was mich faszinierte war bislang das bereits wieder eingestellte 24/7 Diffusion Radio, das, wie der Name schon sagt 24/7 neue Musik komponierte und dazu animierte Bilder generierte. Das war zwar weit weg von Chartmaterial, aber konnte durchaus mit experimentellen Releases mithalten, besonders interessant waren da die Ergebnisse, wenn z.B. von D&B auf Dubstep und dann auf Trap umgeschaltet wurde, da entstanden musikalische Zwitterwesen, die durchaus neues bargen.Beachtlich auch Adobe Podcast Enhance das mickrige Sprachaufnahmen via Laptop oder Smartphone Mic so aufbrezelt, das sie wie mit professionellem Equipment aufgenommen klingen.

Interessant dürften in der näheren Zukunft die ethnischen Fragen, besonders im kreativen Bereich, werden, die die neue Technik aufwirft und deren Beantwortung nicht so trivial sein wird. Wer ist der Schöpfer der Kunstwerke, derjenige der die Prompts an die AI gibt oder die AI? Was passiert mit dem Urheberrecht eines Werks, wenn kein Mensch mehr involviert ist, bzw. Wer ist da überhaupt der Urheber? Was darf eine AI zum lernen verwenden? Und wenn der Lernprozess so ähnlich wie beim Menschen abläuft, wieso taugt das menschlich gefilterte und umgesetzte als Eigenkreation und das von der AI nicht? Oder doch? Für GEMA und Co könnten das interessante Zeiten werden.
Die Angst, das AI Kunst ersetzt oder menschengemachte Kunst wertloser macht sehe ich bislang noch nicht und zwar nicht weil z.B: MidJourney bis heute noch nicht gut mit Händen umgehen oder Finger zählen kann, sondern weil ich bislang noch nicht gesehen habe das eine technische Innovation vorherige Kunst wertlos gemacht hätte. Die Fotografie hat die Malerei schließlich auch nicht beseitigt, die Schallplatte bedeutete nicht das Ende für Orchester oder Liveauftritte. Eher sehe ich AI als Chance für die Kunst des noch relativ jungen Jahrhundert seine erste eigene Ausprägung zu entwickeln, denn bislang glänzte es lediglich in der Neuverwurstung von bereits bestehendem mit aktuellen Mitteln. AI in den richtigen Händen ist ähnlich wie Synthesizer oder Sampler lediglich ein weiteres Tool mit dem man arbeiten wird. Der erste Rechner der einen Go Spieler schlug tat dies mit einem Zug auf den Menschen in tausend Jahren nicht gekommen sind, ähnlich kann sich das mit AI und Kunst oder Kreativität verhalten. Und wie das mit neuen, mächtigeren Techniken nunmal so ist, in den falschen Händen kann damit natürlich mehr Unfug denn je getrieben werden und erste Fälle werden bereits bekannt, so kann man den altbekannten Enkeltrick damit ungemein perfektionieren, man gebe der AI eine bekannte Stimme, die sie innerhalb von ein paar vorgelegten Sätzen relativ perfekt kopieren kann und lasse sie einen vorbereiteten Text oder ChatGPT Vorlage sprechen. Zudem lässt sie sich noch ziemlich leicht austricksen:   

Aber man sollte nicht vergessen, wir stehen da noch ziemlich sehr am Anfang der Geschichte, die Fehler über die man sich heute noch amüsiert werden ziemlich schnell ausgebügelt sein und jede Anfrage oder Korrektur lässt die AI expotential wachsen, im guten wie im schlechten, solange Als zentral und abschaltbar bleiben dürfte das händelbar sein, wenn AI aber internetähnlich dezentral funktioniert und sich daher nicht so leicht wieder einfangen und abschalten lässt, könnten wir ein HAL9000 Problem bekommen. Ob wir dem gewachsen sind, werden wir ja sehen.

8 thoughts on “Thema der Woche #231: AI Revolution”

Bodo sagt:

Mai 3, 2023 um 1:13 pm Uhr

Verrückt, das ist genau mein Gedankengang, warum hat sich noch keine KI auf die Arrangements gestürzt. Sounderzeugung per KI schön und gut, aber wie du schon sagst ist alles noch wie die erste DallE Bilder und außerdem macht das doch gerade in einer Produktion am meisten Laune. Sich im endlosen 4er oder 8er Loop Soundspuren zusammenzubasteln.

Ich finde arrangieren ist die Pflicht nach der Kür, und grade bei den Pflichten soll die KI doch gut sein. Ich beobachte tatsächlich auch schon die ganze Zeit die Branche und warte auf ein Tool.

PS. Hab mal chatGPT gefragt, wie man so eine Anwendung am besten erstellen könnte, ist nicht so ’ne große Sache, vor allem, weil man die KI mit endlosen MIDI Files trainieren könnte (die arme). Also je nach Umfang der Entwicklung schätzt GPT die Kosten dafür zwischen 1.000 und 100.000 $ – kleine Fundraising Kampagne vielleicht?

Antworten
1. Tanith sagt:
  
  Mai 3, 2023 um 8:44 pm Uhr
  
  ich stell mir das nicht so trivial vor, Midifiles schön und gut, aber die App müßte ja mithören können was da passiert, welche Instrumente da zusammenspielen etc. klingt nicht unmöglich aber dürfte ne komplexe Angelegenheit werden
  
  Antworten
zaziki sagt:

Mai 3, 2023 um 1:18 pm Uhr

Solange KI nicht in essentielle Bereiche eingreifen kann, wie z.B. der Wasser- oder Energieversorgung oder anderen systemrelevanten Dingen, sehe ich das (im Moment noch) ziemlich entspannt. Es wäre halt nur fair wenn man KI-genereierte Werke als solche kenntlich machen würde, etwa mit einem digitalen Wasserzeichen oder einem vorherigen Hinweis. Dann weiß man woran man ist und kann entscheiden, ob man mit einer KI oder doch lieber mit einem echten Menschen zusamenarbeiten will bzw. die Inhalte akzeptieren möchte.

Antworten
1. Tanith sagt:
  
  Mai 3, 2023 um 8:48 pm Uhr
  
  gerade in der Energieversorgung (Verteilung) sehe ich eine Zukunft von KI. Eine Kenntlichmachung wird vermutlich der erste Punkt einer kommenden Regulierung, aber erfahrungsgemäß halten sich niedere Absichten ja eher selten daran. Es gibt aber durchaus schon Apps, die KI generierte Inhalte (noch?) erkennen können. Für den ganzen Bildungssektor wird das noch ne harte Nuss
  
  Antworten
chris sagt:

Mai 4, 2023 um 10:48 am Uhr

Super zusammengefasst, die aktuelle Situation!
Zu mehr sozialer Gerechtigkeit wird das alles nicht automatisch führen. Man müsste sie sich erkämpfen. Und falls doch die HAL9000-Situation eintritt: „Wir leben immer noch in einer Faxrepublik. Wir leben in Analogistan.“ (Sonja Álvarez) – wir werden Neuland-Angela und Stoppschild-Ursula vielleicht noch dankbar sein.

Antworten
Christof Damian sagt:

Mai 5, 2023 um 12:04 pm Uhr

Hervorragender Post.
Ich denke das ChatGPT definitiv noch im Beta Stadium ist, aber wie du richtig sagst, es ist auch noch sehr neu.

Für mich habe ich ChatGPT als Bullshit Generator entdeckt. Alle die Texte, die ohnehin niemand liest, kann man exzellent von der „AI“ erzeugen lassen: Coverletter, Zusammenfassungen, Bewertungen …

Und da sehe ich auch eine interessante Zukunft. Denn eines Tages weiß auch jeder, dass der Mist generiert ist und wird ihn auch nicht mehr lesen. Vielleicht ist es nur eine AI, die Job-Beschreibungen schreibt, die dann eine andere liest, mit einem Lebenslauf abgleicht und die Bewerbung schreibt, welche wiederum von einer anderen AI gelesen wird.
Und dann kümmert sich niemand mehr darum, etwas zu lesen.

Antworten
1. Tanith sagt:
  
  Mai 11, 2023 um 11:03 pm Uhr
  
  ja, die Waschzettelschreiber für Plattenreleases dürften finsteren Zeiten entgegen blicken ?
  
  Antworten
JOIX sagt:

Mai 9, 2023 um 7:23 pm Uhr

Hier noch ein guter Kommentar zu Mucke & KI: https://youtu.be/-eAQOhDNLt4
Das Distributoren wie Spotify irgendwann auch eigene AI-Artists antreten lassen, könnte ich mir auch gut vorstellen!

Antworten

Schreibe einen Kommentar Antworten abbrechen

This site uses Akismet to reduce spam. Learn how your comment data is processed.