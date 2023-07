Gemeinnützige Organisation für Künstliche Intelligenz : Jülicher Forscher wollen KI zum Allgemeingut machen

„Dass wir von einem Asteroiden getroffen werden ist wahrscheinlicher, als dass die KI das Ende der Menschheit bedeutet", ist Wissenschaftler Jenia Jitsev überzeugt. Das Bild wurde mit dem Bild-Generator Stable Diffusion erstellt, der auf dem Datensatz der Jülicher Forscher beruht. Foto: Laion/Stable Diffusion

Interview Jülich Zwei Jülicher Forscher waren es leid, dass die großen Sprünge im Feld der Künstlichen Intelligenz den großen Hightech-Firmen vorenthalten sind. Ihre Vision: frei zugängliche Datensätze für die Entwicklung unabhängiger KI-Modelle, mit denen und an denen Wissenschaftler aus aller Welt arbeiten können.

„Die KI-Revolution findet größtenteils hinter verschlossenen Türen statt“, prangern zwei Jülicher Wissenschaftler an. Und entwickeln auf eigene Faust eine Grundlage für frei zugängliche, unabhängige Künstliche-Intelligenz-Modelle. Mit Supercomputer Juwels haben Jenia Jitsev und sein Kollege Mehdi Cherti am Jülich Supercomputing Center des Forschungszentrums Jülich eine gute Grundlage für ihre gemeinnützige, spendenfinanzierte Initiative „Laion“, an der mittlerweile mehr als 30 Profi- und Hobby-Wissenschaftler aus der ganzen Welt mitarbeiten. Im Interview mit unserer Zeitung spricht Jenia Jitsev darüber, warum auch Juwels für die großen Ambitionen von Laion zu klein ist, und bezeichnet die zuletzt beschworene Bedrohung der Menschheit durch KI als Schwarzmalerei.

Herr Jitsev, Sie betonen selbst, dass es für maschinelles Lernen enorme Rechenressourcen und große Datenmengen braucht. Wie haben Sie es geschafft, ein eigenes KI-Modell auf die Beine zu stellen?

Jenia Jitsev: Letztlich wurde es möglich, weil eine Gruppe von sehr fähigen Menschen zusammenkam. Viele Menschen von Forschungslaboren, neben Jülich etwa in Washington. Aber auch ein Lehrer an einer weiterführenden Schule, war sehr interessiert daran, die außergewöhnlichen Möglichkeiten des Maschinenlernens zu untersuchen. Vor fünf Jahren hätte niemand erwartet, dass wir heute so weit sind. Nur Algorithmen von einer bestimmten Größenordnung haben eine starke Funktionalität. Um diese Größenordnung zu erreichen, braucht man Unmengen von Daten. Und die zu generieren können sich vor allem große Unternehmen leisten, die ihr KI hinter verschlossenen Türen entwickeln. Das war oder ist ja sogar für große, wissenschaftliche Organisationen wie das Max-Planck- oder das Helmholtz-Institut nur eingeschränkt möglich. Die großen Firmen wie Google und Facebook sammelten also ihre Datensätze, ohne sie für die Wissenschaft zugänglich zu machen. Mein Kollege Mehdi Cherti und ich waren aber sehr interessiert an der Forschung zu diesem Thema und haben letztlich eine „kritische Masse“ von Menschen und Fähigkeiten schaffen können.

Wer ist noch im „Laion“-Team dabei? Noch mehr Leute ohne spezifischen wissenschaftlichen Hintergrund?

Jitsev: Ja, viele aus weiterführenden Schulen. Interessante Anekdote: Eine der Schlüsselfiguren ist ein 15-jähriger Schüler aus England. Er hat händisch einen großen Teil des ersten Prototyps des Systems codiert, das nötig ist, um die Datensätze zu sammeln – ein Werkzeug, das aus den Abbildern des öffentlich zugänglichen Internets, auch Common Crawl genannt, die Daten beziehen kann. Wir haben aber zum Beispiel auch einen Google-Mitarbeiter an Bord, der in seiner Freizeit zu unserem Open-Source-Projekt beigetragen hat. Am Anfang waren etwa zehn Leute im Kernteam, inzwischen sind wir zwischen 20 und 30 Personen und es beteiligen sich mehr Forschungslabore als zuvor, weil wir mehr wissenschaftliche Bereiche miteinbeziehen – anfangs ging es nur um Bild und Text, inzwischen auch um Audio und Video.

Mitbegründer des gemeinnützigen Forschungsverbundes „Laion“: Dr. Jenia Jitsev vom Jülich Supercomputing Centre. Foto: Forschungszentrum Jülich/Ralf-Uwe Limbach

Sie verwenden unkuratierte Datensätze aus dem „öffentlichen Internet“, die stellenweise inkonsistent oder fehlerhaft sein können. Birgt das nicht Risiken, Fehler oder Diskriminierung zu reproduzieren?

Jitsev: Die Datensätze sind nicht dafür gedacht und geeignet, daraus Produkte zu entwickeln – wäre das so, sollte man besorgt sein, ja. Aber die Forschungsfrage ist, was man aus den Daten lernen kann. Und die Antwort ist, dass man aus den Daten ein Modell erzeugen kann, das mit den besten am Markt konkurrieren kann – also mit den Modellen, die hinter verschlossenen Türen trainiert werden und von denen wir nicht wissen, welche Datenbasis sie haben. Die Daten sind aber nicht komplett unkuratiert, es gibt zum Beispiel einige Standardmethoden um alles auszusortieren, was „Text-Müll“ ist. Außerdem werden Links rausgeschmissen, die nirgends hinführen. Und es gibt Filter, die ausschließen, dass illegale Inhalte verwendet werden sowie Methoden, mit den wir eine gewisse Qualität sicherstellen.

Die Idee ist, „Laion“ als Open-Source-Modell öffentlich weiterzuentwickeln. Was sind die nächsten Schritte?

Jitsev: In unserem Feld haben wir den Begriff Basismodell („foundation model“) – ein grundlegender, starker Algorithmus, der erfolgreich auf jedes Szenario angewendet werden kann. Um ein solches Modell zu trainieren, brauchen wir auch „Basisdaten“ – etwa vergleichbar mit dem Kanon an Büchern, die zu den Lehrplänen an Schulen gehören. Also Datensätze, die bekannt dafür sind, sich gut für das Maschinenlernen zu eignen. Das ist, worauf wir hinarbeiten: Was sind geeignete Daten und was ist der geeignete Lern-Algorithmus? Auf lange Sicht werden die Modelle lernen, die für sie brauchbaren Daten zusammenzustellen. Die Systeme werden sich also selbst verbessern. Aktuell wird unsere Datensatz-Sammlung an der University of Washington weiterentwickelt. Die ersten Schritte von „Laion“ sollen dabei noch mehr systematisiert werden, mit dem Ziel hochqualitative Datensätze für künftige Modelle zu erhalten.

Sie arbeiten unter anderem mit dem Supercomputer Juwels in Jülich, der unglaublich große Rechenleistungen erbringen kann. Ist Kapazität trotzdem ein beschränkender Faktor?

Jitsev: Wir haben schon längst nicht mehr genug Kapazitäten. Alle Maschinen weltweit sind zu klein. Das ist einer der Gründe, warum große Firmen so im Vorteil sind – sie kaufen einfach Unmengen an Ressourcen. Wenn wir also nicht sicherstellen, dass wir in der freien Forschung genug Ressourcen haben, wird es nur in der Industrie große Fortschritte geben. Wenn wir ein öffentliches Interesse haben an Informationsverarbeitung und Maschinenlernen, müssen Regierungen stärker in diesen Bereich investieren – und eine Einrichtung wie etwa das Forschungszentrum CERN für die Grundlagenfoschung der Physik auch für die Grundlagenforschung der Künstlichen Intelligenz ermöglichen.

Info Forscherteam Jenia Jitsev, 43, arbeitet seit 2013 in Jülich, zuvor hat er unter anderem am Max-Planck-Institut für neurologische Forschung in Köln gearbeitet und in Bonn und Frankfurt Informatik, Neurowissenschaft und Maschinelles Lernen studiert und in dem Bereich promoviert. Seine Eltern kamen in den 90ern als jüdische Kontingentflüchtlinge aus Russland nach Deutschland. Sein Kollege Mehdi Cherti, 34, hat in Marokko und Frankreich zu Maschinenlernen studiert und promoviert und arbeitet seit 2020 als Postdoktorand am Forschungszentrum. Beide leben in Köln.

In der aktuellen Debatte geht es immer wieder um KI als Bedrohung. Wie bewerten Sie diese Sorge?