„Was ist Kraut, Sauerkraut?“
- durch Milchsäuregärung konservierter Weißkohl
- im Englischen - eine meist stereotypisierende Bezeichnung für Deutsche
- der Name für das Finetuning eines LLMs für bessere Deutschkenntnisse
Auf der Herbsttagung des ZKI e.V. mit dem Titel „RZ, bau mir mal `nen Chatbot“ wohl am treffendsten Antwort C. Welche Ansätze für die Integration on Premises gibt es aktuell?
Generative KI, LLMs und RAG
Die generative KI an Hochschulen ist vielfältig von individuellen Lösungen der Nutzenden, die Nutzung kommerzieller Dienste, selbstgehostete Open-Source-Modelle bis zu föderativen Lösungen. Es wird zu einer Grundversorgungsaufgabe von Hochschulen, die durch Kooperation und die Erfahrung etablierter Prozesse, Gremien und Netzwerke gelingen kann, wenn Leitplanken klar definiert sind.
Neben horizontaler KI, also frei zugreifbare Inhalte im Web steht für IT-Verantwortlichen die vertikale KI einer Organisation A, B oder C also ihre Inhalte, Datenbanken und Systeme vor Ort im Vordergrund.
Eine Vielfalt an Beispielen für Einsatzszenarien von LLMs - wie Sauerkraut- sowie Retrieval Augmented Generation (RAG) als Erweiterung von LLMs oder auch Bildanalyse anhand von Vision Models dienen dem Ausbau von Know How und der Erhöhung von KI-Literacy einer Organisation. Insbesondere RAG ermöglicht Präzision zu erhöhen und Verlässlichkeit herzustellen.
Data Scientists veranschaulichen, wie in einem Pilotprojekt ein RAG zur Lernunterstützung von Jura-Studenten ihre Vorbereitung des ersten Staatsexamens ergänzen kann. Von der Vorverarbeitung relevanter Skripte, der Nutzung von Daten aus Moodle bis zu den eigentlichen Rechercheanfragen der Studierenden, wobei die Komponente der Kostenkontrolle durch monatliche Token-Budget pro Studierenden ebenfalls beleuchtet wurde.
Rechtsfragen
Beim Einsatz von KI an Hochschulen stehen jederzeit Fragen des IT-Rechts im Raum. Insbesondere gilt es Urheberrecht und Datenschutz zu wahren. In der Praxis ist schwierig zu bestimmen, wem das Recherche-Ergebnis gehört. Insbesondere bei Text & Data Mining gibt es Nutzungsvorbehalte gemäß UrhG. KI- generierte Inhalte sind eigentlich „frei“, aber die Schöpfungshöhe des Inhalts ist dann urheberrechtlich geschützt. Auch gilt laut Medienstaatsvertrag eine Kennzeichnungspflicht für maschinell erstellte Inhalte (Deepfake lt. UrhG) Die DSGVO stellt darüber hinaus die Anforderung an die Transparenz und Informationspflichten beim Training von KI-Modellen, was insbesondere bei der Verarbeitung von personenbezogenen Daten und deren Output sicher gestellt werden muss z.B. durch nachvollziehbare Dokumentation der Quellen und den Bezug auf die verarbeiteten Trainingsdaten.
Ethisch-menschliche Leitwerte
Die Ambivalenz der Ermächtigung des Menschen durch Technik und die Entmündigung des Menschen durch Technik ist eine der zentralen Fragen beim Einsatz von KI und verdeutlicht einmal mehr die Chancen und Risiken der anhaltenden Tendenz der Vertechnisierung des Menschen vs. Vermenschlichung der Technik. Dabei wird essenziell sein, dass ethisch-menschliche Leitwerte als Leitwerte in Forschung und Lehre bewahrt bleiben und dass die Reihung dieser auch stets vor dem Hintergrund persönlicher Entwicklung erfolgt.
KI und Infrastruktur
Und was passiert auf der Insel der Forschung, wenn die Analyse der Daten in übermenschlicher Geschwindigkeit erfolgt? Die technische Bereitstellung von KI zur gemeinsamen Nutzung von KI-Werkzeugen an einer Hochschule und deren gemeinsame Weiterentwicklung innerhalb einer Einrichtung hilft dabei Wissensgraphen, Ontologien und Taxonomien zu bilden, die einen Kompetenzaufbau in eigenen Modellen ermöglicht und eigene Analysen stützt- sowohl in Forschung & Lehre als auch in Verwaltung & zentralen Einrichtungen.
Der Wunsch nach Regeln
Das Lernen über KI und das Lernen mit KI führt sowohl bei Lernenden als auch bei Lehrenden zu einem erhöhten Informations- und Schulungsbedarf und insbesondere zu dem Wunsch nach klaren Regeln zur Nutzung und zum Deklarieren: die sinnvolle Nutzung von KI als Lerngegenstand und der Wandel der Prüfungskultur als Konsequenz. Ökosysteme für die Zusammenarbeit dienen als Foren für Learning AID und Fortbildung sowie zur Bereitstellung von KI-Strukturen.
Gekommen, um zu bleiben: KI und Chat sind Realität
Auch wenn die Einstellung zur Nutzung generativer KI aktuell noch nach Fakultäten stark divergiert, so zeigt die Erprobung eines datenschutzfreundlichen Zugangs zu KI für Hochschulangehörige mit klar definiertem Compliance-Regeln von Beginn an eine kontinuierliche Nutzung. Die beliebtesten Use Cases zur Nutzung eines Uni-eigenen ChatGPT sind zur Ideenfindung und Brainstorming, zur Recherche bzw. Informationsbeschaffung, zur sprachlichen Verbesserung von Texten, zum Texte zusammenfassen und zum Übersetzen.
Weitere GenAI-Case Studies an Einrichtungen zeigen, dass State-of-the-art Technologie aufgrund ihrer Modularität, Skalierbarkeit, Anpassbarkeit und Mehrsprachigkeit hohe Akzeptanz finden. Mit einem pragmatische GenAI-Ansatz wie ein eigener Copilot in Sharepoint-Umgebung werden leicht Anwendungsfälle identifiziert und , Aufmerksamkeit erreicht. Entwicklung und Testing erfolgt nutzergruppenspezifisch, um schnell Prototypen zu erstellen.
Gehen oder bleiben: Studienabbruch als Problemstellung
Mehr als ein Viertel aller Studienanfänger*innen in Deutschland verlässt die Hochschule ohne Abschluss. Es kommen immer mehr Anforderungen „quer“ an Studierende. Umfassende Informationsmöglichkeit bei der Studienorientierung, während des Studiums und darüber hinaus werden wichtiger. Ebenso die Integration von Biografie-Aspekten, Sprache, Kultur und die familiäre Situation. Mehr Unterstützung wird notwendig, denn Biografien verlaufen nicht (mehr) linear. Die Strukturierung vorhandener Daten (bspw. Studierendendaten, Arbeitsmarktdaten, Hochschuldaten…) sowie KI-unterstützte Empfehlungssysteme , wie der AI Study Buddy oder WISY@KI sowie die Entwicklung von Biografie-orientierter Chat-Bot-Beratung können unterstützen oder zu passgenauen Weiterbildungsempfehlungen führen.
Es liegt was in der Luft
In einer HFD-Umfrage zum hochschulweiten Umgang mit KI wurde aufgezeigt, dass aktuell die institutionelle Verortung der Arbeitsgruppen zu KI noch sehr divers ist und die Handlungsbedarfe aktuell noch auf Infrastruktur und Zugänge fokussiert sind. Die Entwicklung von KI-Leitlinien startet ebenso Weiterbildung für Lehrende. Eher mittel-bis langfristig wird die Anpassung von Prüfungen, die Integration von KI als Lerninhalte, die KI-Strategie sowie die Anpassung von Lernformaten du Curricula angestrebt. Vor diesem Hintergrund empfiehlt es sich voneinander zu lernen und einen Blick ins Ausland zu wagen zum: International Digital Roundtable on AI in higher education.
Neue Vereinstätigkeiten
Die ZKI-Herbsttagung fand in Partnerschaft mit DINI (der Deutsche Initiative für Netzwerkinformation) in Potsdam statt. Im Rahmen dessen wurde ein neuer DINI-Vorstandsvorsitz und ein neuer DINI-Vorstand wählt: Prof. Dr. Raimund Vogl, Universität Münster (CIT) ist Vorstandsvorsitzender. Stellvertretender DINI-Vorstandsvorsitzender ist Sören Lorenz, GEOMAR Helmholtz-Zentrum (IDRZ). Weitere Vorstandsmitglieder sind Prof. Dr. Ursula Arning, ZB MED Köln, Stefan Farrenkopf, Universität Hohenheim (KIM), Dr. Peter Kostädt, Universität Potsdam (CIO), Boguslaw Malys, BTU Cottbus-Senftenberg (IKMZ), Uwe Pirr, Humboldt-Universität zu Berlin (CMS), Antje Theise, Universität Rostock, Universitätsbibliothek
Der ZKI e.V. ist zusätzlich auch seit Herbst Mitglied im nfdi (Nationale Forschungsdateninfrastruktur). Der nfdi hat das Ziel, Daten von Wissenschaft und Forschung zur Verfügung zu stellen, zu vernetzen und somit langfristig nutzbar zu machen. Zu seinen den Mitgliedern gehören ausschließlich juristische Personen wie Universitäten, Hochschulen, Forschungszentren, Unternehmen. Vertreten wird ZKI in der Mitgliederversammlung des nfdi durch seinen Vorstandsvorsitzenden (CEO) Torsten Prill.