Grenzen für Chatbots setzen: Methoden und Grenzen
Es existiert ein großer Konsens, dass KI und ihr Einsatz gewissen Regeln und Grenzen unterliegen sollten. Aber wie sollen Grenzen in einem System gesetzt werden, das wir in der Tiefe gar nicht verstehen (können)? Maschinen sollen nicht nur unsere Befehle verstehen, sondern auch unsere wert- und normbezogenen Grenzen dabei erfassen bzw. miteinbeziehen.
Wie Sprachmodelle wie ChatGPT funktionieren und mit welchen Methoden die Modelle in ihren Aussagen gezügelt werden, erfuhren die Teilnehmer in diesem Webinar von CITAH anhand vieler Beispiele. Möglichkeiten der Moderation sind z. B. bereinigte Trainingsinhalte, das Nachtrainieren mit Beispielen und Belohnungsmodelle, die die Ergebnisse ranken. Sie lernten auch, dass die Moderation von LLMs stetig besser wird, die Tricks zur Ausübung der nächsten Attacke auch.
Referenten waren Dr. Simon Pukrop vom CITAH-Projekt am DFKI Osnabrück, und Nina Kolchmeyer (MA), Researcherin und Projektleiterin Administration & Schulungen im CITAH Projekt.
Noch ein Tipp: Am Donnerstag, 7. November 2024, laden das DFKI und CITAH in Osnabrück zur „Smart Enterprise 2024" ein, der Business-Tagung zur digitalen Transformation im Mittelstand. Vielleicht ist auch das etwas für Sie! Hier geht es zu den Infos: www.smart-enterprise.de
Zum Hintergrund: Im ehemaligen Ringlok-Schuppen in Osnabrück ist das Deutsche Forschungszentrum für Künstliche Intelligenz GmbH (DFKI) angesiedelt. Zum DFKI wiederum gehört das CITAH („Cross-Industry Transformation in Agriculture and Health“), das Europäische Digitale Innovationszentrum für die Weser-Ems-Region. Gemeinsam mit dem CITAH bietet unsere IHK seit Mai eine mehrteilige und kostenfreie KI-Info-Reihe an. Die Veranstaltungen befassen sich jeweils mit einem einzelnen Thema.
Nina Kolchmeyer (MA), Researcherin und Projektleiterin Administration & Schulungen im CITAH Projekt
© DFKI
Dr. Simon Pukrop, Senior Engineer am DFKI, Projektleiter Technologien im CITAH-Projekt
© DFKI