ChatGPT & Cp. und Schule - Einschätzungen der Professur 'Digitalisierung und Bildung' der Pädagogischen Hochschule Schwyz

Worum geht es?

Die Veröffentlichung einer Testversion des Chatbots ChatGPT im November 2022 hat zu einem Hype in sozialen Medien und Massenmedien geführt. Diese Website (https://mia.phsz.ch/LLM) liefert Einordnungen der Professur "Digitalisierung und Bildung" der pädagogischen Hochschule Schwyz zur Frage, welche Auswirkungen Sprachgeneratoren wie ChatGPT auf die Schule haben.

Unsere Überlegungen sind auch in Form von Vorträgen und Publikationen verfügbar. Bemerkungen und Hinweise sind willkommen: beat.doebeli@phsz.ch

Allgemeine Einordnung

Die Veröffentlichung von ChatGPT im November 2022 machte eine längere und grössere Entwicklung im Bereich des maschinellen Lernens allgemein sichtbar. Vergleichbar mit der Markteinführung des iPhones im Jahr 2007 ist ChatGPT nicht aus dem Nichts entstanden und hat keine komplett neuen und unerwarteten Eigenschaften. iPhone wie ChatGPT gelang es aber, bestehende bzw. sich entwickelnde Technologien so zu vereinen und einfach nutzbar zur Verfügung zu stellen, dass sie in grösserem Umfang wahrnehmbar wurden und als Beginn einer jeweils neuen Ära gelten.

Bei der Einschätzung des Phänomens gilt es verschiedene Abstraktions- und damit verbundenen Zeiträume zu unterscheiden. Gewisse, versionsspezifische Eigenschaften haben eine Gültigkeit von wenigen Wochen, während andere grundlegende Aspekte nicht spezifisch für ChatGPT sind, dafür aber Jahre oder gar Jahrzehnte Gültigkeit haben werden. Mehr...

Technische Perspektive

Die folgenden technischen Einschätzungen erfordern kein technisches Vorwissen, sind allgemeinverständlich formuliert und gehen nicht detailliert auf die Funktionsweise grosser Sprachmodelle ein (dazu findet sich mehr unter Funktionsweise).
  • ChatGPT ist nur ein Schritt in einer längeren Entwicklung
    ChatGPT ist bei weitem nicht das erste Computerprogramm, welches einen umgangssprachlichen Dialog mit einem Computer ermöglicht. Bereits 1964 hat der deutsch-amerikanische Informatiker Joseph Weizenbaum mit Eliza einen Chatroboter entwickelt, der einige Bekanntheit erreicht hat. Weizenbaum hat auf einfachste Weise einen empathischen Psychiater zu simulieren versucht, der auf Antworten mit entsprechenden Nachfragen reagiert und war danach erschrocken darüber, wie ernst seine Umgebung den Chatroboter genommen hat. Während Eliza noch explizit programmiert worden war, ist ChatGPT ein sogenanntes Large Language Model, das auf neuronalen Netzwerken beruht. nutzt ChatGPT derzeit die Versionen 3.5 und 4.0 von GPT (Generative Pretrained Transformer) - die Version 1 von GPT wurde 2018 entwickelt.
    Es gibt mindestens drei Gründe, warum die aktuellen Fähigkeiten von ChatGPT nur eine Momentaufnahme darstellen:
    • Zunehmende Rechenleistung: Das Moore'sche Gesetz sowie effizientere Hardware und Algorithmen sorgen dafür, dass Sprachgeneratoren künftig noch leistungsfähiger werden.
    • Konkurrenzprodukte: OpenAI ist nicht das einzige Unternehmen, das KI-Sprachgeneratoren entwickelt.
    • Macht der Schnittstellen: Die Mächtigkeit des Digitalen beruht unter anderem darauf, dass sich IT-Systeme mit Hilfe von Schnittstellen kombinieren lassen und sich daraus neue, mächtigere Gesamtsysteme ergeben. Auch bei KI-Sprachgeneratoren ist in naher Zukunft eine Explosion von kombinierten Systemen zu erwarten, bei denen die Potenziale von KI-Sprachgeneratoren mit anderen Systemen gekoppelt neue Möglichkeiten bieten werden. Dass OpenAI die entsprechende Schnittstelle (API) zu GPT zur Verfügung stellt, ist der erste pragmatische Schritt dazu.

  • Es geht nicht nur um Text, sondern um alles, was sich digital repräsentieren lässt
    Auch wenn der Fachausdruck grosse Sprachmodelle / Large Language Models lautet, so geht es in dieser Entwicklung keineswegs nur um Texte. Mittels grossen Sprachmodellen lassen sich alle digital repräsentierbaren Objekte (Texte, Bilder, Töne, Videos, 3D-Modelle, Proteine etc.) generieren bzw. von einer Datenform in eine andere Überführen (bspw. aus Bildern Bildbeschreibungen oder Musik erstellen.)

  • Die Grenze des Möglichen ist nicht einfach zu benennen
    Obwohl ChatGPT den aktuellen Stand einer längeren technologischen Entwicklung darstellt, sind sich Expertinnen und Experten nicht einig, wo die Grenze des technisch Möglichen liegt. Bei ChatGPT zeigten sich gewisse Expert:innen überrascht, welche Qualitätsverbesserung im Vergleich zu früheren GPT-Versionen in so kurzer Zeit möglich wurde - u.a. durch mehr Daten und mehr Rechenleistung.

  • ChatGPT ist ein sehr allgemeines Werkzeug, das mehr auf Breite als auf Tiefe setzt
    ChatGPT ist ein generisches Werkzeug, das auf breite Anwendung ausgelegt ist. Es ist deshalb zu erwarten, dass künftige, auf spezielle Teilgebiete zugeschnittene Lösungen deutlich leistungsfähiger sein werden.

  • ChatGPT & Co. haben gewisse Ähnlichkeiten mit Suchmaschinen
    Sowohl Sprachgeneratoren als auch Suchmaschinen beruhen auf einem grossen Textkorpus. Während bei Textgeneratoren mit grossem Rechenaufwand ein neuronales Netzwerk trainiert wird, findet bei Suchmaschinen ein Indexing- und Rankingprozess statt.

  • ChatGPT beruht primär auf einem Sprachmodell und ist keine Logik-Maschine
    GPT3 und Co. bauen ihre Antworten primär aufgrund von statistisch zu erwartenden Wörtern und Sätzen zusammen, deren Wahrscheinlichkeiten sie in ihrem Textkorpus gefunden haben. Es kommt deshalb mitunter vor, dass sie sachliche und/oder logische Fehler generieren.

  • Sprachgeneratoren beruhen auf statistischen Modellen und ihre Antworten kommen auch unter Zuhilfenahme von Zufall zustande
    Sprachgeneratoren wie ChatGPT rechnen vereinfacht formuliert die wahrscheinlichste Antwort auf eine Eingabe/Anfrage aus. Dabei wird aber eine Prise Zufall beigemischt (Fachbegriff: Temperatur), was unter anderem zur Folge hat, dass auf die gleiche Eingabe/Anfrage nicht jedes Mal die gleiche Antwort errechnet wird.

  • Bei der Diskussion gilt es kurzlebige Versionseigenschaften von mittelfristigen Produkteigenschaften und insbesondere von langfristigen Technologieeigenschaften zu unterscheiden
    • Versionsspezifisch: Bei der seit November 2022 verfügbaren Version von ChatGPT handelt es sich um eine Testversion zur Verbesserung des Produkts. Die Interaktionen von Testnutzenden fliessen automatisiert und/oder manuell in den Dienst ein, so dass ChatGPT bereits nach einer Woche ganz anders auf gewisse Anfragen reagiert. Somit sind derzeit sogar Aussagen zum konkreten Produkt ChatGPT manchmal nur von zeitlich sehr begrenzter Gültigkeit.
    • Produktspezifisch und darum langfristig nicht relevant für die Diskussion sind u.a. folgende Punkte:
      • ChatGPT beruht auf einem Textkorpus von 2021 und bezieht bei Antworten das aktuelle Internet nicht mit ein
        Dies ist eine produktspezifische Begrenzung von ChatGPT und kein grundsätzliches Hindernis. Bereits im Februar 2023 bestehen verschiedene Alternativprodukte, die aktuelle Daten aus dem Internet bei ihren Antworten berücksichtigen.
      • ChatGPT zitiert derzeit nicht korrekt (Zitierstil) und erfindet mitunter Quellen.
        Dies sind beides Eigenschaften, die sich leicht korrigieren lassen in anderen Produkten, da sich sowohl die korrekte Zitierweise automatisieren und automatisiert prüfen lässt als auch eine automatische Prüfung auf die Existenz von Quellen leicht machbar ist. Auch hier existieren im Februar 2023 bereits Alternativprodukte, auf welche diese Kritik nicht oder nur noch teilweise zutrifft.

  • Sprachgeneratoren -Erkennungssoftware wird ein Wettrüsten auslösen, aber keine sichere Erkennung bringen
    Die Entwicklung von Programmen zur Erkennung von computergenerierten Texten wird ein Wettrüsten zwischen KI-Textgenerierung und KI-Texterkennung auslösen, da Textgenerierungsprogramme die verfügbaren Erkennungsprogramme als zusätzlichen Filter / Trainingsmöglichkeit nutzen werden (GAN-Netzwerk mit Erkennungsalgorithmus als Diskriminator). Es wird somit vermutlich langfristig nicht möglich sein, computergenerierte Texte zuverlässig automatisiert erkennen zu können.
    mehr...

  • Sprachgeneratoren sind sehr energieintensiv
    Insbesondere das erstmalige Training von Sprachgeneratoren ist sehr rechen- und damit energieintensiv. Derzeit werden aber sparsamere Trainingsverfahren entwickelt, so dass dieser Aspekt mittelfristig an Bedeutung verlieren könnte.
    mehr...

Gesellschaftliche Perspektive

Im Folgenden werden nur gesellschaftliche Aspekte aufgeführt, die einerseits spezifisch sind für Textgeneratoren und andererseits Konsequenzen haben für die Schule, die über "Das sollte man in der Schule thematisieren" hinausgehen:

  • ChatGPT & Co. sind Werkzeuge, die ab jetzt allgemein – teilweise integriert in andere Produkte – zur Verfügung stehen und nicht mehr verschwinden werden.
    Die Funktionalitäten, die ChatGPT & Co. derzeit als eigenständige Dienste (auf eigenen Websites oder Apps) anbieten, werden bald auch in andere Produkte integriert werden und damit allgemein und allgegenwärtig verfügbar sein. Es ist davon auszugehen, dass Textverständnis und Textgeneration wie sie ChatGPT & Co. heute zeigen, auf praktisch jedem digitalen Gerät und in praktisch jeder Software (Textverarbeitung, Tabellenkalkulation etc.) verfügbar sein wird.
    mehr...
  • ChatGPT & Co. konkurrenzieren traditionelle Suchmaschinen als Rechercheinstrumente
    Viele Beta-User von ChatGPT berichten, dass sie ChatGPT teilweise als Ersatz für eine Suchmaschine verwenden. Es ist somit denkbar, dass ChatGPT & Co. Suchmaschinen bis zu einem gewissen Grad als Werkzeuge ablösen werden.
    • ChatGPT & Co. eröffnen den Kampf um die Vormachtstellung im Bereich Suchmaschinen und bedrohen insbesondere Google
      Wenn Textgeneratoren teilweise die Aufgaben von traditionellen Suchmaschinen übernehmen, so gerät deren Vormachtstellung und evtl. auch deren werbebasiertes Geschäftsmodell in Gefahr. Insbesondere löst aber der technische Fortschritt im Bereich der Textgeneratoren ein erneutes Wettrennen um die Vormachtstellung der grossen IT-Firmen (Google, Amazon, Facebook, Apple, Microsoft) aus. (Biblionetz:a01506)
    • Es ist ein grosser Unterschied, ob das Ergebnis einer Recherche eine Dokumentenauswahl oder eine einzige Antwort ist.
      Traditionelle Suchmaschinen können sich bis zu einem gewissen Grad aus der Verantwortung für die Inhalte ziehen, da sie ja "nur" eine Auswahl an möglicherweise relevanten Quellen für eine Suchanfrage liefern. Textgeneratoren hingegen, die eine einzige Antwort liefern, haben eine stärkere Verantwortung für diese Antwort, selbst wenn sie dafür Belege in Form von Quellen angeben.
      auswahl-versus-antwort.png
      Der Unterschied zwischen der Angabe einer Dokumentenauswahl und einer Antwort mit Quellenangabe ist auch relevant für die Betreiber:innen von Websites: Während bei ersterem ein Besuch der angegebenen Webseite noch notwendig ist für eine Antwort, entfällt dies bei Antworten von Textgeneratoren. Es ist somit zu erwarten, dass Webseiten weniger besucht würden, was auch ökonomische Konsequenzen hätte.
  • ChatGPT & Co. vereinfachen und vergünstigen das Erstellen von Text massiv.
    Das wird vermutlich mindestens folgende Konsequenzen haben (die für die Allgemeinbildung relevant sind):
    • Die Informationsflut wird noch einmal um eine Grössenordnung ansteigen
      (Quellen, Belege und Kritik siehe Biblionetz:a01490)
    • Die Flut an Fake-News dürfte weiter zunehmen
      (Quellen siehe Biblionetz:a01493)
    • Das Erkennen von Fake-News aufgrund von sprachlichen Fehlern dürfte schwieriger werden
    • Phishing-Angriffe dürften künftig sprachlich fehlerfrei und evtl. extrem personalisiert sein
      Bisher konnte man davon ausgehen, dass die meisten Phishing-Versuche sprachlich eher holprig und fehlerhaft formuliert und inhaltlich eher allgemein gehalten waren. GPT3 & Co. ermöglicht künftig sprachlich perfekte und inhaltlich angepasste Anfragen. (17.01.23 Bericht von heise.de)

Folgende Aspekte erachten wir als entweder nicht schulspezifisch oder nicht Textgeneratoren-spezifisch:

  • Es ist unklar, ob Sprachgeneratoren das Recht am geistigen Eigentum verletzen
    Sprachgeneratoren werden derzeit oft mit Daten trainiert, die urheberrechtlich geschützt sind. Auch wenn die danach erzeugten Produkte Textpassagen oder Bildteile direkt enthalten, gibt es Stimmen, die in dieser ungefragten Verwendung dieser Werkeeine Verletzung des geistigen Eigentums sehen.
    Unabhängig von der juristischen Einschätzung erachten wir dies nicht als schulspezifisch zu klärende Frage. Sprachgeneratoren mit der Begründung einer ungeklärten Rechtslage in der Schule nicht zu thematisieren oder verwenden, scheint uns keine zielführende Strategie zu sein. Detaillierter...

  • Die Verwendung aktueller Sprachgeneratoren ist nicht datenschutzkonform möglich
    Die aktuellen Sprachgeneratoren sind nur cloudbasiert zugänglich und lassen sich derzeit nicht lokal oder auf eigenen Servern installieren. Die Anbieter stellen die Sprachgeneratoren derzeit oft kostenlos zur Verfügung um statistische Nutzungsdaten zu erheben. Es ist deshalb davon auszugehen, dass Nutzungsdaten erhoben werden, die nicht mit den jeweils lokal geltenden Datenschutzverordnungen konform sind.
    Das Phänomen, dass attraktive digitale Dienste nicht datenschutzkonform sind, ist in der bisherigen Entwicklung der digitalen Transformation häufig und nicht auf Sprachgeneratoren beschränkt. Da diese Diskussion bereits seit langem sehr intensiv geführt wird und uns keine Sprachgeneratoren-spezifischen Aspekte dieser Diskussion bekannt sind, verzichten wir darauf, diese Diskussion am Beispiel Sprachgeneratoren erneut aufzurollen.

Bedeutung für die Schule

Textgeneratoren wie ChatGPT & Co. sind in verschiedener Hinsicht relevant für die Schule:

Medien­kompetenz Die Bedeutung von Medienkompetenz nimmt nochmals zu
Wenn durch Textgeneratoren die allgemeine Informationsflut und insbesondere auch der Umfang und Perfektionsgrad von Fakenews nochmals um eine Grössenordnung zunimmt, so nimmt auch die Bedeutung von Medienkompetenz zu, die unter anderem künftig auch das Erkennen und den Umgang mit computergenerierten Texten umfassen muss.
mehr...
Information literacy Umgang mit Textgeneratoren als Teil von information literacy
Wenn Textgeneratoren ein wichtiges Instrument der Recherche werden und bis zu einem gewissen Grad "traditionelle" Suchmaschinen ersetzen oder mindestens ergänzen werden, so muss der Umgang mit Textgeneratoren Teil der Allgemeinbildung werden.
Unterrichts­thema Textgeneratoren als mehrperspektivisches Thema in der Schule
Das Verständnis und die kompetente Nutzung von Textgeneratoren gehört künftig zur Allgemeinbildung. Dabei reicht - wie auch bei bisherigen (digitalen) Werkzeugen und Medien - eine reine Anwendungskompetenz nicht. Schülerinnen und Schüler sollten das Thema aus den drei Dagstuhl-Perspektiven betrachtet haben.
mehr...
Steigendes Anspruchs­niveau Weitere Zunahme des kognitiven Anspruchsniveaus
Mit der Verfügbarkeit von Textgeneratoren steigt das kognitive Anspruchsniveau für das berufliche und gesellschaftliche Leben weiter. Wenn auch geistige Routinetätigkeiten zunehmend automatisiert werden können, sind Menschen einerseits mit den Produkten dieser automatisierten Prozesse konfrontiert und müssen sich andererseits mit den sich ergebenden noch komplexeren Herausforderungen beschäftigen. Für gewisse Schülerinnen und Schüler und damit für das Bildungssystem könnte dies problematisch werden.
Kompetenz­schere Sich weiter öffnende Kompetenzschere?
Im Zuge der bisherigen Digitalisierung hat sich gezeigt, dass gute Schülerinnen und Schüler neue (digitale) Werkzeuge und Medien besser zu ihrem eigenen Nutzen einsetzen können als schlechtere Schüler:innen. Dies hat bereits in der Vergangenheit zu einer Vergrösserung des Leistungsspektrums geführt. Dies dürfte bei Textgeneratoren nicht anders sein und damit die Leistungsheterogenität weiter erhöhen.
mehr...
Motivations­probleme Motivationsprobleme aufgrund verfügbarer Automatisierung?
Bisher nicht geklärt ist die Frage, ob sich aufgrund der Verfügbarkeit von automatisierter Texterstellung und Textübersetzung Motivationsprobleme bei Schülerinnen und Schülern ergeben, weil diese keinen Sinn darin sehen, eine Kompetenz zu erlernen, die bereits automatisiert verfügbar ist. (Es handelt sich in einem gewissen Sinn um eine ähnliche Diskussion, wie sie bereits mit dem Kopfrechnen seit der Verfügbarkeit von Taschenrechnern stattgefunden hat.) (Mehr dazu unter Warum soll ich lernen, was die Maschine (besser) kann?.)
Integration / Verbot Detailfragen der Integration versus des Verbots von Textgeneratoren in spezifischen Unterrichtssituationen
Ähnlich wie beim Taschenrechner wird sich künftig auch bei Textgeneratoren die Frage stellen, in welchen Unterrichtssituationen aus welchen didaktischen Gründen die Verwendung von Textgeneratoren erlaubt bzw. verboten sein wird.
Lehr- / Lernunter­stützung Potenziale für Materialerstellung und Rückmeldungen an Schülerinnen und Schüler
Grundsätzlich bieten Sprachgeneratoren das Potenzial, personalisiertes Unterrichtsmaterial und (individuelle) Rückmeldungen an Schülerinnen und Schüler generieren zu lassen. Es ist aber noch nicht geklärt, wie didaktisch passend sich solche Texte generieren lassen und welche evtl. unerwünschten Nebenwirkungen sich ergeben können, wenn Computersysteme gewisse Aufgaben übernehmen, die bisher von Lehrpersonen geleistet worden sind.
(Entsprechende Forschungen und Projekte sind oft unter den Stichworten Intelligent tutoring system (ITS), learning analytics oder Adaptivität zu finden.)
Betrug Gewisse Prüfungsformate sind künftig anfällig für Betrug
Schriftliche Hausaufgaben und Prüfungen am Computer ohne entsprechende Aufsicht und/oder Gegenmassnahmen können künftig vermehrt mit Hilfe von Textgeneratoren gelöst werden. Entsprechender Betrug ist immer schwieriger zu erkennen und noch schwieriger juristisch zweifelsfrei belegbar. Gegenmassnahmen erfordern entweder mehr Ressourcen (mündliche Prüfungen, engere Betreuung von Hausarbeiten, Prozessportfolios) oder aber die Rückkehr zu papierbasierten Präsenzprüfungen.
mehr...
Hand­reichungen Aktuell verfügbare Handreichungen sind meist nur kurzfristig hilfreich
Derzeit werden zahlreiche Handreichungen und gar erste Bücher für die Nutzung von ChatGPT im Unterricht publiziert. Diese Anleitungen sind aufgrund der raschen Veränderung von ChatGPT und des Aufkommens verwandter Dienste vermutlich nur von sehr kurzer Gültigkeit. Zudem stammen einige von ihnen vorwiegend aus der Feder von ChatGPT wink

Weiterführende Informationen

Literatur- und Zitatlisten zum Themenfeld "Computergenerierte Texte" im Biblionetz von Beat Döbeli Honegger:

Publikationen anderer Hochschulen zu Textgeneratoren

Publikationen von Bildungsbehörden zu Textgeneratoren

Publikationen von weiteren Organisationen zu Textgeneratoren

Publikationen und Vorträge

Unsere Überlegungen sind auch in Form von Vorträgen und Publikationen verfügbar.
PHSZ Logo

Die Website mia.phsz.ch/LLM ist eine seit Dezember 2022 laufend erweiterte Sammlung von Einordnungen der Professur "Digitalisierung und Bildung" der Pädagogischen Hochschule Schwyz zur Frage, welche Auswirkungen Textgeneratoren wie ChatGPT auf die Schule haben.

Lizenz: Die Website steht unter einer CC-BY-ND-Lizenz, Bilder und Texte dürfen somit unter Quellenangabe an anderen Orten verwendet werden.

Rückmeldungen: Bemerkungen und Hinweise sind willkommen: beat.doebeli@phsz.ch

Zitationsvorschlag: Döbeli Honegger, Beat (2023). ChatGPT & Co. und Schule. Einschätzungen der Professur "Digitalisierung und Bildung" der Pädagogischen Hochschule Schwyz. https://mia.phsz.ch/LLM (abgerufen am 16 Sep 2023)
This page was cached on 16 Sep 2023 - 03:54.