ChatGPT & Cp. und Schule - Einschätzungen der Professur 'Digitalisierung und Bildung' der Pädagogischen Hochschule Schwyz

Worum geht es?

Die Veröffentlichung einer Testversion des Chatbots ChatGPT im November 2022 hat zu einem Hype in sozialen Medien und Massenmedien geführt. Diese Website (https://mia.phsz.ch/LLM) liefert Einordnungen der Professur "Digitalisierung und Bildung" der pädagogischen Hochschule Schwyz zur Frage, welche Auswirkungen Sprachgeneratoren wie ChatGPT auf die Schule haben.

Unsere Überlegungen sind auch in Form von Vorträgen und Publikationen verfügbar. Bemerkungen und Hinweise sind willkommen: beat.doebeli@phsz.ch

Allgemeine Einordnung

Die Veröffentlichung von ChatGPT im November 2022 machte eine längere und grössere Entwicklung im Bereich des maschinellen Lernens allgemein sichtbar. Vergleichbar mit der Markteinführung des iPhones im Jahr 2007 ist ChatGPT nicht aus dem Nichts entstanden und hat keine komplett neuen und unerwarteten Eigenschaften. iPhone wie ChatGPT gelang es aber, bestehende bzw. sich entwickelnde Technologien so zu vereinen und einfach nutzbar zur Verfügung zu stellen, dass sie in grösserem Umfang wahrnehmbar wurden und als Beginn einer jeweils neuen Ära gelten.

Bei der Einschätzung des Phänomens gilt es verschiedene Abstraktions- und damit verbundenen Zeiträume zu unterscheiden. Gewisse, versionsspezifische Eigenschaften haben eine Gültigkeit von wenigen Wochen, während andere grundlegende Aspekte nicht spezifisch für ChatGPT sind, dafür aber Jahre oder gar Jahrzehnte Gültigkeit haben werden. Mehr...

Technische Perspektive

Die folgenden technischen Einschätzungen erfordern kein technisches Vorwissen, sind allgemeinverständlich formuliert und gehen nicht detailliert auf die Funktionsweise generativer Machine-Learning-Systeme ein (dazu findet sich mehr unter Funktionsweise).
  • ChatGPT ist nur ein Schritt in einer längeren Entwicklung
    ChatGPT ist bei weitem nicht das erste Computerprogramm, welches einen umgangssprachlichen Dialog mit einem Computer ermöglicht. Bereits 1964 hat der deutsch-amerikanische Informatiker Joseph Weizenbaum mit Eliza einen Chatroboter entwickelt, der einige Bekanntheit erreicht hat. Weizenbaum hat auf einfachste Weise einen empathischen Psychiater zu simulieren versucht, der auf Antworten mit entsprechenden Nachfragen reagiert und war danach erschrocken darüber, wie ernst seine Umgebung den Chatroboter genommen hat. Während Eliza noch explizit programmiert worden war, ist ChatGPT ein sogenanntes Large Language Model, das auf neuronalen Netzwerken beruht. nutzt ChatGPT derzeit die Versionen 3.5 und 4.0 von GPT (Generative Pretrained Transformer) - die Version 1 von GPT wurde 2018 entwickelt.
    Es gibt mindestens drei Gründe, warum die aktuellen Fähigkeiten von ChatGPT nur eine Momentaufnahme darstellen:
    • Zunehmende Rechenleistung: Das Moore'sche Gesetz sowie effizientere Hardware und Algorithmen sorgen dafür, dass Sprachgeneratoren künftig noch leistungsfähiger werden.
    • Konkurrenzprodukte: OpenAI ist nicht das einzige Unternehmen, das generative Machine-Learning-Systeme entwickelt.
    • Macht der Schnittstellen: Die Mächtigkeit des Digitalen beruht unter anderem darauf, dass sich IT-Systeme mit Hilfe von Schnittstellen kombinieren lassen und sich daraus neue, mächtigere Gesamtsysteme ergeben. Auch bei generativen Machine-Learning-Systemen ist in naher Zukunft eine Explosion von kombinierten Systemen zu erwarten, bei denen die Potenziale von generativen Machine-Learning-Systemen mit anderen Systemen gekoppelt neue Möglichkeiten bieten werden. Dass OpenAI die entsprechende Schnittstelle (API) zu GPT zur Verfügung gestellt hat, war der erste pragmatische Schritt dazu.

  • Es geht nicht nur um Text, sondern um alles, was sich digital repräsentieren lässt
    Mittels generativer Machine-Learning-Systeme lassen sich alle digital repräsentierbaren Objekte (Texte, Bilder, Töne, Videos, 3D-Modelle, Proteine etc.) generieren bzw. von einer Datenform in eine andere Überführen (bspw. aus Bildern Bildbeschreibungen oder Musik erstellen.)

  • Die Grenze des Möglichen ist nicht einfach zu benennen
    Obwohl ChatGPT den aktuellen Stand einer längeren technologischen Entwicklung darstellt, sind sich Expertinnen und Experten nicht einig, wo die Grenze des technisch Möglichen liegt. Bei ChatGPT zeigten sich gewisse Expert:innen überrascht, welche Qualitätsverbesserung im Vergleich zu früheren GPT-Versionen in so kurzer Zeit möglich wurde - u.a. durch mehr Daten und mehr Rechenleistung.

  • ChatGPT ist ein sehr allgemeines Werkzeug, das mehr auf Breite als auf Tiefe setzt
    ChatGPT ist ein generisches Werkzeug, das auf breite Anwendung ausgelegt ist. Es ist deshalb zu erwarten, dass künftige, auf spezielle Teilgebiete zugeschnittene Lösungen deutlich leistungsfähiger sein werden.

  • ChatGPT & Co. haben gewisse Ähnlichkeiten mit Suchmaschinen
    Sowohl generative Machine-Learning-Systeme als auch Suchmaschinen beruhen auf einem grossen Text- bzw. Datenkorpus. Während bei generativen Machine-Learning-Systemen mit grossem Rechenaufwand ein neuronales Netzwerk trainiert wird, findet bei Suchmaschinen ein Indexing- und Rankingprozess statt.

  • ChatGPT beruht auf einem statistischen Modell und ist keine Logik-Maschine
    GPT3 und Co. bauen ihre Antworten primär aufgrund von statistisch zu erwartenden Wörtern und Sätzen zusammen, deren Wahrscheinlichkeiten sie in ihrem Textkorpus gefunden haben. Es kommt deshalb mitunter vor, dass sie sachliche und/oder logische Fehler generieren.

  • generative Machine-Learning-Systeme beruhen auf statistischen Modellen und ihre Antworten kommen meist auch unter Zuhilfenahme von Zufall zustande
    Sprachgeneratoren wie ChatGPT rechnen vereinfacht formuliert die wahrscheinlichste Antwort auf eine Eingabe/Anfrage aus. Dabei wird aber eine Prise Zufall beigemischt (Fachbegriff: Temperatur), was unter anderem zur Folge hat, dass auf die gleiche Eingabe/Anfrage nicht jedes Mal die gleiche Antwort errechnet wird.

  • Bei der Diskussion gilt es kurzlebige Versionseigenschaften von mittelfristigen Produkteigenschaften und insbesondere von langfristigen Technologieeigenschaften zu unterscheiden
    • Versionsspezifisch: Bei der seit November 2022 verfügbaren Version von ChatGPT handelt es sich um eine Testversion zur Verbesserung des Produkts. Die Interaktionen von Testnutzenden fliessen automatisiert und/oder manuell in den Dienst ein, so dass ChatGPT bereits nach einer Woche ganz anders auf gewisse Anfragen reagiert. Somit sind derzeit sogar Aussagen zum konkreten Produkt ChatGPT manchmal nur von zeitlich sehr begrenzter Gültigkeit.
    • Produktspezifisch und darum langfristig nicht relevant für die Diskussion sind u.a. folgende Punkte:
      • ChatGPT beruht auf einem Textkorpus von 2021 und bezieht bei Antworten das aktuelle Internet nicht mit ein
        Dies ist eine produktspezifische Begrenzung von ChatGPT und kein grundsätzliches Hindernis. Bereits im Februar 2023 bestehen verschiedene Alternativprodukte, die aktuelle Daten aus dem Internet bei ihren Antworten berücksichtigen.
      • ChatGPT zitiert derzeit nicht korrekt (Zitierstil) und erfindet mitunter Quellen.
        Dies sind beides Eigenschaften, die sich leicht korrigieren lassen in anderen Produkten, da sich sowohl die korrekte Zitierweise automatisieren und automatisiert prüfen lässt als auch eine automatische Prüfung auf die Existenz von Quellen leicht machbar ist. Auch hier existieren im Februar 2023 bereits Alternativprodukte, auf welche diese Kritik nicht oder nur noch teilweise zutrifft.

  • GMLS-Erkennungssoftware wird ein Wettrüsten auslösen, aber keine sichere Erkennung bringen
    Die Entwicklung von Programmen zur Erkennung von computergenerierten Texten wird ein Wettrüsten zwischen ML-Textgenerierung und ML-Texterkennung auslösen, da Textgenerierungsprogramme die verfügbaren Erkennungsprogramme als zusätzlichen Filter / Trainingsmöglichkeit nutzen werden (GAN-Netzwerk mit Erkennungsalgorithmus als Diskriminator). Es wird somit vermutlich langfristig nicht möglich sein, computergenerierte Texte zuverlässig automatisiert erkennen zu können.
    mehr...

  • Sprachgeneratoren sind sehr energieintensiv
    Insbesondere das erstmalige Training von Sprachgeneratoren ist sehr rechen- und damit energieintensiv. Derzeit werden aber sparsamere Trainingsverfahren entwickelt, so dass dieser Aspekt mittelfristig an Bedeutung verlieren könnte.
    mehr...

Gesellschaftliche Perspektive

Im Folgenden werden nur gesellschaftliche Aspekte aufgeführt, die einerseits spezifisch sind für Textgeneratoren und andererseits Konsequenzen haben für die Schule, die über "Das sollte man in der Schule thematisieren" hinausgehen:

  • ChatGPT & Co. sind Werkzeuge, die ab jetzt allgemein – teilweise integriert in andere Produkte – zur Verfügung stehen und nicht mehr verschwinden werden.
    Die Funktionalitäten, die ChatGPT & Co. derzeit als eigenständige Dienste (auf eigenen Websites oder Apps) anbieten, werden bald auch in andere Produkte integriert werden und damit allgemein und allgegenwärtig verfügbar sein. Es ist davon auszugehen, dass Textverständnis und Textgeneration wie sie ChatGPT & Co. heute zeigen, auf praktisch jedem digitalen Gerät und in praktisch jeder Software (Textverarbeitung, Tabellenkalkulation etc.) verfügbar sein wird.
    mehr...
  • ChatGPT & Co. konkurrenzieren traditionelle Suchmaschinen als Rechercheinstrumente
    Viele Beta-User von ChatGPT berichten, dass sie ChatGPT teilweise als Ersatz für eine Suchmaschine verwenden. Es ist somit denkbar, dass ChatGPT & Co. Suchmaschinen bis zu einem gewissen Grad als Werkzeuge ablösen werden.
    • ChatGPT & Co. eröffnen den Kampf um die Vormachtstellung im Bereich Suchmaschinen und bedrohen insbesondere Google
      Wenn Textgeneratoren teilweise die Aufgaben von traditionellen Suchmaschinen übernehmen, so gerät deren Vormachtstellung und evtl. auch deren werbebasiertes Geschäftsmodell in Gefahr. Insbesondere löst aber der technische Fortschritt im Bereich der Textgeneratoren ein erneutes Wettrennen um die Vormachtstellung der grossen IT-Firmen (Google, Amazon, Facebook, Apple, Microsoft) aus. (Biblionetz:a01506)
    • Es ist ein grosser Unterschied, ob das Ergebnis einer Recherche eine Dokumentenauswahl oder eine einzige Antwort ist.
      Traditionelle Suchmaschinen können sich bis zu einem gewissen Grad aus der Verantwortung für die Inhalte ziehen, da sie ja "nur" eine Auswahl an möglicherweise relevanten Quellen für eine Suchanfrage liefern. Textgeneratoren hingegen, die eine einzige Antwort liefern, haben eine stärkere Verantwortung für diese Antwort, selbst wenn sie dafür Belege in Form von Quellen angeben.
      auswahl-versus-antwort.png
      Der Unterschied zwischen der Angabe einer Dokumentenauswahl und einer Antwort mit Quellenangabe ist auch relevant für die Betreiber:innen von Websites: Während bei ersterem ein Besuch der angegebenen Webseite noch notwendig ist für eine Antwort, entfällt dies bei Antworten von Textgeneratoren. Es ist somit zu erwarten, dass Webseiten weniger besucht würden, was auch ökonomische Konsequenzen hätte.
  • ChatGPT & Co. vereinfachen und vergünstigen das Erstellen von Text massiv.
    Das wird vermutlich mindestens folgende Konsequenzen haben (die für die Allgemeinbildung relevant sind):
    • Die Informationsflut wird noch einmal um eine Grössenordnung ansteigen
      (Quellen, Belege und Kritik siehe Biblionetz:a01490)
    • Die Flut an Fake-News dürfte weiter zunehmen
      (Quellen siehe Biblionetz:a01493)
    • Das Erkennen von Fake-News aufgrund von sprachlichen Fehlern dürfte schwieriger werden
    • Phishing-Angriffe dürften künftig sprachlich fehlerfrei und evtl. extrem personalisiert sein
      Bisher konnte man davon ausgehen, dass die meisten Phishing-Versuche sprachlich eher holprig und fehlerhaft formuliert und inhaltlich eher allgemein gehalten waren. GPT3 & Co. ermöglicht künftig sprachlich perfekte und inhaltlich angepasste Anfragen. (17.01.23 Bericht von heise.de)

Folgende Aspekte erachten wir als entweder nicht schulspezifisch oder nicht Textgeneratoren-spezifisch:

  • Es ist unklar, ob Sprachgeneratoren das Recht am geistigen Eigentum verletzen
    Sprachgeneratoren werden derzeit oft mit Daten trainiert, die urheberrechtlich geschützt sind. Auch wenn die danach erzeugten Produkte Textpassagen oder Bildteile direkt enthalten, gibt es Stimmen, die in dieser ungefragten Verwendung dieser Werkeeine Verletzung des geistigen Eigentums sehen.
    Unabhängig von der juristischen Einschätzung erachten wir dies nicht als schulspezifisch zu klärende Frage. Sprachgeneratoren mit der Begründung einer ungeklärten Rechtslage in der Schule nicht zu thematisieren oder verwenden, scheint uns keine zielführende Strategie zu sein. Detaillierter...

  • Die Verwendung aktueller generativer Maschine-Learning-Systeme sind meist nicht datenschutzkonform möglich UPDATED
    Die aktuellen, leistungsfähigen generativen Maschine-Learning-Systeme sind nur cloudbasiert verfügbar und lassen sich derzeit nicht lokal oder auf eigenen Servern installieren. Die Anbieter stellen die generativen Maschine-Learning-Systeme derzeit oft in einer Basisversion kostenlos zur Verfügung um statistische Nutzungsdaten zu erheben. Es ist deshalb davon auszugehen, dass Nutzungsdaten erhoben werden, die nicht mit den jeweils lokal geltenden Datenschutzverordnungen konform sind.
    Das Phänomen, dass attraktive digitale Dienste nicht datenschutzkonform sind, ist in der bisherigen Entwicklung der digitalen Transformation häufig und nicht auf Sprachgeneratoren beschränkt. mehr...

Bedeutung für die Schule

Generative ML-Systeme wie ChatGPT & Co. sind in verschiedener Hinsicht relevant für die Schule:. Grundsätzlich lassen sich bei generativen ML-Systemen wie üblich bei Teilaspekten des Digitalen in der Schule drei Themenfelder unterscheiden:

  1. Generative ML-Systeme als Thema im Unterricht
  2. Generative ML-Systeme als Werkzeuge/Medien im Unterricht
  3. Veränderungen von Schule durch generative ML-Systeme

Bei den ersten beiden Aspekten stellen sich Fragen, die bald nach Antworten verlangen, aber auch einfacher zu beantworten sind. Deutlich schwieriger sind die Fragen beim dritten Aspekt zu beantworten.

Generative ML-Systeme als Thema im Unterricht
Medien­kompetenz Die Bedeutung von Medienkompetenz nimmt nochmals zu
Wenn durch generative ML-Systeme die allgemeine Informationsflut und insbesondere auch der Umfang und Perfektionsgrad von Fakenews nochmals um eine Grössenordnung zunimmt, so nimmt auch die Bedeutung von Medienkompetenz zu, die unter anderem künftig auch das Erkennen und den Umgang mit computergenerierten Texten umfassen muss.
mehr...
Information literacy Umgang mit generativen ML-Systemen als Teil von information literacy
Wenn generative ML-Systeme ein wichtiges Instrument der Recherche werden und bis zu einem gewissen Grad "traditionelle" Suchmaschinen ersetzen oder mindestens ergänzen werden, so muss der Umgang mit generativen ML-Systemen Teil der Allgemeinbildung werden.
Unterrichts­thema Generative ML-Systeme als mehrperspektivisches Thema in der Schule
Das Verständnis und die kompetente Nutzung von generativen ML-Systemen gehört künftig zur Allgemeinbildung. Dabei reicht - wie auch bei bisherigen (digitalen) Werkzeugen und Medien - eine reine Anwendungskompetenz nicht. Schülerinnen und Schüler sollten das Thema aus den drei Dagstuhl-Perspektiven betrachtet haben.
mehr...
Generative ML-Systeme als Werkzeug / Medium für die Schule
Lehr- / Lernunter­stützung Potenziale für Materialerstellung und Rückmeldungen an Schülerinnen und Schüler
Grundsätzlich bieten generative ML-Systeme das Potenzial, personalisiertes Unterrichtsmaterial und (individuelle) Rückmeldungen an Schülerinnen und Schüler generieren zu lassen. Es ist aber noch nicht geklärt, wie didaktisch passend sich solche Texte generieren lassen und welche evtl. unerwünschten Nebenwirkungen sich ergeben können, wenn Computersysteme gewisse Aufgaben übernehmen, die bisher von Lehrpersonen geleistet worden sind.
(Entsprechende Forschungen und Projekte sind oft unter den Stichworten Intelligent tutoring system (ITS), learning analytics oder Adaptivität zu finden.)
Datenschutz Aktuelle generative ML-Systeme sind derzeit aus Kapazitätsründen meist auf externen Servern verfügbar. Damit stellen sich die üblichen Datenschutzprobleme für Schulen: Ist es zulässig, dass schützenswerte Daten von Lehrkräften und meist minderjährigen Schüler:innen auf Servern von kommerziellen Anbietern im Ausland verarbeitet werden?
mehr...
Integration / Verbot Detailfragen der Integration versus des Verbots von generativen ML-Systemen in spezifischen Unterrichtssituationen
Ähnlich wie beim Taschenrechner wird sich künftig auch bei generativen ML-Systemen die Frage stellen, in welchen Unterrichtssituationen aus welchen didaktischen Gründen die Verwendung von generativen ML-Systemen erlaubt bzw. verboten sein wird.
mehr...
Betrug Gewisse Prüfungsformate sind künftig anfällig für Betrug
Schriftliche Hausaufgaben und Prüfungen am Computer ohne entsprechende Aufsicht und/oder Gegenmassnahmen können künftig vermehrt mit Hilfe von generativen ML-Systemen gelöst werden. Entsprechender Betrug ist immer schwieriger zu erkennen und noch schwieriger juristisch zweifelsfrei belegbar. Gegenmassnahmen erfordern entweder mehr Ressourcen (mündliche Prüfungen, engere Betreuung von Hausarbeiten, Prozessportfolios) oder aber die Rückkehr zu papierbasierten Präsenzprüfungen.
mehr...
Veränderungen von Schule durch generative ML-Systeme
Steigendes Anspruchs­niveau Weitere Zunahme des kognitiven Anspruchsniveaus
Mit der Verfügbarkeit von generativen ML-Systemen steigt das kognitive Anspruchsniveau für das berufliche und gesellschaftliche Leben weiter. Wenn auch geistige Routinetätigkeiten zunehmend automatisiert werden können, sind Menschen einerseits mit den Produkten dieser automatisierten Prozesse konfrontiert und müssen sich andererseits mit den sich ergebenden noch komplexeren Herausforderungen beschäftigen. Für gewisse Schülerinnen und Schüler und damit für das Bildungssystem könnte dies problematisch werden.
Kompetenz­schere Sich weiter öffnende Kompetenzschere?
Im Zuge der bisherigen Digitalisierung hat sich gezeigt, dass gute Schülerinnen und Schüler neue (digitale) Werkzeuge und Medien besser zu ihrem eigenen Nutzen einsetzen können als schlechtere Schüler:innen. Dies hat bereits in der Vergangenheit zu einer Vergrösserung des Leistungsspektrums geführt. Dies dürfte bei generativen ML-Systemen nicht anders sein und damit die Leistungsheterogenität weiter erhöhen.
mehr...
Motivations­probleme Motivationsprobleme aufgrund verfügbarer Automatisierung?
Bisher nicht geklärt ist die Frage, ob sich aufgrund der Verfügbarkeit von automatisierter Texterstellung und Textübersetzung Motivationsprobleme bei Schülerinnen und Schülern ergeben, weil diese keinen Sinn darin sehen, eine Kompetenz zu erlernen, die bereits automatisiert verfügbar ist. (Es handelt sich in einem gewissen Sinn um eine ähnliche Diskussion, wie sie bereits mit dem Kopfrechnen seit der Verfügbarkeit von Taschenrechnern stattgefunden hat.) (Mehr dazu unter Warum soll ich lernen, was die Maschine (besser) kann?.)

Weiterführende Informationen

Statt hier grosse Literaturlisten zu erstellen, wird auf Literatur- und Zitatlisten zum Themenfeld "generative Machine-Learning-Systeme" im Biblionetz von Beat Döbeli Honegger verwiesen:

Publikationen anderer Hochschulen

Publikationen von Bildungsbehörden

Publikationen von weiteren Organisationen

Publikationen und Vorträge

Unsere Überlegungen sind auch in Form von Vorträgen und Publikationen verfügbar.
PHSZ Logo

Die Website gmls.phsz.ch ist eine seit Dezember 2022 laufend erweiterte Sammlung von Einordnungen der Professur "Digitalisierung und Bildung" der Pädagogischen Hochschule Schwyz zur Frage, welche Auswirkungen generative Machine-Learning-Systeme wie ChatGPT auf die Schule haben.

Lizenz: Die Website steht unter einer CC-BY-ND-Lizenz, Bilder und Texte dürfen somit unter Quellenangabe an anderen Orten verwendet werden.

Zitationsvorschlag: Döbeli Honegger, Beat (2023). ChatGPT & Co. und Schule. Einschätzungen der Professur "Digitalisierung und Bildung" der Pädagogischen Hochschule Schwyz. https://gmls.phsz.ch/ (abgerufen am 16 Apr 2024)
This page was cached on 16 Apr 2024 - 14:07.