Worum geht es?
Die Veröffentlichung einer Testversion des Chatbots ChatGPT im November 2022 hat zu einem Hype in sozialen Medien und Massenmedien geführt. Diese Website (
https://mia.phsz.ch/LLM) liefert Einordnungen der Professur "Digitalisierung und Bildung" der pädagogischen Hochschule Schwyz zur Frage, welche Auswirkungen Sprachgeneratoren wie ChatGPT auf die Schule haben.
Unsere Überlegungen sind auch in Form von
Vorträgen und
Publikationen verfügbar. Bemerkungen und Hinweise sind willkommen:
beat.doebeli@phsz.ch
Allgemeine Einordnung
Die Veröffentlichung von ChatGPT im November 2022 machte eine längere und grössere Entwicklung im Bereich des maschinellen Lernens allgemein sichtbar. Vergleichbar mit der Markteinführung des iPhones im Jahr 2007 ist ChatGPT nicht aus dem Nichts entstanden und hat keine komplett neuen und unerwarteten Eigenschaften. iPhone wie ChatGPT gelang es aber, bestehende bzw. sich entwickelnde Technologien so zu vereinen und einfach nutzbar zur Verfügung zu stellen, dass sie in grösserem Umfang wahrnehmbar wurden und als Beginn einer jeweils neuen Ära gelten.
Bei der Einschätzung des Phänomens gilt es verschiedene Abstraktions- und damit verbundenen Zeiträume zu unterscheiden. Gewisse, versionsspezifische Eigenschaften haben eine Gültigkeit von wenigen Wochen, während andere grundlegende Aspekte nicht spezifisch für ChatGPT sind, dafür aber Jahre oder gar Jahrzehnte Gültigkeit haben werden.
Mehr...
Technische Perspektive
Die folgenden technischen Einschätzungen erfordern kein technisches Vorwissen, sind allgemeinverständlich formuliert und gehen nicht detailliert auf die Funktionsweise grosser Sprachmodelle ein (dazu findet sich mehr unter
Funktionsweise).
- ChatGPT ist nur ein Schritt in einer längeren Entwicklung
ChatGPT ist bei weitem nicht das erste Computerprogramm, welches einen umgangssprachlichen Dialog mit einem Computer ermöglicht. Bereits 1964 hat der deutsch-amerikanische Informatiker Joseph Weizenbaum mit Eliza einen Chatroboter entwickelt, der einige Bekanntheit erreicht hat. Weizenbaum hat auf einfachste Weise einen empathischen Psychiater zu simulieren versucht, der auf Antworten mit entsprechenden Nachfragen reagiert und war danach erschrocken darüber, wie ernst seine Umgebung den Chatroboter genommen hat. Während Eliza noch explizit programmiert worden war, ist ChatGPT ein sogenanntes Large Language Model, das auf neuronalen Netzwerken beruht. nutzt ChatGPT derzeit die Versionen 3.5 und 4.0 von GPT (Generative Pretrained Transformer) - die Version 1 von GPT wurde 2018 entwickelt.
Es gibt mindestens drei Gründe, warum die aktuellen Fähigkeiten von ChatGPT nur eine Momentaufnahme darstellen:
- Zunehmende Rechenleistung: Das Moore'sche Gesetz sowie effizientere Hardware und Algorithmen sorgen dafür, dass Sprachgeneratoren künftig noch leistungsfähiger werden.
- Konkurrenzprodukte: OpenAI ist nicht das einzige Unternehmen, das KI-Sprachgeneratoren entwickelt.
- Macht der Schnittstellen: Die Mächtigkeit des Digitalen beruht unter anderem darauf, dass sich IT-Systeme mit Hilfe von Schnittstellen kombinieren lassen und sich daraus neue, mächtigere Gesamtsysteme ergeben. Auch bei KI-Sprachgeneratoren ist in naher Zukunft eine Explosion von kombinierten Systemen zu erwarten, bei denen die Potenziale von KI-Sprachgeneratoren mit anderen Systemen gekoppelt neue Möglichkeiten bieten werden. Dass OpenAI die entsprechende Schnittstelle (API) zu GPT zur Verfügung stellt, ist der erste pragmatische Schritt dazu.
- Es geht nicht nur um Text, sondern um alles, was sich digital repräsentieren lässt
Auch wenn der Fachausdruck grosse Sprachmodelle / Large Language Models lautet, so geht es in dieser Entwicklung keineswegs nur um Texte. Mittels grossen Sprachmodellen lassen sich alle digital repräsentierbaren Objekte (Texte, Bilder, Töne, Videos, 3D-Modelle, Proteine etc.) generieren bzw. von einer Datenform in eine andere Überführen (bspw. aus Bildern Bildbeschreibungen oder Musik erstellen.)
- Die Grenze des Möglichen ist nicht einfach zu benennen
Obwohl ChatGPT den aktuellen Stand einer längeren technologischen Entwicklung darstellt, sind sich Expertinnen und Experten nicht einig, wo die Grenze des technisch Möglichen liegt. Bei ChatGPT zeigten sich gewisse Expert:innen überrascht, welche Qualitätsverbesserung im Vergleich zu früheren GPT-Versionen in so kurzer Zeit möglich wurde - u.a. durch mehr Daten und mehr Rechenleistung.
- ChatGPT ist ein sehr allgemeines Werkzeug, das mehr auf Breite als auf Tiefe setzt
ChatGPT ist ein generisches Werkzeug, das auf breite Anwendung ausgelegt ist. Es ist deshalb zu erwarten, dass künftige, auf spezielle Teilgebiete zugeschnittene Lösungen deutlich leistungsfähiger sein werden.
- ChatGPT & Co. haben gewisse Ähnlichkeiten mit Suchmaschinen
Sowohl Sprachgeneratoren als auch Suchmaschinen beruhen auf einem grossen Textkorpus. Während bei Textgeneratoren mit grossem Rechenaufwand ein neuronales Netzwerk trainiert wird, findet bei Suchmaschinen ein Indexing- und Rankingprozess statt.
- ChatGPT beruht primär auf einem Sprachmodell und ist keine Logik-Maschine
GPT3 und Co. bauen ihre Antworten primär aufgrund von statistisch zu erwartenden Wörtern und Sätzen zusammen, deren Wahrscheinlichkeiten sie in ihrem Textkorpus gefunden haben. Es kommt deshalb mitunter vor, dass sie sachliche und/oder logische Fehler generieren.
- Sprachgeneratoren beruhen auf statistischen Modellen und ihre Antworten kommen auch unter Zuhilfenahme von Zufall zustande
Sprachgeneratoren wie ChatGPT rechnen vereinfacht formuliert die wahrscheinlichste Antwort auf eine Eingabe/Anfrage aus. Dabei wird aber eine Prise Zufall beigemischt (Fachbegriff: Temperatur), was unter anderem zur Folge hat, dass auf die gleiche Eingabe/Anfrage nicht jedes Mal die gleiche Antwort errechnet wird.
- Bei der Diskussion gilt es kurzlebige Versionseigenschaften von mittelfristigen Produkteigenschaften und insbesondere von langfristigen Technologieeigenschaften zu unterscheiden
- Versionsspezifisch: Bei der seit November 2022 verfügbaren Version von ChatGPT handelt es sich um eine Testversion zur Verbesserung des Produkts. Die Interaktionen von Testnutzenden fliessen automatisiert und/oder manuell in den Dienst ein, so dass ChatGPT bereits nach einer Woche ganz anders auf gewisse Anfragen reagiert. Somit sind derzeit sogar Aussagen zum konkreten Produkt ChatGPT manchmal nur von zeitlich sehr begrenzter Gültigkeit.
- Produktspezifisch und darum langfristig nicht relevant für die Diskussion sind u.a. folgende Punkte:
- ChatGPT beruht auf einem Textkorpus von 2021 und bezieht bei Antworten das aktuelle Internet nicht mit ein
Dies ist eine produktspezifische Begrenzung von ChatGPT und kein grundsätzliches Hindernis. Bereits im Februar 2023 bestehen verschiedene Alternativprodukte, die aktuelle Daten aus dem Internet bei ihren Antworten berücksichtigen.
- ChatGPT zitiert derzeit nicht korrekt (Zitierstil) und erfindet mitunter Quellen.
Dies sind beides Eigenschaften, die sich leicht korrigieren lassen in anderen Produkten, da sich sowohl die korrekte Zitierweise automatisieren und automatisiert prüfen lässt als auch eine automatische Prüfung auf die Existenz von Quellen leicht machbar ist. Auch hier existieren im Februar 2023 bereits Alternativprodukte, auf welche diese Kritik nicht oder nur noch teilweise zutrifft.
- Sprachgeneratoren -Erkennungssoftware wird ein Wettrüsten auslösen, aber keine sichere Erkennung bringen
Die Entwicklung von Programmen zur Erkennung von computergenerierten Texten wird ein Wettrüsten zwischen KI-Textgenerierung und KI-Texterkennung auslösen, da Textgenerierungsprogramme die verfügbaren Erkennungsprogramme als zusätzlichen Filter / Trainingsmöglichkeit nutzen werden (GAN-Netzwerk mit Erkennungsalgorithmus als Diskriminator). Es wird somit vermutlich langfristig nicht möglich sein, computergenerierte Texte zuverlässig automatisiert erkennen zu können.
mehr...
- Sprachgeneratoren sind sehr energieintensiv
Insbesondere das erstmalige Training von Sprachgeneratoren ist sehr rechen- und damit energieintensiv. Derzeit werden aber sparsamere Trainingsverfahren entwickelt, so dass dieser Aspekt mittelfristig an Bedeutung verlieren könnte.
mehr...
Gesellschaftliche Perspektive
Im Folgenden werden nur gesellschaftliche Aspekte aufgeführt, die einerseits spezifisch sind für Textgeneratoren und andererseits Konsequenzen haben für die Schule, die über "Das sollte man in der Schule thematisieren" hinausgehen:
- ChatGPT & Co. sind Werkzeuge, die ab jetzt allgemein – teilweise integriert in andere Produkte – zur Verfügung stehen und nicht mehr verschwinden werden.
Die Funktionalitäten, die ChatGPT & Co. derzeit als eigenständige Dienste (auf eigenen Websites oder Apps) anbieten, werden bald auch in andere Produkte integriert werden und damit allgemein und allgegenwärtig verfügbar sein. Es ist davon auszugehen, dass Textverständnis und Textgeneration wie sie ChatGPT & Co. heute zeigen, auf praktisch jedem digitalen Gerät und in praktisch jeder Software (Textverarbeitung, Tabellenkalkulation etc.) verfügbar sein wird.
mehr...
- ChatGPT & Co. konkurrenzieren traditionelle Suchmaschinen als Rechercheinstrumente
Viele Beta-User von ChatGPT berichten, dass sie ChatGPT teilweise als Ersatz für eine Suchmaschine verwenden. Es ist somit denkbar, dass ChatGPT & Co. Suchmaschinen bis zu einem gewissen Grad als Werkzeuge ablösen werden.
- ChatGPT & Co. eröffnen den Kampf um die Vormachtstellung im Bereich Suchmaschinen und bedrohen insbesondere Google
Wenn Textgeneratoren teilweise die Aufgaben von traditionellen Suchmaschinen übernehmen, so gerät deren Vormachtstellung und evtl. auch deren werbebasiertes Geschäftsmodell in Gefahr. Insbesondere löst aber der technische Fortschritt im Bereich der Textgeneratoren ein erneutes Wettrennen um die Vormachtstellung der grossen IT-Firmen (Google, Amazon, Facebook, Apple, Microsoft) aus. (Biblionetz:a01506)
- Es ist ein grosser Unterschied, ob das Ergebnis einer Recherche eine Dokumentenauswahl oder eine einzige Antwort ist.
Traditionelle Suchmaschinen können sich bis zu einem gewissen Grad aus der Verantwortung für die Inhalte ziehen, da sie ja "nur" eine Auswahl an möglicherweise relevanten Quellen für eine Suchanfrage liefern. Textgeneratoren hingegen, die eine einzige Antwort liefern, haben eine stärkere Verantwortung für diese Antwort, selbst wenn sie dafür Belege in Form von Quellen angeben.
Der Unterschied zwischen der Angabe einer Dokumentenauswahl und einer Antwort mit Quellenangabe ist auch relevant für die Betreiber:innen von Websites: Während bei ersterem ein Besuch der angegebenen Webseite noch notwendig ist für eine Antwort, entfällt dies bei Antworten von Textgeneratoren. Es ist somit zu erwarten, dass Webseiten weniger besucht würden, was auch ökonomische Konsequenzen hätte.
- ChatGPT & Co. vereinfachen und vergünstigen das Erstellen von Text massiv.
Das wird vermutlich mindestens folgende Konsequenzen haben (die für die Allgemeinbildung relevant sind):
- Die Informationsflut wird noch einmal um eine Grössenordnung ansteigen
(Quellen, Belege und Kritik siehe Biblionetz:a01490)
- Die Flut an Fake-News dürfte weiter zunehmen
(Quellen siehe Biblionetz:a01493)
- Das Erkennen von Fake-News aufgrund von sprachlichen Fehlern dürfte schwieriger werden
- Phishing-Angriffe dürften künftig sprachlich fehlerfrei und evtl. extrem personalisiert sein
Bisher konnte man davon ausgehen, dass die meisten Phishing-Versuche sprachlich eher holprig und fehlerhaft formuliert und inhaltlich eher allgemein gehalten waren. GPT3 & Co. ermöglicht künftig sprachlich perfekte und inhaltlich angepasste Anfragen. (17.01.23 Bericht von heise.de)
Folgende Aspekte erachten wir als entweder nicht schulspezifisch oder nicht Textgeneratoren-spezifisch:
- Es ist unklar, ob Sprachgeneratoren das Recht am geistigen Eigentum verletzen
Sprachgeneratoren werden derzeit oft mit Daten trainiert, die urheberrechtlich geschützt sind. Auch wenn die danach erzeugten Produkte Textpassagen oder Bildteile direkt enthalten, gibt es Stimmen, die in dieser ungefragten Verwendung dieser Werkeeine Verletzung des geistigen Eigentums sehen.
Unabhängig von der juristischen Einschätzung erachten wir dies nicht als schulspezifisch zu klärende Frage. Sprachgeneratoren mit der Begründung einer ungeklärten Rechtslage in der Schule nicht zu thematisieren oder verwenden, scheint uns keine zielführende Strategie zu sein. Detaillierter...
- Die Verwendung aktueller Sprachgeneratoren ist nicht datenschutzkonform möglich
Die aktuellen Sprachgeneratoren sind nur cloudbasiert zugänglich und lassen sich derzeit nicht lokal oder auf eigenen Servern installieren. Die Anbieter stellen die Sprachgeneratoren derzeit oft kostenlos zur Verfügung um statistische Nutzungsdaten zu erheben. Es ist deshalb davon auszugehen, dass Nutzungsdaten erhoben werden, die nicht mit den jeweils lokal geltenden Datenschutzverordnungen konform sind.
Das Phänomen, dass attraktive digitale Dienste nicht datenschutzkonform sind, ist in der bisherigen Entwicklung der digitalen Transformation häufig und nicht auf Sprachgeneratoren beschränkt. Da diese Diskussion bereits seit langem sehr intensiv geführt wird und uns keine Sprachgeneratoren-spezifischen Aspekte dieser Diskussion bekannt sind, verzichten wir darauf, diese Diskussion am Beispiel Sprachgeneratoren erneut aufzurollen.
Bedeutung für die Schule
Textgeneratoren wie ChatGPT & Co. sind in verschiedener Hinsicht relevant für die Schule:
Medienkompetenz |
Die Bedeutung von Medienkompetenz nimmt nochmals zu
Wenn durch Textgeneratoren die allgemeine Informationsflut und insbesondere
auch der Umfang und Perfektionsgrad von Fakenews nochmals um eine Grössenordnung zunimmt,
so nimmt auch die Bedeutung von Medienkompetenz zu, die unter anderem künftig auch das
Erkennen und den Umgang mit computergenerierten Texten umfassen muss.
mehr...
|
Information literacy |
Umgang mit Textgeneratoren als Teil von information literacy
Wenn Textgeneratoren ein wichtiges Instrument der Recherche werden und bis zu einem gewissen Grad
"traditionelle" Suchmaschinen ersetzen oder mindestens ergänzen werden, so muss der Umgang mit
Textgeneratoren Teil der Allgemeinbildung werden.
|
Unterrichtsthema |
Textgeneratoren als mehrperspektivisches Thema in der Schule
Das Verständnis und die kompetente Nutzung von Textgeneratoren gehört künftig zur Allgemeinbildung.
Dabei reicht - wie auch bei bisherigen (digitalen) Werkzeugen und Medien - eine reine Anwendungskompetenz nicht.
Schülerinnen und Schüler sollten das Thema aus den drei Dagstuhl-Perspektiven betrachtet haben.
mehr...
|
Steigendes Anspruchsniveau |
Weitere Zunahme des kognitiven Anspruchsniveaus
Mit der Verfügbarkeit von Textgeneratoren steigt das kognitive Anspruchsniveau für das berufliche
und gesellschaftliche Leben weiter. Wenn auch geistige Routinetätigkeiten zunehmend automatisiert
werden können, sind Menschen einerseits mit den Produkten dieser automatisierten Prozesse
konfrontiert und müssen sich andererseits mit den sich ergebenden noch komplexeren Herausforderungen
beschäftigen. Für gewisse Schülerinnen und Schüler und damit für das Bildungssystem könnte dies problematisch werden.
|
Kompetenzschere |
Sich weiter öffnende Kompetenzschere?
Im Zuge der bisherigen Digitalisierung hat sich gezeigt, dass gute Schülerinnen und Schüler
neue (digitale) Werkzeuge und Medien besser zu ihrem eigenen Nutzen einsetzen können als schlechtere
Schüler:innen. Dies hat bereits in der Vergangenheit zu einer Vergrösserung des Leistungsspektrums
geführt. Dies dürfte bei Textgeneratoren nicht anders sein und damit die Leistungsheterogenität weiter erhöhen.
mehr...
|
Motivationsprobleme |
Motivationsprobleme aufgrund verfügbarer Automatisierung?
Bisher nicht geklärt ist die Frage, ob sich aufgrund der Verfügbarkeit von automatisierter Texterstellung und Textübersetzung
Motivationsprobleme bei Schülerinnen und Schülern ergeben, weil diese keinen Sinn darin sehen, eine Kompetenz zu erlernen,
die bereits automatisiert verfügbar ist. (Es handelt sich in einem gewissen Sinn um eine ähnliche Diskussion, wie sie
bereits mit dem Kopfrechnen seit der Verfügbarkeit von Taschenrechnern stattgefunden hat.) (Mehr dazu unter Warum soll ich lernen, was die Maschine (besser) kann?.)
|
Integration / Verbot |
Detailfragen der Integration versus des Verbots von Textgeneratoren in spezifischen Unterrichtssituationen
Ähnlich wie beim Taschenrechner wird sich künftig auch bei Textgeneratoren die Frage stellen, in
welchen Unterrichtssituationen aus welchen didaktischen Gründen die Verwendung von Textgeneratoren erlaubt bzw. verboten sein wird.
|
Lehr- / Lernunterstützung |
Potenziale für Materialerstellung und Rückmeldungen an Schülerinnen und Schüler
Grundsätzlich bieten Sprachgeneratoren das Potenzial, personalisiertes Unterrichtsmaterial
und (individuelle) Rückmeldungen an Schülerinnen und Schüler generieren zu lassen. Es ist aber noch nicht geklärt,
wie didaktisch passend sich solche Texte generieren lassen und welche evtl. unerwünschten Nebenwirkungen sich ergeben können,
wenn Computersysteme gewisse Aufgaben übernehmen, die bisher von Lehrpersonen geleistet worden sind.
(Entsprechende Forschungen und Projekte sind oft unter den Stichworten Intelligent tutoring system (ITS), learning analytics oder Adaptivität zu finden.)
|
Betrug |
Gewisse Prüfungsformate sind künftig anfällig für Betrug
Schriftliche Hausaufgaben und Prüfungen am Computer ohne entsprechende Aufsicht und/oder Gegenmassnahmen können künftig
vermehrt mit Hilfe von Textgeneratoren gelöst werden. Entsprechender Betrug ist immer schwieriger zu erkennen und noch schwieriger
juristisch zweifelsfrei belegbar. Gegenmassnahmen erfordern entweder mehr Ressourcen
(mündliche Prüfungen, engere Betreuung von Hausarbeiten, Prozessportfolios) oder aber die
Rückkehr zu papierbasierten Präsenzprüfungen. mehr...
|
Handreichungen |
Aktuell verfügbare Handreichungen sind meist nur kurzfristig hilfreich
Derzeit werden zahlreiche Handreichungen und gar erste Bücher für die Nutzung von ChatGPT im Unterricht publiziert. Diese Anleitungen
sind aufgrund der raschen Veränderung von ChatGPT und des Aufkommens verwandter Dienste vermutlich nur von sehr kurzer Gültigkeit. Zudem stammen einige von ihnen vorwiegend aus der Feder von ChatGPT
|
Literatur- und Zitatlisten zum Themenfeld "Computergenerierte Texte" im Biblionetz von Beat Döbeli Honegger:
- Begriffe:
- Aussagen / Thesen:
- Biblionetz:a1483 Nutzung von Textgeneratoren wird bald wird bald so selbstverständlich wie die Nutzung eines Taschenrechners
- Biblionetz:a1490 Computergenerierte Texte erhöhen die Informationsflut
- Biblionetz:a1508 Large Language Models benötigen viel Energie
- Biblionetz:a1476 Computergenerierte Texte erleichtern Plagiarismus bzw. entsprechenden Textbetrug
Publikationen anderer Hochschulen zu Textgeneratoren
Publikationen von Bildungsbehörden zu Textgeneratoren
Publikationen von weiteren Organisationen zu Textgeneratoren
Publikationen und Vorträge
Unsere Überlegungen sind auch in Form von
Vorträgen und
Publikationen verfügbar.