Action unknown: copypageplugin__copy


Navigation: 🐟 Teil 1 - 🐟 Teil 2 - 🐟 Teil 3 - 🐟 Teil 4 - 🐟 Zusatzkapitel Loading ⌛Loading ⌛

🐟 Was können wir von den Fischen über KI im Allgemeinen lernen?

KI-Chatbot1)

Nachdem du 👩‍🦰 Sigrún erfolgreich helfen konntest, erweiterst du deinen Horizont, indem du überlegst, was du aus der Fischklassifikation für künstliche Intelligenz im Allgemeinen lernen kannst. Dafür vergleichst du als Zwischenschritt das neuronale Netz für die Fischklassifikation (Fisch-NN) mit aktuellen KI-Chatbots.


Inhaltsverzeichnis


1. Funktionsweise

💡Um die Funktionsweise einer KI zu verstehen, wir das Fisch-NN aus den vorangehend vier Kapiteln mit einem KI-Chatbot verglichen. Obwohl beide Beispiele hauptsächlich auf neuronalen Netzen basieren, können die Einsichten auch auf die meisten anderen KI-Arten übertragen werden. In diesem Teil werden die Begriffe KI und neuronale Netze mehr oder weniger als Synonyme verwendet.

💡 Eine KI besitzt zwei Betriebsmodi. Im Anwendungsmodus wird die KI angewendet, d.h. sie produziert für jeden Input einen Output. Dabei wird die KI nicht verändert (die Gewichte ändern nicht). Im Trainingsmodus wir die KI „schlau gemacht“, das bedeutet in der Regel, dass diese trainiert wird, dabei wird die KI verändert (die Gewichte ändern sich).

In den nachfolgenden zwei Unterkapiteln werden beide Modi beschrieben.

1.1 Anwenden

Anwendung Fisch-NN 2)
🐟 Fisch-NN

Im Anwendungsmodus können mit dem Fisch-NN unbekannte Fische entweder als Hering oder Lodde klassifiziert werden.

Zuerst wird der unbekannte Fisch vermessen, um die Werte für die benötigten Eingangsgrössen zu erhalten. Diese Werte bilden die Eingabe in das neuronale Netz. Die Ausgabe des neuronalen Netzes ist ein einziger Ausgabewert. Je nach Grösse dieses Ausgabewerts wird der Fisch, wie in der Abbildung gezeigt, als Hering oder Lodde klassifiziert.
💬 KI-Chatbot

Im Anwendungsmodus kann ein KI-Chatbot Antworten auf eingegebene Fragen generieren.

Du gibst einen Fragetext ein. Der KI-Chatbot besitzt ein Wörterbuch mit sogenannten „Tokens“ (das sind kurze Wörter oder Wortteile). In einem Vorverarbeitungsschritt wird dein Eingabetext mithilfe der Tokens in Zahlen verwandelt, hinzu kommen Zahlen, welche ausdrücken, in welcher Reihenfolge die Tokens in der Eingabe vorkommen, welche Bedeutungen die einzelnen Tokens haben und welche dieser Tokens von ihrer Bedeutung her zusammengehören. All diese Zahlen zusammen bilden die Eingangswerte, welche von mehreren (nacheinander geschalteten) neuronale Netzen verarbeitet werden. Am Ende dieser Verarbeitungskette werden viele Zahlen gleichzeitig ausgegeben, konkret eine Zahl für jedes Token im Wörterbuch. Jede dieser Zahlen stellt die Auswahl-Wahrscheinlichkeit für das betreffende Token dar. Für den letzten Schritt werden nur diejenigen Tokens mit der grössten Auswahl-Wahrscheinlichkeit berücksichtigt. Aus Sicht der neuronalen Netze stellt diese Token-Auswahl diejenigen Eingabetext-Fortsetzungen dar, welche am besten zu den Texten passen, mit welchen trainiert wurde. Mit einem „gezinkten“ Würfel wird schliesslich ein Token aus der Token-Auswahl zufällig ausgewählt. „Gezinkt“ bedeutet hierbei, dass Tokens mit einer höheren Auswahl-Wahrscheinlichkeit eine grössere Chance bekommen, gewählt zu werden.

Details zur Temperatur-Einstellung bei KI-Chatbots (bei Interesse anklicken)
🤖 KI im Allgemeinen

Die Aussage im Auftrag ist für neuronale Netze formuliert, trifft aber auch für die meisten anderen KI-Systeme zu.
✍ Auftrag
  1. Ersetze im Text die 🤖 in den [🤖] durch folgende Wörter, welche du natürlich grammatikalisch an den Text anpasst:
    Ausgabe, Eingabe, Gewicht, Training Set.
    ⚠️ Jedes Wort kann hier nur einmal verwendet werden, die [ ] sollten stehen gelassen werden, dann ist auch nach dem Ausfüllen klar, wo die Lücke war.

Loading ⌛

1.2 Trainineren

Training Fisch-NN 3)
🐟 Fisch-NN

Im Trainingsmodus werden für das Training des Fisch-NN sogenannte „Samples“ verwendet. Jedes Sample bezeichnet einen Fisch. Ein Sample besteht aus den Eingangswerten des Fischs und seinem desired Output, d.h. dem gewünschten Ausgangswert, welchen das Fisch-NN idealerweise produzieren sollte. Das Fisch-NN berechnet für jeden Fisch im Training Set einen Ausgangswert und vergleicht diesen mit dem zugehörigen desired Output. Aus der Differenz wird ein Fehler berechnet und basierend darauf werden die Gewichte angepasst.

Das Fisch-NN lernt dabei nicht die einzelnen Samples im Training Set auswendig, es erlernt einen ungefähren Zusammenhang zwischen den Eingangsgrössen und dem desired Output (die rote decison Boundary in der Abbildung).
💬 KI-Chatbot

Im Trainingsmodus wird ein KI-Chatbot mit öffentlichen Texten aus dem Internet, redaktionellen Texten (Zeitschriften, Büchern etc.) und vergangenen Nutzerdialogen sowie Eingaben und Textbeurteilungen von Menschen trainiert. Das Training wird in mehreren unterschiedlichen Phasen durchgeführt. Dabei werden die Texte nicht auswendig gelernt, es wird gelernt, wie ein Text typischerweise fortgesetzt wird.

In der ersten Trainingsphase (dem Pre-Training) werden so viele Textdaten verwendet, wie möglich. Es wird jeweils eine Textpassage dem KI-Chatbot eingegeben. Daraufhin gibt der KI-Chatbot für jedes Token eine Zahl aus, welche als Auswahl-Wahrscheinlichkeit angesehen wird. Der entsprechende desired Output sieht so aus, dass das tatsächlich im Text als Nächstes vorkommende Token die Auswahl-Wahrscheinlichkeit 100% trägt und alle anderen Tokens die Wahrscheinlichkeit 0%. Basierend auf der Abweichung der Ausgabe des KI-Chatbots vom desired Output werden die Gewichte angepasst. Diese Trainingsphase dauert lange (Monate) und macht den Löwenanteil des Stromverbrauchs für das Training eines KI-Chatbots aus.

Danach folgt die zweite Trainingsphase, das Fine-Tuning, welches in mehreren Schritten vollzogen wird. Das Fine-Tuning wird mit deutlich kleineren, von Menschen handverlesenen und speziell für diesen Zweck erstellten Text-Datensätzen durchgeführt. Es lässt sich daher schneller (Tage) mit geringerem Stromverbrauch realisieren. Jedoch ist das Erstellen dieser Datensets aufwändig und zeitintensiv.

Details zum Fine-Tuning (bei Interesse anklicken)
🤖 KI im Allgemeinen

Die Aussage im Auftrag ist für neuronale Netze formuliert, trifft aber auch für die meisten anderen KI-Systeme zu.
✍ Auftrag
  1. Ersetze im Text die 🤖 in den [🤖] durch folgende Wörter, welche du natürlich grammatikalisch an den Text anpasst:
    Ausgabe, Gewicht, Training Set.
    ⚠️ Jedes Wort kann mehrfach vorkommen, die [ ] sollten stehen gelassen werden, dann ist auch nach dem Ausfüllen klar, wo die Lücke war.

Loading ⌛


2. Herausforderungen

💡 Das Konstruieren, Trainieren und Anwenden einer KI ist in der Praxis mit zahlreichen Herausforderungen verbunden. Diese werden in den folgenden vier Unterkapiteln genauer vorgestellt.

2.1 Datensatz zusammenstellen

Fisch Datensatz 5)
🐟 Fisch-NN

Für das Training und das Beurteilen des Fisch-NN müssen Fische beider Fischsorten (Lodde und Hering) berücksichtigt werden, welche alle in der Natur vorkommenden Werte aller Eingangsgrössen abdecken (in der Abbildung sind einige Fische aus dem Fisch-NN Datensatz dargestellt).
💬 KI-Chatbot

Für das Training eines KI-Chatbots, der freundlich und qualitativ hochwertig antworten soll, werden freundliche und qualitativ hochwertige Texte benötigt. Wird ein KI-Chatbot mehrheitlich mit fremdenfeindlichen Texten trainiert, so wird er auf die meisten Fragen mit fremdenfeindlichen Aussagen antworten.

Für das Pre-Training des dafür genutzen, riesigen neuronalen Netzes wird eine Unmenge von Texten benötigt. Werden zu wenige Texte verwendet tendiert ein so grosses neuronales Netz dazu, die Trainingsdaten auswendig zu lernen (das als Overfitting bezeichnet). Die benötigte Textmenge ist zu gross, um diese von Hand zusammenstellen oder aussortieren zu können. Daher kommen auch viele qualitativ schlechte Texte beim Pre-Training zum Einsatz. Es ist unklar, ob alle geeigneten, von Menschen verfassten digital verfügbaren Texte genügen, um in Zukunft weitere noch umfangreichere KI-Chatbots zu trainieren. Hinzu kommt, dass Menschen mittlerweile auch von KI-Chatbots verfasste Texte im Internet veröffentlichen, welche somit voraussichtlich auch für das Training zukünftiger KI-Chatbots berücksichtigt werden. Es ist ebenso unklar, inwieweit sich die Qualität der KI-Chatbots verringern wird, wenn für das Training zusätzlich eine grössere Menge KI-generierte Texte zum Einsatz kommt.

Im Fine-Tuning Prozess wird versucht, den KI-Chatbots mit relativ wenigen, qualitativ hochwertigen Texten „nachträglich“ ein gewünschtes Verhalten einzuimpfen. Leider ist davon auszugehen, dass die Menschen, welche diese Daten zusammenstellen, häufig schlecht bezahlt (z.B. wenige Franken Stundenlohn) und leistungstechnisch unter Druck gesetzt werden. Hinzu kommt, dass sie insbesondere auch unerwünschte, zum Teil sehr belastende Inhalte sichten und kennzeichnen müssen. Seit der Veröffentlichung leistungsfähiger KI-Chatbots ist davon auszugehen, dass KI-Chatbots von den Betroffenen genutzt werden, um die Arbeit schneller und erträglicher erledigen zu können. Das würde bedeuten, dass auch im Fine-Tuning die KI manchmal von einer KI trainiert wird.
🤖 KI im Allgemeinen

⚠️ Ein neuronales Netz kann nur so gut sein, wie die Daten, mit welchen es trainiert wurde. Wird ein neuronales Netz mit Müll trainiert, wird es Müll produzieren. In den meisten Fällen braucht es Fachwissen aus dem Anwendungsbereich, um gute Datensätze zusammen stellen zu können.
✍ Auftrag

Im nachfolgendem Programm wird ein Fisch-NN nur mit „kleinen“ Fischen trainiert (Training Set links). Geprüft, wie gut das Fisch-NN ist, wird jedoch mit kleinen und grossen Fischen (Validation Set rechts).

  1. Starte das Programm und halte im Textfeld fest, wie du die Qualität dieses Fisch-NN beurteiltst.
  2. Halte ebenso im Textfeld fest, was dies für das Zusammenstellen von Datensets für das Trainieren und Beurteilen von neuronalen Netzen im Allgemeinen bedeutet.

Loading ⌛

2.2 Eingangsgrössen finden

Mögliche Eingangsgrössen Fisch-NN 6)
🐟 Fisch-NN

Das Fisch-NN unterscheidet verschiedene Fischarten anhand von Eingangswerten (z.B. Gewicht und Lichtreflexivität, wie in der Abbildung). Wenn die Eingangsgrössen die Unterschiede zwischen den zu unterscheidenden Fischsorten gut abbilden, so sind die Eingangsgrössen gut gewählt. Sind die Eingangsgrössen unpassend gewählt, versagt jedes noch so gute Verfahren. (Z.B. können die Fische schlecht aufgrund der Uhrzeit den aktuellen Lottozahlen zum Zeitpunkt der Messung unterschieden werden.)

Welche und wie viele Eingangsgrössen es braucht, kann in der Regel nicht im Voraus gesagt werden. Die Eingangsgrössen sollten sich ergänzen, zu wenige führen zu schlechten Resultaten und zu viele können das Lernen erschweren.
💬 KI-Chatbot

Neuronale Netze können nur Zahlen verarbeiten. Dazu wird der Eingabetext in sogenannte „Tokens“ unterteilt. Das können kurze Wörter, Wortteile von längeren Wörtern und verbleibende Buchstaben oder Satzzeichen sein. Jedes Token wird durch eine andere Zahl dargestellt, um den Text vollständig in Zahlen zu verwandeln. Doch damit nicht genug, für jedes Token werden noch mehrere weitere Zahlen als Eingangwerte mit eingegeben (hierbei wird von „Embedding“ gesprochen). Diese zusätzlichen Zahlen teilen dem neuronalen Netz mit, welche Bedeutung die einzelnen Tokens haben und was somit das Thema des eingegebenen Texts sein könnte. Wie viele und welche Tokens es braucht und welche Embeddings geeignet sind, ist aktuelles Forschungsthema.

Details zu Tokens und Embedding (bei Interesse anklicken)

Warum können KI-Chatbots verschiedene Sprachen? (bei Interesse anklicken)
🤖 KI im Allgemeinen

⚠️ Die Wahl guter Eingangsgrössen ist für den Erfolg einer KI entscheidend. In den meisten Fällen braucht es Fachwissen aus dem Anwendungsbereich dazu, um gute Eingangsgrössen finden zu können. Z.B. kann eine Fischfachperson sicherlich gute Hinweise geben, anhand von welchen Eigenschaften sich verschiedene Fischsorten unterscheiden lassen oder eine Person aus dem Bereich der Sprachwissenschaften kann wertvolles Fachwissen für das Finden von Tokens und Embeddings beisteuern.
✍ Auftrag

In diesem Auftrag testest du das Umwandeln eines Texts in Tokens und den zugehörigen Zahlen genauer an.

  1. Gib dort einen beliebigen Text in das erste Textfeld ein. Weiter unten siehst du ein Fenster mit den bunt dargestellten Tokens. Wenn unten an den Tokens auf „Token ID“ klickst, werden dir die zugehörigen Tokennummern angezeigt.
  2. Kopiere einen Text und die zugehörigen Tokennummern in das Textfeld. Loading ⌛
  3. Der folgende Text besteht aus dem ersten Token im Vocabular von GPT-4o und dem letzten Token im Vocabular von GPT-4o. Gib den Text in Tokenizer für GPT-4o ein und lasse dir die Token-IDs anzeigen. Dann siehst du, wie gross das Vokabular von GPT-4o ist.
    ! cocos

2.3 Fehlerfunktion bestimmen und interpretieren

Fisch-NN Fischklassifikation 7)
🐟 Fisch-NN

Das Fisch-NN wird aufgrund der Anzahl falsch klassifizierter Fische beurteilt, jedoch mit einer anderen Fehlerfunktion trainiert.8).

Das Fisch-NN produziert eine Zahl zwischen 0 und 1 als Ausgangswert. Für die Beurteilung des Fisch-NN wurde zuerst festgelegt, dass alle Ausgangswerte < 0.5 als Hering und alle ≥ 0.5 als Lodde erkannt werden. Durch das Training konnte erreicht werden, dass rund 90 % aller Fische richtig erkannt werden, was jedoch als „unbrauchbar“ eingeschätzt wurde. Ein brauchbares Ergebnis wurde erst mit der Regel „< 0.3 ⇒ Hering, > 0.7 ⇒ Lodde und alles dazwischen ⇒ keine Ahnung“ erreicht. Diese Regel ist in der Abbildung dargestellt. Fische, welche in der blauen Region zu liegen kommen, werden fehlerfrei als Hering und in der grünen Region als Lodde erkannt. Fische in der weissen „keine Ahnung“ Region werden nicht klassifiziert (25% der Fische).

Für das Training wird der vom neuronalen Netz produzierte Ausgangswert mit dem gewünschten Ausgangswert (desired Output, für Hering 0, für Lodde 1) verglichen und daraus der Fehlerwert „MSE“ berechnet. Der MSE bestraft dabei grosse Abweichungen viel stärker als kleine. Inwieweit sich diese Fehlerfunktion wirklich zum Unterscheiden von Fischen eignet, ist eine berechtigte Frage.
💬 KI-Chatbot

Bei einem KI-Chatbot wird beurteilt, wie gut dieser Texte verstehen und Aufgaben richtig lösen kann. Trainiert wird dieser jedoch hauptsächlich mit anderen Fehlerfunktionen.

Die grossen KI-Chatbot-Hersteller testen und vergleichen ihre und andere KI-Chatbots mithilfe von verschiedenen „Benchmarks“ d.h. Sammlungen von Aufgaben, welche ein KI-Chatbot lösen muss. Es gibt Benchmarks, die aus Multiple-Choice Aufgaben aus verschiedenen Wissenschaften bestehen (z.B. der MMLU-Benchmark), solche, die Text-Aufgaben aus der Mathematik umfassen (z.B. der GSM8K-Benchmark) oder andere, die das Textverständnis verschiedener Texte prüfen (z.B. der DROP-Benchmark). Da diese Benchmarks jedoch mittlerweile fast schon zu einfach sind, für die immer besser werdenden KIs, gilt (aktuell) das Humanity's Last Exam als ultimative Herausforderung. Dieser Benchmark besteht ausschliesslich aus Fragen, an welchen sich auch menschliche Experten schnell einmal die Zähne ausbeissen.

Beliebt ist auch das Chatbot Arena Leaderboard, welche eine stets aktuelle „Hitparade“ der KI-Chatbots aufgrund von Nutzerwertungen zeigt. Wenn du selber zum Leaderboard beitragen möchtest, gehe in die Chatbot Arena und gib einen Prompt ein. Dieser wird dann von zwei zufällig gewählten KI-Chatbots beantwortet. Danach wählst aus, welche Antwort du besser findest. Am Ende wird aufgelöst, welche zwei KI-Chatbots du befragt hattest.

Details zu den verwendeten Fehlerfunktionen (bei Interesse anklicken)
🤖 KI im Allgemeinen

⚠️ Ein neuronales Netz löst kein Problem direkt. Um ein gewünschtes Problem zu lösen, wird während des Trainings stattdessen eine Fehlerfunktion minimiert. Passt die Fehlerfunktion zum Problem, kann ein gutes Resultat erzielt werden. Passt diese weniger, wird vielleicht irgendetwas anderes gelernt. Daher sollten die Resultate kritisch beurteilt werden. In den meisten Fällen braucht es Fachwissen aus dem Anwendungsbereich, um aussagekräftige Beurteilungskriterien und passende Fehlerfunktionen zu finden.
✍ Auftrag

In diesem Auftrag schaust du dir das Chatbot Arena Leaderboard genauer an.

  1. Wie gut ist der KI-Chatbot den du normalerweise nutzt? Welches ist der aktuell stärkste KI-Chatbot? Trage die beiden KI-Chatbots mit der zugehörigen Platzierung ins Textfeld ein. Loading ⌛
  2. Trage selbst zur Chatbot Arena bei, indem du hier (du musst etwas nach unten scrollen zum Eingabefenster) zwei zufälligen KI-Chatbots eine Frage stellst und die bessere der beiden Antworten auswählst.

2.4 Modell wählen und trainieren

FischNN 9)
🐟 Fisch-NN

Als Fisch-NN wurde ein sogenanntes „Feedforward Neural Network“ mit zwei Input Neuronen, einem Output Neuron und einem Hidden Layer (eine Spalte Hidden Neuronen) verwendet (siehe Abbildung). Bereits mit drei Hidden Neuronen, was 11 Gewichten entspricht, konnten mit die besten Resultate erreicht werden. Das Training dauert auf einem normalen Laptop meist weniger als eine Minute.

Bei zu wenigen Hidden Neuronen (zwei oder eins) oder einem zu kurzen Training (zu wenige Epochen) kann der Zusammenhang nicht vernünftig erlernt werden. Bei zu vielen Hidden Neuronen kann speziell bei einem langen Training ein Overfitting d.h. „Auswendiglernen“ einzelner Fische beobachtet werden.
💬 KI-Chatbot

Auch für die grossen neuronalen Netze in einem KI-Chatbot werden typischerweise Feedforward Neural Networks wie beim Fisch-NN verwendet, einfach etwas grössere. Sie umfassen typischerweise mehrere Millionen Input und Output Neuronen (für die Darstellung aller Tokens im Wörterbuch mitsamt der zugehörigen Embeddings) und mehrere Hidden Layer. Insgesamt wird die Anzahl Gewichte grosser KI-Chatbots im Bereich von Milliarden geschätzt.

Eine Daumenregel besagt, dass rund 10 Mal mehr Trainingsbeispiele benötigt werden, als Gewichte, damit die Gefahr von Overfitting klein gehalten wird. Es wird vermutet, dass für die aktuellen, grossen KI-Chatbots bereits jetzt schon praktisch alle geeigneten digitalen Texte, welche die Menschheit bis dato produziert hat, benötigt wurden. Um solch grosse neuronale Netze mit so vielen Daten zu trainieren wird viel Rechengeschwindigkeit, Speicher, Strom und Zeit benötigt, was sehr teuer ist. Daher werden einerseits immer effizientere und günstigere Hardware entwickelt und andererseits für die Optimierung des Trainings tief in die Trickkiste gegriffen.

Details zum Training (bei Interesse anklicken)
🤖 KI im Allgemeinen

⚠️ Bei der Frage, welches neuronale Netz oder welches andere Verfahren erfolgversprechend ist und wie man das am besten trainiert, spielt das Fach- und Erfahrungswissen aus dem Bereich der KI eine entscheidende Rolle. Das Anwenden eines bereits trainierten neuronalen Netzes geht relativ schnell. Das Trainieren eines neuronalen Netzes ist deutlich aufwändiger und zeitintensiver, was vor allem bei sehr grossen neuronalen Netzen ist Gewicht fällt.
✍ Auftrag

In diesem Auftrag machst du dir ein Bild darüber, wie teuer das Training eines grossen KI-Chatbots wirklich ist.

  1. Recherchiere im Internet, auf welche Kosten das Training eines der grossen, aktuellen KI-Chatbots geschätzt wird (z.B. für ChatGPT, Gemini, DeepSeek, Grok, Claude, Llama, Mistral).
  2. Trage den Namen des KI-Chatbot und die Kostenschätzung in das Textfeld ein. Loading ⌛


3. Limitationen

💡 Es scheint Limitationen für KIs zu geben, welche nicht von der Anzahl der verfügbaren Daten, Rechenpower oder der verfügbaren Zeit abhängen. In den folgenden beiden Unterkapiteln wird auf zwei davon genauer eingegangen.

3.1 Nicht Fehlerfrei

Überlappende Klassen10)
🤖 KI im Allgemeinen

Es ist davon auszugehen, dass neuronale Netze (und KI im Allgmeinen) in vielen Bereichen relativ gute Resultate liefern werden, jedoch kaum je perfekte. Auch bei beliebig vielen Daten, Rechenpower und Trainingszeit, werden neuronale Netze in der Praxis ab und zu Fehler produzieren. Gründe dafür sind unter anderem die Folgenden.
  • Näherungen: Neuronale Netze sind Modelle, welche die Wirklichkeit nur näherungsweise beschreiben können, sie berechnen keine Lösungen exakt, sie nähern diese, so gut als mögich an. Die für das Training verwendeten Fehlerfunktionen, welche entscheiden, was gut und was schlecht ist, könnnen die wahre Natur der zu lösenden Probleme auch nur näherungsweise darstellen. Und schliesslich können die neuronalen Netze nicht mit unendlich vielen perfekten Daten trainiert werden, sondern nur mit endlich vielen Daten, meisst von nicht perfekter Qualität. Somit kann eine KI kein Problem direkt lösen, sondern nur die Näherung einer Lösung näherungsweise annähern.
  • Überlappende Klassen und Muster: Datensätze aus der realen Welt weisen praktisch immer Klassen oder Muster auf, welche zwar unterschiedlich sind, jedoch kaum voneinander getrennt werden können.
  • Seltene Klassen und Muster: Alle bekannten KI-Verfahren tendieren dazu seltene Klassen und Muster zu ignorieren.
🐟 Fisch-NN

Die Abbildung zeigt eine Region überlappender Klassen für das Fisch-NN. Fische in dieser Region, lassen sich nicht fehlerfrei eine Klasse zuordnen. Das seltene Klassen ignoriert werden, prüfst du im nachfolgenden Auftrag.
💬 KI-Chatbot

Texte zu Themen, zu welchen verschiedene Meinungen vorherrschen (z.B. zu „KI Fluch oder Segen“), könnten als „überlappende Muster“ und somit als Herausforderung für das Training von KI-Chatbots angesehen werden. Es kann durchaus sein, dass seltene Aussagen oder Meinungen im Training unter gehen und somit nicht von einem KI-Chatbot ausgegeben werden können.
✍ Auftrag

In diesem Aufrag untersuchst du, wie das Fisch-NN mit seltenen Klassen umgeht.

  1. Angenommen, der Fang eines Herings wäre ein seltenes Ereignis. Dann könnten typische Training- und Validationsets wie im Programm dargestellt aussehen. Kann das neuronale Netz trotzdem den Hering erkennen? (Alles grün Hinterlegte wird als Lodde erkannt, alles blau Hinterlegte als Hering.)
    Klicke auf den Button ▶Run und versuche dein Glück!
  2. Wie sieht das Resultat aus? Loading ⌛

3.2 Black Box

Neuronales Netz als Black Box 11)
🤖 KI im Allgemeinen

Das Wissen eines neuronalen Netzes ist in seinen Gewichten gespeichert. Diese Gewichte sind im Wesentlichen mehrere, mehr oder weniger miteinander verbundene Zahlen. Damit lässt sich zwar gut aus einer Eingabe eine Ausgabe berechnen, jedoch lässt sich aufgrund dieser Gewichte kaum herausfinden, warum ein neuronales Netz eine bestimmte Ausgabe ausgibt. Nur schon deswegen sind neuronale Netze nicht für jeden Anwendungsbereich geeignet. Es gibt zwar andere KI-Verfahren, wie z.B. statistische Verfahren, welche besser interpretiert werden können, jedoch zeigen diese in einigen Anwendungsgebieten deutlich schlechtere Resultate.
🐟 Fisch-NN

Warum genau das Fisch-NN einen Fisch als Hering oder Lodde einordnet, lässt sich kaum aus den verwendeten 11 Gewichten ablesen.
💬 KI-Chatbot

Neuronale Netze (mit Milliarden oder gar Billionen von Gewichten) bilden den Hauptbestandteil moderner KI-Chatbots. Somit erscheint es als unmöglich, aufgrund der Gewichte darauf schliessen zu können, warum zu einem gegebenen Eingabetext gerade der tatsächlich ausgegebene Ausgabetext ausgegeben wird.
✍ Auftrag

In diesem Auftrag überlegst du dir, worin das Problem einer Black Box bestehen kann.

  1. Überlege dir eine Anwendung für eine künstliche Intelligenz, bei welcher es ungünstig wäre, wenn die KI ihre Entscheidung oder ihre Ausgabe nicht begründen könnte (wie z.B. eine KI die selbständig entscheidet, ob du für einen Job angestellt wirst oder nicht).
  2. Schreibe dein Beispiel in das Textfeld. Loading ⌛


4. Fazit

Wir Menschen wählen das KI-Modell, die Fehlerfunktion und die Daten für das Training aus. Somit sind wir auch verantwortlich dafür, was eine KI macht. Aber egal wie viel Mühe wir uns dabei auch geben und egal wie gut die KI am Ende funktioniert, eine KI wird vermutlich immer dann und wann Fehler produzieren. Es stellt sich die Frage, wie wir damit umgehen wollen.

⚠️ Natürlich lassen sich noch ganz andere Fazits zu KI im Allgemeinen ziehen und weitere, interessante Fragen aufwerfen. Hier eine kleine Auswahl.

  • Nachhaltigkeit: Wird der enorme Energiebedarf grosser neuronaler Netze eher dazu führen, den Planeten zu „verbrennen“ oder kann die erhöhte Effizienz der KI den globalen Energiebedarf senken?
  • Entwicklung: Werden KIs uns soviel abnehmen, dass wir kaum mehr selbst etwas lernen und in der Folge „verdummen“ oder befreien uns die KIs von allem Lästigen, sodass wir uns noch positiver entwickeln können?
  • Entscheidungsfreiheit: Werden wir künftig entscheiden können, ob wir etwas, dass eine KI viel schneller und besser erledigen kann, trotzdem selbst machen können (z.B. weil es uns Freude macht) oder dürfen wir nur noch das machen, was die KI für uns übrig lässt?
✍ Auftrag

In diesem Auftrag setzt du dich mit dem Fazit kritisch auseinander.

  1. Überlege dir die folgenden Punkte oder noch besser diskutiere die folgenden Punkte mit einer Kollegin oder einem Kollegen und halte das Wichtigste davon im Textfeld fest.
    • Bist du mit dem Fazit einverstanden?
    • Sollten grosse KI-Firmen (z.B. OpenAI oder Google) für das, was ihre KI-Chatbots produzieren, angeklagt werden können?
    • Müssen wir Entscheide, welche eine KI fällt, akzeptieren oder darf ein Mensch den Entscheid einer KI vor Gericht anfechten?
    • Welche KI-Anwendungen sollten verboten werden?
    • Wie sieht ein wünschenswertes „Zusammenleben“ von KI und Menschen aus?
    • Wie sieht ein Lernen mit KI aus, bei dem dich die KI „dümmer“ macht? Wie sieht ein Lernen mit KI aus, bei dem dich die KI „schlauer“ macht?

Loading ⌛


Eigene Notizen

Loading ⌛

2)
Eigene Darstellung CC0 1.0, der Fisch ist übernommen: Hering [Citron, Public Domain, Clupea harengus by Citron on wikimedia
3) , 5)
Eigene Darstellung CC0 1.0, die Fische sind übernommen: Hering [Citron, Public Domain, Clupea harengus by Citron on wikimedia; Lodde [Fb78, Public Domain]Mallotus villosus by Fb78 on wikimedia.
4)
Mit den Benotungszahlen der Menschen können aus mathematischen Gründen die Gewichte im KI-Chatbot nicht direkt angepasst werden (nicht ableitbarer Fehlerwert). Daher braucht es den Umweg über die Benotungs-KI. Grob gesagt werden für das Training unter anderem die Abweichung der aktuellen Note von der Maximalnote als Grundlage genommen, die Benotungs-KI mit dem KI-Chatbot zu einem einzigen neuronalen Netz „verschmolzen“ und daraufhin die Gewichte im KI-Chatbot angepasst.
6)
Eigene Darstellung CC0 1.0, der Fisch ist übernommen: Lodde [Fb78, Public Domain]Mallotus villosus by Fb78 on wikimedia.
7) , 9)
Eigene Darstellung, CC0 1.0
8)
Der Grund ist mathematischer Natur, die Fehlerfunktion für das Training des Fisch-NNs muss ableitbar sein.
10) , 11)
eigene Darstellung, CC0 1.0