Navigation: 🐟 Teil 1 - 🐟 Teil 2 - 🐟 Teil 3 - 🐟 Teil 4 - 🐟 Zusatzkapitel Loading ⌛Loading ⌛
🎯 In dieser Reihe erfährst du, wie eine künstliche Intelligenz automatisiert Daten auswertet und beurteilt. Dazu begibst du dich auf raue See.
👩🦰 Du hilfst Sigrún beim Bau eines Fischsortierapparats. Dafür hattest du die Längen (in cm) von 50 Hering und 50 Lodde vermessen und nebenstehendes Histogramm erstellt. Alles links vom Threshold (rote Linie) wird vom Apparat als Lodde angesehen, alles rechts davon als Hering. Gemäss nebenstehenden Histogramm arbeitet der Apparat mit einem Threshold zwischen 20 cm und 25 cm fehlerfrei.
😭 Natürlich ist das zu schön, um wahr zu sein. Wie du bemerkt hattest, fehlen kleine Heringe im Histogramm!
💡 Daher fragst du Sigrún noch einmal um 50 Hering und 50 Lodde an, welche sie dir prompt zukommen lässt.
Für das untenstehende Histogramm hast du bereits dein altes Histogramm aus dem letzten Kapitel mit den zusätzlichen 50 Heringen und 50 Lodde ergänzt (jetzt sind 200 Fische darin). Nun sieht das Histogramm ungefähr so aus, wie man das erwarten würde.
⚠️ Wie du gesehen hast, brauchst du für eine brauchbare Klassifikation eine gute Datengrundlage. Ohne repräsentative Datengrundlage wird jeder noch so „intelligente“ Apparat versagen.
😭 Leider lassen sich in unserem Beispiel Hering und Lodde nicht mit einer Messgrösse (der Länge) genügend voneinander unterscheiden.
💡 Aber vielleicht lassen sich Hering von Lodde mithilfe von mehreren Messgrössen besser unterscheiden als mit nur einer. Du nimmst daher erst einmal eine zweite Messgrösse hinzu. Auf eine dritte, vierte usw. verzichtest du vorerst, um das Ganze nicht zu kompliziert zu machen.
⚠️ Ein Fischsortierapparat, der Hering und Lodde unterscheiden soll, braucht gut gewählte Messgrössen als Entscheidungsgrundlage. Wenn die Fischsorten aufgrund der Messgrössen nicht oder nur schlecht voneinander getrennt werden können, wird jeder noch so „intelligente“ Apparat versagen.
📐✏️ Da du nun von jedem Fisch zwei Messgrössen hast, trägst du die Fische nicht mehr in ein Histogramm, sondern in ein Punktediagramm ein. Dazu werden wie in der Abbildung rechts auf einem Blatt zwei Achsen eingezeichnet. Jede Achse entspricht einer Messgrösse. Von jedem Fisch werden die beiden Messgrössen gemessen und der Fisch gemäss seinen Messwerten im Punktediagramm eingetragen.
Für den nächsten Auftrag hast du bereits zufällig je 12 Heringe und 12 Lodde ausgewählt, vermessen und in das untenstehende Punktediagramm eingetragen - die Heringe als blaue x
, die Lodde als grüne ◯
.
🙂 Sieht gar nicht so schlecht aus, auf den ersten Blick lassen sich die zwei Fischsorten fast überall gut voneinander trennen, du hast vernünftige Messgrössen gewählt!
▶Run
kannst du die Linie wieder löschen. Versuche eine Linie / Kurve zu zeichnen, welche Hering von Lodde möglichst gut trennt.▶Run
und zeichne nun eine Linie, welche die Trainings- UND die Validationsfische möglichst gut klassifiziert. Halte wiederum fest, wie viele Trainings- und wie viele Validationsfische falsch zugeordnet werden. Loading ⌛
🤔 Aber wie genau sieht nun eine Linie aus, welche Heringe von Lodde möglichst gut trennt? Und wie gross ist der Fehler, der dabei entsteht?
👩🦰 Wie es mit Sigrún und dem Fischsortierapparat weitergeht, erfährst du im 🐟 Teil 3
Loading ⌛