kNN-Algorithmus: Was wird blau, was orange?
Der Naive-Bayes-Algorithmus ist ein Machine-Learning-Algorithmus. Er wird zum Beispiel in Spam-Filtern von E-Mail-Programmen verwendet. Die App illustriert die dahinterstehende Logik an einem Beispiel: Wir haben eine Menge von Trainingsdaten (farbige Punkte) mit jeweils zwei kategorialen Merkmalen (x- und y-Werte mit den jeweiligen Ausprägungen „kleiner 0“ und „größer 0“). Jeder Punkt ist einer von zwei Kategorien zugeordnet (blau oder orange). Der Naive-Bayes-Algorithmus beantwortet mittels einer einfachen Rechnung die Frage: „Mit welcher Wahrscheinlichkeit ist ein neuer Punkt, der beispielsweise die Merkmalskonstellation „x und y beide kleiner 0″ aufweist, ein orangefarbener oder ein blauer Punkt?“ Diese Wahrscheinlichkeiten sind in der App links oben in jedem der vier Quadranten dargestellt.
Das Verfahren heißt „naiv“, da es vereinfachend annimmt, dass die einzelnen Merkmale stochastisch unabhängig auftreten (was in der Regel nicht der Fall ist, die Treffsicherheit jedoch oft kaum beeinträchtigt).
Interaktiv: K-Nearest-Neighbours-Algorithmus in Aktion