kNN-Algorithmus: Was wird blau, was orange?
Der K-Nearest-Neighbours-Algorithmus ist ein einfacher und intuitiver Machine-Learning-Algorithmus, der auf Basis vorhandener Trainingsdaten (hier: blaue und orangefarbene Punkte) Prognosen über die Klassifizierung neuer Daten (blau oder orange?) trifft. Dies tut er, indem er im Umfeld eines neuen Datenpunktes eine bestimmte Anzahl (k) der nächsten Nachbarpunkte betrachtet, deren überwiegende Kategorie ermittelt und diese dem neuen Datenpunkt zuweist. Dadurch teilt sich der „Datenraum“ auf in blaue und orangefarbene Gebiete (alle neuen Datenpunkte, die in ein blaues Gebiet fallen, erhalten die Kategorie „blau“ usw.).
Interaktiv: K-Nearest-Neighbours-Algorithmus in Aktion