kNN-Algorithmus: Was wird blau, was orange?
Der PageRank-Algorithmus ist einer der Grundsteine, warum sich Google 1999 als Suchmaschine gegen die Konkurrenz durchsetzen konnte. Die Idee ist, einer Webseite eine desto höhere Relevanzbewertung zu geben (genannt der „PageRank“), je mehr eingehende Links von anderen Webseiten auf sie verweisen. Ein solcher Link wurde dabei umso höher gewichtet, je besser der PageRank der Seite war, von der er stammte. Hierzu mussten das Web (in der Grafik beispielhaft bestehend aus vier Webseiten) und seine Links (Pfeile in der Grafik) in eine „Transitionsmatrix“ codiert werden. Durch deren mehrfache Potenzierung wird das Verhalten fiktiver, zufällig auf Links klickender Surfer („random surfer“) simuliert, deren Aufenthaltswahrscheinlichkeiten schließlich konvergieren und als „PageRanks“ interpretiert werden.
Interaktiv: K-Nearest-Neighbours-Algorithmus in Aktion