KNN-Algorithmus

Neue Frage »

Auf diesen Beitrag antworten »
Fabi200 KNN-Algorithmus

Guten Tag,

ich beschäftige mich mit den K-nearest-neighbour Algorithmus und habe hierzu noch die ein oder andere Frage.

Ich versuche momentan diesen Algorithmus als Prognose für z.B. Aktienkurse zu implementieren. Leider habe ich eine Informationslücke bezüglich des theoretischen Verständnisses.

Grundsätzlich ist mir bewusst das sich die Prognose auf Basis von entsprechenden Variablen (z.B. Preis) stützt. Hierbei wird durch eine geeignete Vektor-Norm (z.B. euklidische) aus den Werten der nächsten Nachbarn ein entsprechender Wert für den zukünftigen Tag gebildet.

Was mir nicht ganz einleuchtet wie soll man die nächsten Nachbarn ausfindig machen, wenn für den zukünftigen Tag keine Werte existieren.

Ein Beispiel: Nehmen wir mal an für das Jahr 2016-2017 besitzen wir eine Datenbank mit den monatlichen Kurswerten der Aktie. Inwiefern ist es jetzt möglich für Januar 2018 den Aktienkurs zu prognostizieren? Wie arbeitet der KNN, sprich woher nimmt er die Daten um für Januar 2018 Werte zu prognostizieren?

Mit freundlichen Grüßen
Fabi 200
 
Auf diesen Beitrag antworten »
as_string RE: KNN-Algorithmus

Ich hab zwar keine Ahnung, wie man das bei Aktien macht, aber letztlich hängt es von den verwendeten Variablen ab. Einfach nur den Absolutwert des Preises zu nehmen, wird Dir da nicht helfen.
Wenn Du aber den Preis im Vergleich zum Preis des Vortag und im Vergleich zur 200-Tage-Linie als zwei Variablen hast, dann vielleicht noch die aus dem Preis pro Aktie mal Gesamtzahl der Aktien berechnete Marktkapitalisierung im Vergleich zum aktuellen Umsatz und Gewinn betrachtest, dann kannst Du mit diesen 4 Variablen schauen, ob Du in historischen Daten (auch von anderen Firmen) ähnliche Werte findest und ob diese in der Folge eher gestiegen oder gefallen sind (nimm zb 9 nächste Nachbarn und schau Dir von diesen den Kursverlauf nachher an).
Der Trick ist ja gerade, von den bekannten Merkmalen (also dem Merkmalsvektor), die natürlich schon alle bekannt sein müssen, auf eine Klassifizierung zu schließen, die im Moment noch nicht bekannt ist, aber in den Trainingsdaten bekannt ist. Dabei muss man natürlich Merkmale betrachten, die für die Fragestellung eine Relevanz erwarten lassen. Wenn Du nur den aktuellen Preis betrachtest, sagt der nicht viel aus, nur wenn Du ihn zu anderen Dingen (Preis Vortag, Durchschnittspreis der letzten 30 Tag, der letzten 200 Tage, etc, Unternehmensdaten...) in Bezug setzt.

Gruß
Marco
 
Neue Frage »
Antworten »


Verwandte Themen

Die Beliebtesten »
Die Größten »
Die Neuesten »