Data-Screening (Anfänger)

Neue Frage »

Auf diesen Beitrag antworten »
phillyinfo Data-Screening (Anfänger)

Hi, ich bin leider noch nicht wirklich erfahren in der Praktischen Informatik. Von daher bin ich erstmal auf der Suche nach einfachen Lösungen.

Ich habe es bereits geschafft mit R Daten von diversen Websites zu screenen. Den Code habe ich bereits auch mehr oder weniger verstanden und kann diesen auch gerne in einem weiteren Beitrag hochladen, da er nur 3 Zeilen beinhaltet.

Mein Problem ist nun, dass ich Daten von einer bestimmten öffentlichen Homepage brauche. Dort funktioniert der Code aber nicht. Ich weiß wirklich nicht wovon ich spreche, aber mir ist aufgefallen, dass dort (#shadowroots) implementiert sind. Ich vermute, dass es deswegen nicht funktioniert.

Gibt es eine Möglichkeit dennoch an die Daten zu kommen?

Liebe Grüße
 
Auf diesen Beitrag antworten »
eulerscheZahl

Was soll #shadowroots sein? Ein css Attribut?
Wenn die gewünschten Daten nicht im Quellcode sind, dann vermutlich, weil sie mit Javascript erst später geladen werden. Um das zu beurteilen, bräuchte ich einen Link zur Seite.
Öffne die Entwicklertools (F12 für Firefox und Chrome), dort solltest du die Daten finden können (nur zur Kontrolle gedacht).
Wenn das der Fall ist, kommst du mit einem einfachen Quellcode auslesen nicht weit. Das einfachste ist in solchen Fällen, einen richtigen Browser zu verwenden. C# hat z.B. eine WebBrowser Komponente, die im Hintergrund den Internet Explorer verwendet. Da muss man sich nicht selbst um das Ausführen von Javascript kümmern.
Auf diesen Beitrag antworten »
phillyinfo

Die Seite heißt fanteam.com

Um auf die gewünschte Tabelle zuzugreifen müsste ich allerdings eingeloggt sein.

Und ja ich finde die gewünschte Dateien über F12.

Was ich machen könnte ist den Quellcode zu speichern und hochzuladen.

Liebe Grüße
Auf diesen Beitrag antworten »
eulerscheZahl

Ach, dann ist das Einloggen dein Problem?
Mit R kenne ich mich überhaupt nicht aus, aber prinzipiell ist das natürlich möglich: entweder schickt man das login oder einen session cookie mit.
 
Auf diesen Beitrag antworten »
phillyinfo

Nein, das Einloggen ist nicht mein Problem.

Ich konnte bis vor kurzer Zeit noch mit Hilfe eines Tools über xpath Pfade, die Daten aus den Tabellen herauslesen und in einem Excelsheet speichern.

Habe diesen Vorgang auch automatisiert.

Nun ist mir aufgefallen, dass in dem xpath eben #shadowroot vorkommt. Und seit dem funktioniert das Auslesen der Daten nicht mehr.

Daher bin ich auf der Suche nach einer Alternative.

Liebe Grüße
 
Neue Frage »
Antworten »


Verwandte Themen

Die Beliebtesten »
Die Größten »
Die Neuesten »