Registrierung Kalender Mitgliederliste Teammitglieder Suche Häufig gestellte Fragen Zur Startseite

Informatiker Board » Themengebiete » Praktische Informatik » Data-Screening (Anfänger) » Hallo Gast [Anmelden|Registrieren]
Letzter Beitrag | Erster ungelesener Beitrag Druckvorschau | An Freund senden | Thema zu Favoriten hinzufügen
Neues Thema erstellen Antwort erstellen
Zum Ende der Seite springen Data-Screening (Anfänger)
Autor
Beitrag « Vorheriges Thema | Nächstes Thema »
phillyinfo
Grünschnabel


Dabei seit: 20.01.2017
Beiträge: 3

Data-Screening (Anfänger) Auf diesen Beitrag antworten Zitatantwort auf diesen Beitrag erstellen Diesen Beitrag editieren/löschen Diesen Beitrag einem Moderator melden       Zum Anfang der Seite springen

Hi, ich bin leider noch nicht wirklich erfahren in der Praktischen Informatik. Von daher bin ich erstmal auf der Suche nach einfachen Lösungen.

Ich habe es bereits geschafft mit R Daten von diversen Websites zu screenen. Den Code habe ich bereits auch mehr oder weniger verstanden und kann diesen auch gerne in einem weiteren Beitrag hochladen, da er nur 3 Zeilen beinhaltet.

Mein Problem ist nun, dass ich Daten von einer bestimmten öffentlichen Homepage brauche. Dort funktioniert der Code aber nicht. Ich weiß wirklich nicht wovon ich spreche, aber mir ist aufgefallen, dass dort (#shadowroots) implementiert sind. Ich vermute, dass es deswegen nicht funktioniert.

Gibt es eine Möglichkeit dennoch an die Daten zu kommen?

Liebe Grüße
20.01.2017 17:13 phillyinfo ist offline Beiträge von phillyinfo suchen Nehmen Sie phillyinfo in Ihre Freundesliste auf
eulerscheZahl eulerscheZahl ist männlich
Foren Gott


Dabei seit: 04.01.2013
Beiträge: 2.859

Auf diesen Beitrag antworten Zitatantwort auf diesen Beitrag erstellen Diesen Beitrag editieren/löschen Diesen Beitrag einem Moderator melden       Zum Anfang der Seite springen

Was soll #shadowroots sein? Ein css Attribut?
Wenn die gewünschten Daten nicht im Quellcode sind, dann vermutlich, weil sie mit Javascript erst später geladen werden. Um das zu beurteilen, bräuchte ich einen Link zur Seite.
Öffne die Entwicklertools (F12 für Firefox und Chrome), dort solltest du die Daten finden können (nur zur Kontrolle gedacht).
Wenn das der Fall ist, kommst du mit einem einfachen Quellcode auslesen nicht weit. Das einfachste ist in solchen Fällen, einen richtigen Browser zu verwenden. C# hat z.B. eine WebBrowser Komponente, die im Hintergrund den Internet Explorer verwendet. Da muss man sich nicht selbst um das Ausführen von Javascript kümmern.

__________________
Syntax Highlighting fürs Board (Link)
20.01.2017 17:37 eulerscheZahl ist offline Beiträge von eulerscheZahl suchen Nehmen Sie eulerscheZahl in Ihre Freundesliste auf
phillyinfo
Grünschnabel


Dabei seit: 20.01.2017
Beiträge: 3

Auf diesen Beitrag antworten Zitatantwort auf diesen Beitrag erstellen Diesen Beitrag editieren/löschen Diesen Beitrag einem Moderator melden       Zum Anfang der Seite springen

Die Seite heißt fanteam.com

Um auf die gewünschte Tabelle zuzugreifen müsste ich allerdings eingeloggt sein.

Und ja ich finde die gewünschte Dateien über F12.

Was ich machen könnte ist den Quellcode zu speichern und hochzuladen.

Liebe Grüße

Dieser Beitrag wurde 2 mal editiert, zum letzten Mal von phillyinfo: 20.01.2017 17:43.

20.01.2017 17:41 phillyinfo ist offline Beiträge von phillyinfo suchen Nehmen Sie phillyinfo in Ihre Freundesliste auf
eulerscheZahl eulerscheZahl ist männlich
Foren Gott


Dabei seit: 04.01.2013
Beiträge: 2.859

Auf diesen Beitrag antworten Zitatantwort auf diesen Beitrag erstellen Diesen Beitrag editieren/löschen Diesen Beitrag einem Moderator melden       Zum Anfang der Seite springen

Ach, dann ist das Einloggen dein Problem?
Mit R kenne ich mich überhaupt nicht aus, aber prinzipiell ist das natürlich möglich: entweder schickt man das login oder einen session cookie mit.

__________________
Syntax Highlighting fürs Board (Link)

Dieser Beitrag wurde 1 mal editiert, zum letzten Mal von eulerscheZahl: 20.01.2017 17:50.

20.01.2017 17:49 eulerscheZahl ist offline Beiträge von eulerscheZahl suchen Nehmen Sie eulerscheZahl in Ihre Freundesliste auf
phillyinfo
Grünschnabel


Dabei seit: 20.01.2017
Beiträge: 3

Auf diesen Beitrag antworten Zitatantwort auf diesen Beitrag erstellen Diesen Beitrag editieren/löschen Diesen Beitrag einem Moderator melden       Zum Anfang der Seite springen

Nein, das Einloggen ist nicht mein Problem.

Ich konnte bis vor kurzer Zeit noch mit Hilfe eines Tools über xpath Pfade, die Daten aus den Tabellen herauslesen und in einem Excelsheet speichern.

Habe diesen Vorgang auch automatisiert.

Nun ist mir aufgefallen, dass in dem xpath eben #shadowroot vorkommt. Und seit dem funktioniert das Auslesen der Daten nicht mehr.

Daher bin ich auf der Suche nach einer Alternative.

Liebe Grüße
20.01.2017 17:53 phillyinfo ist offline Beiträge von phillyinfo suchen Nehmen Sie phillyinfo in Ihre Freundesliste auf
Baumstruktur | Brettstruktur
Gehe zu:
Neues Thema erstellen Antwort erstellen
Informatiker Board » Themengebiete » Praktische Informatik » Data-Screening (Anfänger)