Textanalyse

Neue Frage »

Auf diesen Beitrag antworten »
Sebi06 Textanalyse

Hallo miteinander!

Ich befasse mich momentan gerade mit computergestützter Textanalyse. Derzeit arbeite ich mit TigerSearch, um ein vorhandenes Korpus zu "durchforsten".
TigerSearch hat eine Queryfunktion, bei der man Suchabfragen à la:
[word = /.+[0-9A-Z].*/]
durchgeben kann.
Dieses Beispiel würde nun alle Wörter suchen, die nach dem ersten Zeichen eine Ziffer oder einen Grossbuchstaben enthalten.

Meine Frage ist nun, wie ich Eigennamen (als NE bezeichnet) finden kann, welche eine Ziffer enthalten?

Besten Dank für die Hilfe und einen schönen Abend!
 
Auf diesen Beitrag antworten »
Sebi06 RE: Textanalyse

Ein analoges Programm, auf das ich nun gewechselt habe, (wegen ständigen Fehlern auf Windows) heisst TreeQuest (kitt.ifi.uzh.ch/kitt/treealigner/data/tqta)

Mittlerweile habe ich aber noch mehr Fragen:

1.) Wie (mit welcher Eingabe) kann man beispielsweise Eigennamen, welche eine Ziffer enthalten, finden?
2.) Wie kann man ein Wort (beispielsweise ein Adjektiv) ermitteln, das zu einem bestimmten Substantiv am häufigsten auftritt?
3.) Wie kann man die richtige Anzahl Bindestrich-Komposita in einem Korpus herausfinden? (hier habe ich: [word = /.*\-.*/] verwendet, was allerdings nicht ganz stimmt, da z.B. auch Gedankenstriche dazugezählt werden..)
4.) Wie kann man die Anzahl der Substantive bestimmen, welche einen Umlaut in der Wortform, nicht aber im Lemma haben?
5.) Wie findet man die Substantive, welche am häufigsten ein Satzkomplement nehmen?
6.) Wie ermittelt man, welche Konstituenten nur eine Tochterkonstituente haben? (oder: Wie ermittelt man die Konstituenten, welche Dativ-Objekte sind?)
7.) Wie kann man generell eine Folge à la Adjektiv-Nomen-Konjunktion-Nomen ausfindig machen?

Wenn mir jemand behilflich sein könnte, so wäre ich sehr dankbar!
Auf diesen Beitrag antworten »
ed209

Für die erste Frage würde es vielleicht helfen, wenn Du Dich mit regulären Ausdrücken befasst um zu spezifizieren was du ausdrücken willst. Leider unterscheiden die sich häufig von Anwendung zu Anwendung so daß man dir hier wohl keine konkrete Antwort geben kann, wenn man das Programm nicht kennt.
Die restlichen Fragen sind wohl eher was für Computerlinguisten als für Informatiker. Aber ich bezweifel daß es einfach ist mit diesen Suchtools von einer Wortform auf ihr Lemma zu schliessen usw.

Gruß,
ED
Auf diesen Beitrag antworten »
Sebi06

Das hab ich mir auch gedacht..ich hab es mal probiert, aber nicht immer das gefunden, wonach ich eigentlich gesucht hätte..naja, das gehört wohl auch dazu =)
 
 
Neue Frage »
Antworten »


Verwandte Themen

Die Beliebtesten »
Die Größten »
Die Neuesten »