Registrierung Kalender Mitgliederliste Teammitglieder Suche Häufig gestellte Fragen Zur Startseite

Informatiker Board » Themengebiete » Theoretische Informatik » Textanalyse » Antwort erstellen » Hallo Gast [Anmelden|Registrieren]

Antwort erstellen
Benutzername: (du bist nicht eingeloggt!)
Thema:
Nachricht:

HTML ist nicht erlaubt
BBCode ist erlaubt
Smilies sind erlaubt
Bilder sind erlaubt

Smilies: 21 von 33
smileWinkDaumen hoch
verwirrtAugenzwinkerngeschockt
Mit ZungeGottunglücklich
Forum Kloppebösegroßes Grinsen
TanzentraurigProst
TeufelSpamWillkommen
LehrerLOL HammerZunge raus
Hilfe 
aktuellen Tag schließen
alle Tags schließen
fettgedruckter Textkursiver Textunterstrichener Text zentrierter Text Hyperlink einfügenE-Mail-Adresse einfügenBild einfügen Zitat einfügenListe erstellen CODE einfügenPHP CODE farbig hervorheben
Spamschutz:
Text aus Bild eingeben
Spamschutz

Die letzten 4 Beiträge
Sebi06

Das hab ich mir auch gedacht..ich hab es mal probiert, aber nicht immer das gefunden, wonach ich eigentlich gesucht hätte..naja, das gehört wohl auch dazu =)
ed209

Für die erste Frage würde es vielleicht helfen, wenn Du Dich mit regulären Ausdrücken befasst um zu spezifizieren was du ausdrücken willst. Leider unterscheiden die sich häufig von Anwendung zu Anwendung so daß man dir hier wohl keine konkrete Antwort geben kann, wenn man das Programm nicht kennt.
Die restlichen Fragen sind wohl eher was für Computerlinguisten als für Informatiker. Aber ich bezweifel daß es einfach ist mit diesen Suchtools von einer Wortform auf ihr Lemma zu schliessen usw.

Gruß,
ED
Sebi06 RE: Textanalyse

Ein analoges Programm, auf das ich nun gewechselt habe, (wegen ständigen Fehlern auf Windows) heisst TreeQuest (kitt.ifi.uzh.ch/kitt/treealigner/data/tqta)

Mittlerweile habe ich aber noch mehr Fragen:

1.) Wie (mit welcher Eingabe) kann man beispielsweise Eigennamen, welche eine Ziffer enthalten, finden?
2.) Wie kann man ein Wort (beispielsweise ein Adjektiv) ermitteln, das zu einem bestimmten Substantiv am häufigsten auftritt?
3.) Wie kann man die richtige Anzahl Bindestrich-Komposita in einem Korpus herausfinden? (hier habe ich: [word = /.*\-.*/] verwendet, was allerdings nicht ganz stimmt, da z.B. auch Gedankenstriche dazugezählt werden..)
4.) Wie kann man die Anzahl der Substantive bestimmen, welche einen Umlaut in der Wortform, nicht aber im Lemma haben?
5.) Wie findet man die Substantive, welche am häufigsten ein Satzkomplement nehmen?
6.) Wie ermittelt man, welche Konstituenten nur eine Tochterkonstituente haben? (oder: Wie ermittelt man die Konstituenten, welche Dativ-Objekte sind?)
7.) Wie kann man generell eine Folge à la Adjektiv-Nomen-Konjunktion-Nomen ausfindig machen?

Wenn mir jemand behilflich sein könnte, so wäre ich sehr dankbar!
Sebi06 Textanalyse

Hallo miteinander!

Ich befasse mich momentan gerade mit computergestützter Textanalyse. Derzeit arbeite ich mit TigerSearch, um ein vorhandenes Korpus zu "durchforsten".
TigerSearch hat eine Queryfunktion, bei der man Suchabfragen à la:
[word = /.+[0-9A-Z].*/]
durchgeben kann.
Dieses Beispiel würde nun alle Wörter suchen, die nach dem ersten Zeichen eine Ziffer oder einen Grossbuchstaben enthalten.

Meine Frage ist nun, wie ich Eigennamen (als NE bezeichnet) finden kann, welche eine Ziffer enthalten?

Besten Dank für die Hilfe und einen schönen Abend!