Vollformenlexikon
XSEARCH Linguistik liegt ein nahezu vollständiges Vollformenlexikon zugrunde, das von anerkannten sprachwissenschaftlichen Experten seit mehr als 20 Jahre entwickelt wird und in vielen nationalen und europäischen Projekten mit großem Erfolg eingesetzt wird.
Inhalte für das Deutsche
- Grundwortschatz von rund 2,8 Millionen Einträgen
- ca. 170.000 Synonymeinträge
- rund 1 Millionen Komposita
- Wortklasseninformationen Part of Speech
- alte und neue Rechtschreibung
- Umlautvariationen ca. 580.000
- Mehrwortbegriffe und Abkürzungen
- Schweizer Variante für "ss" anstatt "ß"
- Eigennamen, Länder- und Ortsbezeichnungen, Geografie mit Ländercode
- Komposita Algorithmus.
Part of Speech Tagging POS
Aufgrund hinterlegter Wortklasseninformationen erkennt XSEARCH Linguistik, ob Worte Substantive, Adjektive, Verben, Adverbien, Ortsangaben oder feststehende Ausdrücke sind. Part of Speech Informationen sind Grundlage für Knowledge Discovery Funktionen wie Schlüsselwortextraktion, Klassifizierung oder ähnlichkeitssuche.