XSEARCH Linguistik

Sprache analysieren, reduzieren und normalisieren.
Preprozessor für Suche, Semantik und Klassifikation.

XSEARCH Linguistik ist die vollständige linguistische Software für morpho-syntaktische Analyse des Deutschen und der wichtige Baustein für erfolgreiche Suche. XSEARCH Linguistik ist Basisgrundlage für die Verbesserung von Suchanwendungen oder Knowledge Discovery Funktionen wie Schlüsselwortextraktion, Clustering, Klassifizierung.

Vollformenlexikon

XSEARCH Linguistik liegt ein nahezu vollständiges Vollformenlexikon zugrunde, das von anerkannten sprachwissenschaftlichen Experten seit mehr als 20 Jahre entwickelt wird und in vielen nationalen und europäischen Projekten mit großem Erfolg eingesetzt wird.

Inhalte für das Deutsche

- Grundwortschatz von rund 2,8 Millionen Einträgen
- ca. 170.000 Synonymeinträge
- rund 1 Millionen Komposita
- Wortklasseninformationen Part of Speech
- alte und neue Rechtschreibung
- Umlautvariationen ca. 580.000
- Mehrwortbegriffe und Abkürzungen
- Schweizer Variante für "ss" anstatt "ß"
- Eigennamen, Länder- und Ortsbezeichnungen, Geografie mit Ländercode
- Komposita Algorithmus.

Part of Speech Tagging POS

Aufgrund hinterlegter Wortklasseninformationen erkennt XSEARCH Linguistik, ob Worte Substantive, Adjektive, Verben, Adverbien, Ortsangaben oder feststehende Ausdrücke sind. Part of Speech Informationen sind Grundlage für Knowledge Discovery Funktionen wie Schlüsselwortextraktion, Klassifizierung oder ähnlichkeitssuche.