GramWord

From tehowiki
Jump to navigation Jump to search

GramWord is a Java package which uses a relational (MySql) database to recognize a limited set of German words.

Sets of common words, names, roots and endings of verbs, substantives, adjectives and adverbs, together with their grammatical type and conjugation/declination are preloaded from dictionary files into database tables.

Several decision algorithms use these tables to determine the grammatical type of all words in a text. In the HTML output, the recognized words are shown in different colors.

Short Example

A sentence from "Don Quijote" (hold the mouse over a colored word to see the type of the morphem):

Nachdem er alle diese Vorkehrungen getroffen, wollte er nicht länger warten, sein Vorhaben ins Werk zu setzen; es drängte ihn dazu der Gedanke an die Entbehrung, die die Welt durch sein Zögern erleide, derart waren die Unbilden, denen er zu steuern, die Ungerechtigkeiten, die er zurechtzubringen, die Ungebühr, der er abzuhelfen, die Mißbräuche, die er wiedergutzumachen, kurz, die Pflichten, denen er zu genügen gedachte. Und so, ohne

irgendeinem von seiner Absicht Kunde zu geben und ohne daß jemand ihn sah, bewehrte er sich eines Morgens vor Anbruch des Tages - es war einer der heißen Julitage - mit seiner ganzen Rüstung, stieg auf den Rosinante, nachdem er seinen zusammengeflickten Turnierhelm aufgesetzt, faßte seine Tartsche in den Arm, nahm seinen Speer und zog durch die Hinterpforte seines Hofes hinaus aufs Feld, mit gewaltiger Befriedigung und Herzensfreude darob, mit wie großer Leichtigkeit er sein löbliches Vorhaben auszuführen begonnen.

Longer Example (Chapters 1 - 4 from "Don Quijote")
Coding of Syntactic and Semantic Attributes of Words
Decision Algorithms, Hints for developers, Limitations and Bugs


German Word Lists