KursbeschreibungEs werden fortgeschrittene Themen aus dem Bereich des Textmining/Webmining behandelt. Im Wesentlichen geht es um eine Vertiefung der Kenntnisse zur Textanalyse mit Kookkurrenzgraphen an konkreten, kleinen Beispielen aus der aktuellen Forschung. Hierzu sind verschiedene Zusammenhänge zwischen Textkorpora und deren Eigenschaften quantitativ unter Nutzung der Bibliotheksfunktionen der in JAVA geschriebenen Hagener NLPToolbox zu untersuchen und statistisch auszuwerten. Die entsprechenden Ergebnisse sind in der Dokumentation in geeignete graphische Repräsentationen zu überführen.
Die verschiedenen Aufgabenstellungen werden in Gruppen mit jeweils 2 Studierenden untersucht.