Borck, André; Laroque, Christoph: Konzeption und Implementation einer Rich-Text-Analyse zur Generierung von Wissensstrukturen aus unstrukturierten Informationsobjekten im K-Discovery Framework, Term paper, University of Paderborn, Department of Business Computing 2 2003, pp. 27.

THEMES: Borck, André | Laroque, Christoph
META STRUCTURES: Projects\...\Student Projec... | SS\...\Das GTMS | SS\...\Technische Dok...
YEAR: 2003
 
Summary
Management Summary (english):

Industrial companies optimize the use of the IT-technology potentials . Creating world-wide networks with a growing amount of data exchange leads to a continuous growth of the data, which has to be managed. The companies try to structure their exisisting information to organise the access more efficiently. For this process new mechanisms are needed, which recognise and generate structures from unstructered texts.

Purpose of this seminar paper was to design and implement a textanalysis to extract key entries of unstructured documents. This feature was integrated into the prototyp of the GTME. Therefore the process of textanalysis had to be planned, improved and implemented.

After the selection of the content-database serveral documents can be selected from a dynamically created table. Filter criteria allow to identify related documents. As a result of the automatical textanalysis related key entries can be selected and added as topics to the topic map. New associations can be created to new or existing topics by the use of association orders.


Wichtige Punkte für das Management (deutsch):

Heutige Industrieunternehmen nutzen in hohem Maße die Möglichkeiten der modernen Informationstechnologie. Das Bilden von weltweiten Netzwerken und der steigende elektronische Datenaustausch lässt die zu bewältigende Menge digitaler Informationen stetig wachsen. Die Unternehmen versuchen, bereits vorhandene Informationen zu strukturieren, um den Zugriff auf internes Wissen effizienter zu organisieren. Für diesen Prozess werden Mechanismen benötigt, die semiautomatisch aus einer Menge von unstrukturierten Objekten Strukturen erkennen und generieren.

Aufgabe der Seminararbeit war die Konzeption und Implementierung einer Textanalysefunktion zur Identifikation von Schlüsselwörtern aus Richt-Text Feldern der Dokumente.
Diese sollte in den vorhandenen Prototypen der GTME integriert werden. Dazu musste zunächst der Prozess der Textanalyse ausgeplant, verfeinert und implementiert werden: Nach Auswahl der Content-Datenbank soll die Menge der zu analysierenden Dokumente anhand von Filterkriterien eingegrenzt werden können. Als Ergebnis der automatischen Textanalyse müssen die gefundenen Schlüsselworte manuell nachbearbeitet werden können, und als Topics in die Topic Map eingepflegt werden.
Zu den gefundenen Topics können Assoziationen generiert werden. Erst diese Verknüpfung bringt den realen Mehrwert der assoziativen Navigation.