Merkmalsbasierte Visualisierung und Analyse natürlichsprachlicher Dokumente -VisADoc

Beschreibung

Die Menge digitaler textueller Daten, wie sie beispielsweise von Internetnutzern erzeugt werden, ist in den letzten Jahren rapide gewachsen und hat zu einer gewaltigen Informationsüberflutung geführt. Die merkmalbasierte Visualisierung und Analyse natürlichsprachlicher Dokumente ist daher ein dringliches Mittel, um diesem Problem beizukommen. Suchmaschinen helfen Benutzern relevante Dokumente zu finden, aber sie bieten keine weitergehende Hilfe zur Analyse und zum Verständnis der Textdimensionen, die für den Bedarf des Anwenders von Bedeutung sind. Die größte Schwierigkeit dabei ist die fehlende Verbindung zwischen Textmerkmalen, die automatisch berechnet werden können, und der Intention des Benutzers. Diese Verbindung muss hergestellt werden, um die Interaktion des Benutzers mit dem Dokument zu erleichtern und ihm zu erlauben, Fragen zu beantworten wie, warum zwei Dokumente ähnlich sind, wie diese in Bezug zu einem automatisch berechneten verwandten Cluster gesetzt werden können oder welche Aspekte wesentlich für die Beurteilung der Textqualität oder einer Altersempfehlung sind. Die geplanten Forschungsarbeiten zielen darauf ab, diese Lücke durch neue visuelle Untersuchungstechniken zu schließen. Wir beabsichtigen eine verschiedene Aspekte abdeckende Textanalyse. Diese geht von maschinell berechneten Merkmalen und einer interaktiven, visuell unterstützten Attributaufbereitung aus, die die Untersuchung und Auswertung benutzerdefinierter Texteigenschaften1 in großen Dokumentkollektionen ermöglicht. Die genannten Merkmale können dann für eine erweiterte Analyse von Texten verwendet werden, was zu höherer Effizienz und gesteigerter Genauigkeit führt. Zu diesem Zweck erarbeiten wir neue textuelle Merkmale zur Modellierung inhaltlicher Texteigenschaften. Eine enge Verbindung von automatischer Textanalyse und mehrdimensionaler Text- und Merkmalsvisualisierung ist entscheidend für den beabsichtigten interaktiven Prozess. Die Arbeit ist eingebettet in einem durchgängigen Framework, das die Definition von Text-basierten Merkmalen je nach Bedürfnis des Benutzers unterstützt. Wir evaluieren den vorgestellten Ansatz zur visuellen Textanalyse im Kontext von Qualitätsbewertung und Altersempfehlung.

Teilnehmer
Institutionen
  • AG Keim (Data Analysis and Visualization)
Mittelgeber
Name Finanzierungstyp Kategorie Kennziffer
Sachbeihilfe/Normalverfahren Drittmittel Forschungsförderprogramm 554/12
Weitere Informationen
Laufzeit: 01.10.2012 – 30.09.2015