Trend Mining für die Wissenschaft

Der zunehmende, durch die Globalisierung weiter vorangetriebene Konkurrenzdruck macht das rechtzeitige Erkennen neuer Trends bzw. Entwicklungen durch das Forschungsmanagement an Universitäten, in der Industrie wie auch in der Politik immer wichtiger.

Dies war Ausgangspunkt für das Projekt Trend Mining für die Wissenschaft. In Kooperation mit dem Institut für Informationswissenschaft und Sprachtechnologie (IWIST) der Universität Hildesheim wurde ein Prototyp mit Such- und Retrievalfunktion entwickelt, der es dem Nutzer erlaubt, die für ihn relevante Dokumentmenge, die er auf Trends untersuchen möchte, einzugrenzen. Ferner erfolgt eine automatische Identifizierung von Kandidaten für Trends, die der Benutzer interaktiv auswählen und visualisieren lassen kann, um die Aussagekraft und Stärke des Trends zu prüfen.

Dazu wurde zunächst eine Anforderungsanalyse erstellt, in die die Expertise mehrerer Information Professionals einfloss. In dem inzwischen erfolgreich abgeschlossenen Projekt dienen ca. eine Million europäische Patente, die über die Suchmaschine Elasticsearch zur Verfügung gestellt werden, als Datengrundlage für den Prototyp zum Trend Mining. Um die Trendkandidaten zu bestimmen, werden aus den zu untersuchenden Dokumenten die signifikanten Begriffe extrahiert und aus den Dokumenten Cluster gebildet. Dabei kommen Methoden des Trend Minings zum Einsatz, im Wesentlichen semantische und statistische Verfahren. Diese mussten zunächst auf ihre Eignung für die schwierige Textsorte „Patent” evaluiert und entsprechend angepasst werden. Die Schwierigkeit besteht insbesondere in der speziellen Patentterminologie und den von der Alltagssprache abweichenden linguistischen Strukturen. Die extrahierten Trendkandidaten werden mittels Zeitreihenanalysen gewichtet.

Im Rahmen einer abschließenden, nutzerzentrierten Evaluation des erstellten Prototypen zeigte sich ein großes Interesse der beteiligten Information Professionals, die den verfolgten Ansatz bestätigten. Zudem konnten wichtige Hinweise für weitere Entwicklungen gewonnen werden.


  • Projektleiter bei FIZ Karlsruhe: Michael Schwantner
  • Laufzeit: 1. Juli 2013 – 30. Juni 2016
  • Projektpartner: Institut für Informationswissenschaft und Sprachtechnologie (IWIST) der Universität Hildesheim
  • Förderer: Leibniz-Gemeinschaft (Wettbewerb, Förderlinie: Besonders innovative und risikoreiche Vorhaben)