Forschung zu Erschließung und Retrieval mathematischer Informationen

Zur Weiterentwicklung unserer Informationsservices für die Mathematik erarbeiten wir in Forschungsprojekten gemeinsam mit unseren Partnern innovative Werkzeuge zur Erschließung und zum Retrieval mathematischer Informationen. Die Mathematik hat neben der fachspezifischen Terminologie in Form von mathematischen Formeln ihre eigene Sprache entwickelt, die in einer sehr kompakten Form eine hohe Präzision der Aussage bewahrt.

Folgende Themen bilden Schwerpunkte unserer Forschung:

  • Analyse und Entwicklung von maschinellen Methoden und Prozessen zur semantischen Erschließung und Anreicherung von Daten und Dokumenten. Aufbau eines kontrollierten, fachgebietsspezifischen Vokabulars und Verknüpfung mit weiteren multilingualen Ontologien wie der auf SKOS basierenden Version der MSC2010 sowie dem mathematischen Glossar SMGloM (The Semantic Multilingual Glossary for Mathematics).
  • Entwicklung von heuristischen Verfahren zur Vernetzung der Daten und Dokumente einerseits untereinander und andererseits mit externen Quellen. Diese Methoden werden beispielsweise zum Abgleich von Literaturverweisen mit referenzierten Dokumenten in zbMATH durch eine semantische Analyse verwendet. Ähnliche Verfahren werden eingesetzt, um Publikationen in Zeitschriften mit ihren zugehörigen Preprints in arXiv zu verlinken oder zum Abgleich von zbMATH-Artikeln, in denen mathematische Software zum Einsatz kommt, mit Einträgen der Softwaredatenbank swMATH. Diese Verfahren sollen ausgebaut und weiterentwickelt werden, so dass weitere externe Quellen und Forschungsdaten eingebunden werden können.
  • Entwicklung von Methoden zur automatischen Disambiguierung von Autoreninformationen. Dafür werden Informationen zu Forschungsgebieten, Koautoren, externen Identifiern, Publikationszeiträume und biografische Daten ausgewertet. Darüber hinaus sollen diese Verfahren für die Standardisierung von Institutionennamen weiterentwickelt werden.
  • Entwicklung und Ausbau der integrierten Formelsuche unter Anreicherung der Daten mit semantischen Informationen. Die Formelsuche bietet die Möglichkeit einer sehr exakten Suche nach mathematischen Formeln oder Formelschemata – unabhängig von oder auch kombiniert mit klassischer Textsuche.