Medizinische Informatik, Statistik und Dokumentation

Forschungsschwerpunkt Semantik und Ontologien in der Medizin

Teamleiter: Stefan Schulz

Fokus: Schwerpunkt ist die semantische Modellierung von Daten aus Wissenschaft und Klinik. Zwei Wege werden beschritten: einerseits die Konstruktion symbolischen Wissens durch Expert*innen, andererseits automatische Wissensakquisition durch Methoden des maschinellen Lernens. Im ersten Fall werden Daten durch Terminologien, Ontologien und Informationsmodellen standardisiert, im zweiten Fall wird Semantik durch probabilistische und neuronale Modelle ausgedrückt. Da Daten zu großen Teilen nur als Texte vorliegen, stehen Methoden des Text Mining im Vordergrund. Die so gewonnenen normierten Datenextrakte unterstützen Dokumentenrecherche, Datenanalyse und klinische Entscheidungsfindung.

Vernetzung: Derzeit wichtige Kooperationspartner des Teams sind die KAGes und CBmed, Graz, die ELGA GmbH Wien, sowie die Firma Roche Diagnostics (Basel und Belmont). In Deutschland bestehen enge Kontakte zur Text-Mining-Firma Averbis GmbH, Freiburg, EMPIRICA GmbH, Bonn, zu den Universitäten Freiburg und TU München, der Universität Jena, der Charité Berlin und dem DFKI Saarbrücken. Über aktive Mitwirkung in den Standardisierungsorganisationen SNOMED International und HL-7 bestehen weltweite Kontakte. Weiter hervorzuheben sind aktuelle Kooperationen mit Kolleg*innen von den Universitäten Trondheim, Murcia, Bordeaux, Ljubljana, Buffalo, der FH Bern, sowie der PUCPR (Brasilien).

Projekte

Digitale Biomarker

  • Wir koordinieren das DBM4PM-Projekt von CBmed zur Datenextraktion aus klinischen Dokumenten mit dem Ziel der semantischen Standardisierung von Daten für die Tumorboard-Plattform NAVIFY®. Die Analyse klinischer Massendaten ist ein anderer Schwerpunkt. Hier geht es um kurze Diagnosenbeschreibungen, die routinemäßig mit ICD-10-Codes annotiert sind. Ziel ist die Hebung der Datenqualität und die Akquisition klinischer Terminologie und Einsatz maschinellen Lernens. Schließlich unterstützen wir ein Projekt zur Ermittlung klinischer Komplikationen (Delir) aus Daten der KAGes.
  • Laufzeit: 2015-2023
  • Gefördert durch: FFG
  • Projektpartner*innen: Roche Diagnostics; CBmed; Averbis GmbH; KAGes

SNOMED CT-Lokalisierung

  • Der internationale Terminologiestandard SNOMED CT ist mittlerweile in allen deutschsprachigen Ländern verfügbar, eine Übersetzung in die deutsche Sprache steht jedoch noch aus. Wir arbeiten sowohl mit Top-Down- als auch mit Bottom-Up-Ansätzen an einer Sammlung deutscher klinischer Terme und verknüpfen sie mit SNOMED-CT-Codes. Das Ergebnis, die "Graz (German) Interface Terminology for SNOMED CT (GIT-SCT)" wird in eigenen Projekten sowie von Kooperationspartnern für Text Mining experimentell eingesetzt.
  • Laufzeit: 2015-2022
  • Gefördert durch: Med Uni Graz
  • Projektpartner*innen: Averbis GmbH, Freiburg, Deutschland; ELGA GmbH, Wien

PRECISE4Q - Vorhersagemodelle für Schlaganfall

  • Das H2020-Projekt Precise4Q verfolgt das Ziel, in vier Phasen datengetriebene Vorhersagemodelle für Schlaganfälle zu erstellen. Während die Modelle neue Deep-Learning-Ansätze inkorporieren, sind Datennormalisierung und Datenzusammenführung klare Engpässe. Daten kommen aus mehreren Ländern, unterschiedlichen Versorgungssystemen, in höchst unterschiedlicher Struktur. Unsere Aufgabe besteht in der semantischen Harmonisierung. Derzeit liegt unser Schwerpunkt auf der Durchführung manueller Annotationen von Kliniktexten, als Trainingsmaterial für Modelle zur Informationsextraktion.
  • Laufzeit: 2018-2022
  • Gefördert durch: Europäische Kommission
  • Projektpartner*innen: empirica GmbH, Bonn; TU Dublin; University College Dublin; Health Ethics and Policy Lab, Universität Zürich; Institut Guttmann, Barcelona; Universität Linköping; DFKI Saarbrücken; AOK NO - GeWINO, Berlin; QMENTA, Barcelona; Universität Murcia.

Teamleiter

Univ.-Prof. Dr.
Stefan Schulz 
T: +43 316 385 16939