SePaMiM Sequential Pattern Mining und Pattern Matching von Krankheits- und Behandlungsverläufen für klinische Krebsregister

Motivation

Mit der Einrichtung der klinischen Landeskrebsregister nach §65c SGB V und der Einführung des bundeseinheitlichen ADT-GEKID Basisdatensatz werden nun auch Daten zur Behandlung und dem Erkrankungsverlauf von Krebserkrankungen erfasst. Die Auswertung dieser Daten ist aufgrund ihrer Komplexität ohne geeignete Verfahren und Werkzeuge derzeit nur mit großem, unverhältnismäßigem manuellen Aufwand umzusetzen. Im Projekt SePaMiM möchten wir untersuchen, inwiefern sich die Analyse komplexer Behandlungs- und Krankheitsverläufe aus Registerdaten mithilfe geeigneter IT-Systeme unterstützten lässt.

Ziele

SePaMiM hat das Ziel, die Epidemiolog*innen in klinischen Krebsregistern bei der Analyse von Krankheits- und Behandlungsverlaufsdaten durch geeignete IT-System zu unterstützen.

Technologien

Zur Analyse sequentieller Daten existieren zwei primäre Ansätze. Der erste hat das Ziel, in den Verlaufsdaten nach Sequenzen zu suchen, die einem vorgegebenen Muster entsprechen. Der zweite Ansatz kommt aus dem Data Mining und befasst sich mit Algorithmen zum Finden von interessanten oder häufig auftretenden Mustern in den Sequenzdaten. Im SePaMiM-Projekt sollen beide Ansätze verfolgt werden.

Zunächst sollen die Mitarbeiter*innen der klinischen Krebsregister bei der Selektion von Patient*innenkohorten anhand bestimmter Behandlungsverläufe unterstützt werden. Hiermit soll es den Mitarbeiter*innen ermöglicht werden, konkrete Fragestellungen zu beantworten, beispielsweise im Rahmen einer Qualitätskonferenz.

Aufbauend hierauf werden anschließend Verfahren der künstlichen Intelligenz, insbesondere aus dem Bereich des Data Mining genutzt, um automatisch Muster in den Verlaufsdaten zu entdecken. Im Bereich des Data Mining beschäftigt sich z.B. das Sequential Pattern Mining mit Algorithmen zum Finden von interessanten oder häufig auftretenden Mustern in Sequenzdaten.

Personen

Projektleitung Intern

Wissenschaftliche Leitung

Publikationen
SePaMiM – an online tool for analyzing course-of-disease data in German cancer registries using CQL

Kolja Blohm, David Korfkamp, Christian Lüpkes, Andreas Hein; 68. Jahrestagung der Deutschen Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie e.V. (GMDS); 2023

The Clinical Quality Language as a tool to support data analysis in German clinical cancer registries

Kolja Blohm and David Korfkamp and Joachim Hübner and Florian Oesterling and Stefanie Schulze and Andreas Hein; GMS Medizinische Informatik, Biometrie und Epidemiologie; 08 / 2024

Clustering breast cancer patients based on their course of treatment

Kolja Blohm and David Korfkamp and Christian Lüpkes; Gesundheit – gemeinsam. Kooperationstagung der GMDS, DGSMP, DGEpi, DGMS und der DGPH; 2024

Partner
Landeskrebsregister Nordrhein-Westfalen
www.landeskrebsregister.nrw
Epidemiologisches Krebsregister Niedersachsen, OFFIS CARE GmbH
www.krebsregister-niedersachsen.de

Laufzeit

Start: 01.04.2021
Ende: 31.03.2024

Fördermittelgeber

Verwandte Projekte

CARLOS

Epidemiologisches Krebsregister Niedersachsen

MUSTANG

Multidimensional Statistical Data Analysis Engine

VersKiK

Versorgung, Versorgungsbedarf und Versorgungsbedürfnisse von Personen nach einer Krebserkrankung im Kindes- oder Jugendalter