Analyse von Routinedaten in der Gesundheitsforschung: Validität, Generalisierbarkeit und Herausforderungen

Slagman, Anna; Hoffmann, Falk; Horenkamp-Sonntag, Dirk; Swart, Enno; Vogt, Verena; Herrmann, Wolfram J.

doi:10.1007/s44266-022-00004-0

Analyse von Routinedaten in der Gesundheitsforschung: Validität, Generalisierbarkeit und Herausforderungen

Analysis of routine data in health services research: validity, generalizability, and challenges

Wissenschaftliche Methoden
Open access
Published: 30 January 2023

Volume 99, pages 86–92, (2023)
Cite this article

Download PDF

You have full access to this open access article

Zeitschrift für Allgemeinmedizin Aims and scope Submit manuscript

Analyse von Routinedaten in der Gesundheitsforschung: Validität, Generalisierbarkeit und Herausforderungen

Download PDF

Anna Slagman^1,2,
Falk Hoffmann³,
Dirk Horenkamp-Sonntag⁴,
Enno Swart⁵,
Verena Vogt⁶ &
…
Wolfram J. Herrmann^2,7

3067 Accesses
8 Citations
7 Altmetric
2 Mentions
Explore all metrics

Zusammenfassung

Hintergrund

Routinedaten aus der Abrechnung von Gesundheitsleistungen und der Dokumentation der Gesundheitsversorgung gewinnen zunehmend an Bedeutung für wissenschaftliche Analysen – auch in der Allgemeinmedizin. Dies spiegelt sich auch in einer steigenden Zahl an Publikationen, denen eine Routinedatenanalyse zugrunde liegt, wider. Eine kritische Reflektion der Stärken und Schwächen von Routinedatenanalysen in der Gesundheitsforschung ist essenziell.

Ziel der Arbeit

Dieser Artikel soll die Leser*innen befähigen, eine kritische Einordnung von auf Routinedaten beruhenden Studien systematisch und kriteriengestützt vorzunehmen

Material und Methoden

Nutzung vorhandener Leitlinien, selektiver Literaturrecherche und Expertise der Autor*innen.

Ergebnisse

Routinedaten („Sekundärdaten“) sind im Vergleich zu Daten aus klassischen prospektiven Interventions- und Beobachtungsstudien mit Primärdatenerhebung kostengünstiger und vergleichsweise schneller verfügbar sowie in der Regel mit einem geringeren Selektionsbias behaftet und damit eher geeignet, die tatsächliche Versorgungsrealität abzubilden. Ein weiterer Vorteil zeigt sich in hohen Fallzahlen und damit der Möglichkeit der Analyse von Subgruppen, auch mit seltenen Merkmalen, die in Studien mit Primärdatenerhebung häufig nicht in ausreichender Fallzahl verfügbar sind. Dem gegenüber stehen Limitation auf Grund der Qualität und Validität der Daten, die die Aussagekraft von Routinedatenanalysen gegebenenfalls einschränken und durch geeignete Methoden, wie interne und externe Validierung, adressiert werden können.

Diskussion

Die Routinedatenanalyse ist eine wichtige Methode der Gesundheitsforschung, insbesondere um die Versorgungsrealität, auch für Subgruppen mit seltenen Merkmalen, abbilden zu können. Eine transparente Berichterstattung, insbesondere der generellen und projektspezifischen Limitationen, ist für die Interpretation der Analyseergebnisse notwendig

Abstract

Background

Routine data such as claims data and health care documentation data are of increasing relevance in health services research—also in the field of general practice and family medicine. An increasing number of articles using these kind of data highlights the increasing relevance. Thus, it is essential for general practitioners (GPs) to know the strength and weaknesses of studies using routine data.

Aim

The goal if this article is to empower readers to critically appraise articles based on routine data in a systematic and criteria-based fashion.

Materials and methods

We used available guidelines and recommendations, a selective literature review, and our own expertise.

Results

An advantage of routine data is that they are less cost intensive than primary data acquisition in prospective studies. Routine data have usually a lower selection bias; hence, they represent the reality of health care better than primarily acquired data. Another advantage is the high case numbers in routine data, which allows subgroup analyses even for low prevalent patient groups. Limitations are the restricted quality and validity of routine data. These limitations have to be addressed by measures of quality assurance such as internal and external validation.

Conclusion

Routine data analyses are an important method in health care research. These analyses are especially good in researching everyday health care and analyzing subgroups with low prevalence. Results from routine data analyses should be reported transparently including the limitations of the study.

Use our pre-submission checklist

Avoid common mistakes on your manuscript.

Routinedaten aus der Abrechnung von Gesundheitsleistungen und der Dokumentation der Gesundheitsversorgung sind zunehmend wichtige Datenquellen für Studien in der Versorgungsforschung – auch in der Allgemeinmedizin. Dabei haben Studien mit diesen Daten besondere Vor- und Nachteile. In diesem Beitrag stellen wir die Vor- und Nachteile der Nutzung von Routinedaten in Studien vor. Der Artikel soll die Leser*innen befähigen, eine kritische Einordnung von auf Routinedaten beruhenden Studien systematisch und kriteriengestützt vorzunehmen.

Hintergrund

Die Nutzung von sog. Sekundärdaten, die ursprünglich nicht für Forschungszwecke vorgesehen waren, gewinnt in der Gesundheitsforschung zunehmend an Bedeutung, was sich auch in einer zunehmenden Zahl an Publikationen, nicht zuletzt auch aus der Allgemeinmedizin, ablesen lässt [2, 6, 10, 11, 24, 25]. Daher ist es für die Leser*innen wissenschaftlicher Publikationen wichtig, Artikel, die auf der Analyse von Sekundär- bzw. Routinedaten beruhen, einordnen und kritisch bewerten zu können. Dieser Beitrag soll die Leser*innen befähigen, diese kritische Einordnung systematisch und kriteriengestützt vorzunehmen [27]. Dafür werden wir zuerst definieren, was Routinedatenanalyse bzw. Sekundärdatenanalyse ist und übliche Datenquellen nennen. Nach einem Verweis auf die wichtigsten Leitlinien in diesem Feld werden wir die Potenziale und Limitationen von Routinedatenanalysen darstellen und typische Aspekte, auf die Leser*innen achten sollten, herausarbeiten. Wir konzentrieren uns dabei auf nicht-interventionelle Studien, zeigen aber im Ausblick dann die Bedeutung von Routinedatenanalysen in der Interventionsforschung auf.

Definitionen

In der Gesundheitsversorgung fallen bei der Dokumentation und Abrechnung zahlreiche Daten an. Für die Nutzung dieser Daten in der wissenschaftlichen Forschung sind unterschiedliche Begriffe gebräuchlich, so betont der Begriff Routinedaten die Art und Entstehung der Daten, während der Begriff Sekundärdaten die Nutzung der Daten jenseits des originären Ergebungszwecks betont. Die wissenschaftliche Nutzung von Daten, die primär nicht zu Forschungszwecken erhoben und dokumentiert wurden (Sekundärdaten), wird dabei von Primärdaten abgegrenzt, die im Rahmen wissenschaftlicher Forschung explizit für die Beantwortung wissenschaftlicher Fragestellungen erhoben, aufbereitet und analysiert werden. Eine dritte häufige und eher inhaltlich geprägte Begrifflichkeit sind versorgungsnahe Daten, um zu betonen, dass die Daten aus dem Kontext der unmittelbaren Gesundheitsversorgung stammen.

Datenquellen für Sekundärdatenanalysen in der Gesundheitsforschung

Die möglichen Quellen für Sekundärdaten sind vielfältig und stetigen Erweiterungen und Veränderungen unterzogen. Sehr häufig werden Abrechnungsdaten der Gesundheitsversorgung genutzt, diese können von Krankenkassen bzw. anderen Sozialversicherungsträgern, jedoch auch von kassenärztlichen Vereinigungen oder von den Leistungserbringern direkt verfügbar gemacht werden. Neben Abrechnungsdaten sind die Daten zur Gesundheitsversorgung des Forschungsdatenzentrums (z. B. Krankenhausstatistik) zu nennen [7], aber auch Behandlungsdaten stellen eine wichtige Form von Routinedaten dar. Dazu gehören beispielsweise im niedergelassenen Bereich Daten aus Arztinformationssystemen und im stationären Sektor solche, die unmittelbar in der Krankenversorgung entstehen, wie klinische Behandlungsdaten, Diagnosen oder Labordaten. Aufgrund der zunehmenden Digitalisierung der Gesundheitsversorgung ergeben sich auch neue Quellen für Sekundärdatenanalysen, beispielsweise Daten aus der Telemedizin, dem Telemonitoring, Gesundheitsapplikationen und digitalen Gesundheitsanwendungen. Teilweise werden diese Datenquellen auch miteinander oder mit zu wissenschaftlichen Zwecken erhobenen Primärdaten verknüpft (Daten-Linkage; [12, 13]).

Leitlinien zur Durchführung und Berichterstattung von Sekundärdatenanalysen

Für die Routine‑/Sekundärdatendatenanalyse auf der Basis etablierter Standards fortgeschriebene Leitlinien bieten eine Orientierung für Forscher*innen zur Planung und Durchführung von Sekundärdatenanalysen („Gute Praxis Sekundärdatenanalyse – GPS“, basierend auf der Leitlinie zur „Guten Epidemiologischen Praxis – GEP“; [26]). Andererseits bieten sie Autor*innen und Leser*innen Hinweise zur Berichterstattung und kritischen Bewertung von Sekundärdatenanalysen („standardisierte Berichtsroutine für Sekundärdatenanalysen“, STROSA; Tab. 1; [27]; bzw. international die „RECORD“-Leitlinie [1]). Wir greifen verschiedene für kritische Leser*innen wichtige Aspekte dieser Leitlinien im Folgenden auf.

Zur Beurteilung von Publikationen, die auf der Analyse von Routinedaten beruhen, eignen sich die grundlegenden Leitfragen, adaptiert nach Donner-Banzhoff (2007) [3]. Um Studiendesign, Datenbasis und Plausibilität entsprechend dieser Leitfragen zu beurteilen, bietet sich das STROSA-Statement an, das in Bezug auf methodische Aspekte der Sekundärdatenanalyse stärker ins Detail geht [3]. Dabei sollte ein besonderes Augenmerk auf die in Tab. 1 fett gedruckten Punkte gelegt werden, an denen die für Sekundärdaten geltenden Spezifika abgelesen werden können. Aus der Publikation müssen die Datenherkunft, der Prozess der Datenaufbereitung und -prüfung, die Ein- und Ausschlusskriterien sowie die Operationalisierung untersuchter Entitäten und die Analyseeinheit hervorgehen. In der späteren Diskussion der Ergebnisse sollten Potenziale und Limitationen der Routinedaten und konkret die interne Validität des Studienansatzes explizit thematisiert werden.

Tab. 1 Berichterstattung von Sekundärdatenanalysen^a

Full size table

Vor- und Nachteile von Sekundärdatenanalysen

Generelle Aspekte

Ein wichtiger Vorteil von Routinedaten ist, dass diese üblicherweise in hohen Fallzahlen und longitudinal also längsschnittlich vorliegen. Daher eignen sich Sekundärdatenanalysen besonders zur Analyse von Trends [21, 23], für regionale Vergleiche [30] oder zur Analyse von Minderheiten und kleinen Subpopulationen [22] bzw. seltenen Erkrankungen sowie für deskriptive Darstellungen der Versorgungsrealität und können in der Vorbereitung von prospektiven Primärdatenerhebungen hypothesengenerierend und für Fallzahlschätzungen herangezogen werden [5, 14, 15, 19, 20]. Ergänzend finden Routinedaten zunehmend Einsatz in Evaluationen neuer Versorgungsformen bzw. -interventionen sowie gesundheitsökonomischen Analysen [9].

Sekundärdatenanalysen sind hinsichtlich Kosten und zeitlichem Aufwand ressourcenschonender als prospektive Primärdatenerhebungen, da die Daten bereits vorliegen und nach der, teils mit erheblichem Aufwand verbundenen, Datenaufbereitung unmittelbar für die statistische Auswertung genutzt werden können.

Generelle Limitationen sind insbesondere in der Datenqualität zu sehen. In Studien mit Primärdatenerhebung werden die für die Beantwortung der Fragestellung erforderlichen Informationen prospektiv und spezifisch für Studienzwecke erhoben. Eine Herausforderung bei der Analyse von Routinedaten ist somit die Operationalisierung und Validierung aller für die Beantwortung der Fragestellung notwendigen Informationen, die teilweise in den Daten fehlen, nicht ideal operationalisiert vorliegen oder lediglich als Surrogatparameter verfügbar sind. Je nach Datenquelle variiert weiterhin der Anteil fehlender oder auch unplausibler Werte, die vor Beginn einer Sekundärdatenanalyse identifiziert und berücksichtigt werden müssen. Auch müssen mögliche Einflüsse auf die Datendokumentation kritisch hinterfragt werden. So ist im Bereich der klinischen Dokumentation im Vergleich zu Abrechnungsdaten neben der oft schlechten Datenqualität auch die häufig fehlende Standardisierung in der Dokumentation zu beachten. Ein wichtiger Punkt bei Abrechnungsdaten hingegen ist, dass diese zu Abrechnungszwecken erstellt wurden und es daher zu systematischen Einflüssen aus Fehlanreizen kommen könnte, beispielsweise welche Diagnosen kodiert werden, um den besten Abrechnungseffekt („upcoding“) zu erreichen [17]. Darüber hinaus werden vorrangig abrechnungsrelevante Aspekte kodiert; so spielt in der Praxis der hausärztlichen Versorgung die Genauigkeit von ICD-Codierungen aufgrund fehlender Codiervorschriften beispielsweise eine untergeordnete Rolle (z. B. ICD-Code XX.9). Mitunter leidet die Abbildbarkeit einzelner Leistungen an der Abrechnung über Pauschalen, z. B. in der vertragsärztlichen Versorgung. So führt die Abrechnung über Versichertenpauschalen pro Quartal dazu, dass die Häufigkeit der Konsultationen nicht genau bestimmt werden kann.

Selektionsbias und Generalisierbarkeit

Im Vergleich zu prospektiven Primärdatenerhebungen ist der Selektionsbias bei Routinedaten generell als niedriger zu bewerten, da häufig kein individueller Einwilligungsprozess erforderlich ist. Limitationen ergeben sich hier jedoch aus der Wahl der Datenquelle. So werden in Forschungsprojekten häufig die Daten einer oder einiger großer Krankenkassen oder Einrichtungen verfügbar gemacht und analysiert. Daraus ergibt sich gegenüber der Gesamtbevölkerung in Deutschland, mit einer besonders heterogenen Struktur und Vielfalt an Versicherungen und Einrichtungen, ein Selektionsbias, der sich nicht immer in Richtung und Ausmaß abschätzen lässt. So haben AOK-Versicherte im Vergleich zur Gesamtbevölkerung einen niedrigeren sozioökonomischen Status und einen höheren Anteil von Menschen mit Migrationshintergrund [8]. Durch einen solchen Selektionsbias ist es beispielsweise erklärbar, dass die Prävalenz von Herzinsuffizienz in der AOK-Versichertenpopulation im Jahr 2007 einen Prozentpunkt höher war als in der Allgemeinbevölkerung.

Aus diesen Gründen sollten die Ergebnisse nicht unkritisch als generalisierbar oder die Versorgungsrealität im Allgemeinen abbildend interpretiert, sondern stets kritisch vor dem Hintergrund der Selektion interpretiert und reflektiert werden. Bei der Bewertung von Publikationen von Sekundärdatenanalyse ist deshalb besonders auf die Beschreibung der Datenquelle zu achten und wie der Einfluss der Datenselektion auf die Ergebnisinterpretation von den Autor*innen diskutiert wird. Die Datenquelle sollte der Fragestellung angemessen und die Repräsentativität bzw. Einschränkungen in der Generalisierbarkeit transparent dargestellt werden.

Validität und Plausibilität von Sekundärdaten und Sekundärdatenanalysen

Die Validität von Sekundärdaten und darauf basierenden Analysen ist immer vor dem Hintergrund der jeweiligen Fragestellung und der dafür erforderlichen Informationen zu bewerten.

Mögliche Einflüsse auf die Validität von Sekundärdaten, wie der Einfluss von Fehlanreizen auf Abrechnungsdaten, wurden bereits angesprochen. Da die Daten nicht primär für wissenschaftliche Zwecke erhoben wurden, kommt deren Validität eine große Bedeutung zu. Dies muss bereits in der Planung einer Sekundärdatenanalyse mitgedacht und die Möglichkeit einer internen (oder externen) Validierung geprüft werden.

Eine interne Validierung von Diagnosen in Abrechnungsdaten könnte z. B. bedeuten zu prüfen, ob eine chronische Diagnose in mehreren Quartalen hintereinander codiert wurde, ob entsprechende, mit der Diagnose assoziierte Leistungen abgerechnet wurden und ob die Arzneimittelverordnungsdaten Verordnungen von in Umfang und Dosis der Person und einer leitliniengerechten Medikation entsprechenden Mengen enthalten [18]. Idealerweise würde zusätzlich eine externe Validierung auf individueller Fall- oder Personenebene durch Hinzuziehen weiterer Datenquellen, wie beispielsweise eines Registers oder von Krankenakten, durchgeführt.

Weiterhin ist im Rahmen von Qualitätssicherungsmaßnahmen z. B. ein Abgleich mit anderen Datenquellen, Expertenmeinung und bereits veröffentlichen Berichten möglich. So verglichen beispielhaft Ulrich u. a. ihre Ergebnisse zur Langzeitversorgung nach Herzinfarkt ausführlich mit bereits publizierten Daten [29]. Weiterhin sollten soziodemografische und sozioökonomische Merkmale der Studienpopulation nach Möglichkeit mit der Zielpopulation verglichen werden [4]. In einer Publikation von Sekundärdatenanalysen sollten die verwendeten Variablen sowie deren Auswahl, Operationalisierung und Methoden der Validierung und Plausibilisierung entsprechend berichtet werden.

Weitere spezifische Herausforderungen

Wie bereits unter dem Aspekt der Validität und Plausibilität beschrieben sind in die vorbereitenden theoretischen Überlegungen bei der Studienplanung auch andere Einflüsse auf zu untersuchende Zusammenhänge, wie Confounding oder Effektmodifikation, zu berücksichtigen. Daten, die zur Kontrolle dieser möglichen Störgrößen geeignet sind, sollten mitbetrachtet und die entsprechenden erwarteten Zusammenhänge sowie deren Kontrolle im Rahmen von statistischen Verfahren transparent dargestellt werden.

Im Gegensatz zu Studien mit Primärdatenerhebung ist eine Herausforderung dabei, dass Störgrößen häufig nicht prospektiv mit erhoben werden können und diese möglicherweise nicht oder lediglich durch Surrogatparameter kontrolliert werden können. Bei der Bewertung von Bias, Confounding und Effektmodifikation sollten Autor*innen und Leser*innen von Publikationen also hinterfragen, ob alle Einflüsse angemessen kontrolliert werden konnten oder die im Datensatz vorhandene Information (Variablen) unzureichend war und sich hieraus Limitationen hinsichtlich der Ergebnissee ergeben.

Ein weiterer wichtiger Aspekt ist, dass der zeitliche Bezug in Sekundärdatenquellen zwar häufig tagesgenau abgebildet ist, teilweise aber zeitliche Ungenauigkeiten durch das Abrechnungsprozedere entstehen (z. B. durch quartalsweise Abrechnung ambulanter Diagnosen) und Versorgungsverläufe damit teilweise nur grob abgebildet werden können. Dabei sollte auch je nach Datenquelle berücksichtigt werden, ob wirklich die gesamte Versorgung in den Daten abgebildet werden kann oder bestimmte Daten systematisch fehlen: Klinikinterne Daten enthalten beispielsweise nur die Daten des jeweiligen Krankenhausstandorts und überwiegend stationäre Falldaten, wohingegen in Daten der kassenärztlichen Vereinigungen stationäre Daten vollständig fehlen. Daten zur Rehabilitation bei erwerbsfähigen Personen sind in der Regel wiederum nicht bei Krankenkassen gespeichert, sondern bei den Rentenversicherungsträgern und umgekehrt.

Ein wichtiger Aspekt ist, die Analyseeinheit zu beachten, die in der Regel Personen oder Fälle darstellt. Eine Person kann sowohl in klinischen als auch in Abrechnungsdaten zu mehreren sog. Fällen führen, z. B. bei einer wiederholten Inanspruchnahme. Andersherum können zu Abrechnungszwecken jedoch auch mehrere Fälle zu einem Abrechnungsfall zusammengeführt werden. Es sollte daher immer klar dargestellt sein, ob es sich um Daten auf Personenebene oder auf Fallebene handelt und wie Mehrfachinanspruchnahmen in der Analyse gehandhabt wurden. In GKV-Abrechnungsdaten ist diese Differenzierung zwischen Fall- und Versichertenebene – und damit entsprechend differenzierte Analysen – durch Nutzung (pseudonymisierter) Versicherten- und Fallnummern eindeutig möglich. In anonymisierten Registerdaten ist das in der Regel nicht mehr möglich und Daten werden häufig auf Fallebene analysiert. Eine Risikopopulation kann jedoch in den meisten Datenquellen über Personen identifiziert und quantifiziert werden und damit können epidemiologische Maßzahlen, wie Inzidenz und Prävalenz, innerhalb der zugrunde liegenden Population oder andernfalls auch auf Fallebene bestimmt werden.

Während Drop-out und „loss to follow-up“ (Personen, die aktiv aus einer Studie ausschieden oder nicht mehr erreichbar sind) bei Primärdaten häufiger sind, kann es auch bei Routinedaten zu einer lückenhaften Datengrundlage über den zeitlichen Verlauf kommen. Gründe dafür sind beispielsweise Versicherungswechsel oder bei arztbasierten Daten ein Wechsel des Hausarztes. Insgesamt ist dieses „passive“ Follow-up in Sekundärdaten jedoch oftmals weniger selektiv als in Studien auf Basis von Primärdaten, weshalb z. B. in der NAKO-Gesundheitsstudie die Nachbeobachtung mit Sekundärdaten bezüglich relevanter epidemiologischer Endpunkte mit zunehmender Dauer der Studie an Bedeutung gewinnt [16].

Ausblick

Insgesamt eröffnen sich für die allgemeinmedizinische Forschung durch die Nutzung von Sekundärdaten neue Einblicke in das alltägliche Versorgungsgeschehen, die bis vor einigen Jahren nicht oder nur mit großem Aufwand möglich gewesen wären. Wir gehen davon aus, dass Routinedatenanalysen zukünftig, u. a. durch eine bessere Verfügbarkeit der Daten in dem neu etablierten Forschungsdatenzentrum Gesundheit [28] oder auch in der Evaluation von Interventionseffekten in randomisiert kontrollierten Studien [9], zum Beispiel in der Erfassung von Kosten und Endpunkten im Rahmen des Follow-ups, weiterhin an Bedeutung gewinnen.

Leser*innen von wissenschaftlichen Artikeln, die auf der Analyse von Routinedaten basieren, sollten daher darauf achten, ob diese angesprochenen Punkte adressiert wurden. Handelt es sich um eine relevante Fragestellung? Wurde begründet, warum eine Sekundärdatenanalyse statt einer Primärdatenerhebung gewählt wurde? Wurde die Auswahl, Selektion und Aufbereitung sowie die Operationalisierung der Variablen der verwendeten Routinedaten dargestellt und diskutiert? Wurden die Ergebnisse validiert und Verzerrungsrisiken diskutiert? Wurden die Einschränkungen der Aussagekraft und Generalisierbarkeit der Sekundärdatenanalyse kritisch betrachtet? Wenn diese Punkte kritisch und transparent dargestellt wurden, können Artikel mit Sekundärdatenanalysen tiefe Einblicke in die Versorgungsrealität bieten und damit wichtige Erkenntnisse für die Handlungspraxis von Hausärzt*innen generieren.

Fazit für die Praxis

Routinedaten werden zu einem anderen Zweck als für die wissenschaftliche Forschung erhoben, aber in der Sekundärdatenanalyse dann wissenschaftlich ausgewertet.
Routinedaten haben einen vergleichsweise geringen Selektionsbias und eignen sich daher für die Darstellung des realen Versorgungsgeschehen.
Aufgrund der verfügbaren größeren Fallzahl bieten sich Routinedaten für die Analysen von Subgruppen mit selteneren Merkmalen an.
Jedoch sollten die vorliegenden Routinedaten sowie die Ergebnisse der Sekundärdatenanalyse möglichst intern und extern validiert werden.
Publikationen von Sekundärdatenanalysen sollten anhand der entsprechenden Checklisten von Leser*innen genauso kritisch geprüft werden, wie Studien mit Primärdaten.

Literatur

Benchimol EI, Smeeth L, Guttmann A, Harron K, Moher D, Petersen I, Sørensen T, von Elm E (2015) The REporting of studies conducted using observational routinely-collected health data (RECORD) statement. PLoS Med 12:e1001885
Article PubMed PubMed Central Google Scholar
Busse R, Nimptsch U (2021) Krankenhäuser: Bettenauslastung auf Rekordtief. Dtsch Arztebl 118:A-1852 / B‑530
Google Scholar
Donner-Banzhoff N, Schrappe M, Lelgemann M (2007) Studien zur Versorgungsforschung. Eine Hilfe zur kritischen Rezeption. Z Ärztliche Fortbild Qual Gesundheitswes 101:463–471
Google Scholar
Ep** J, Geyer S, Eberhard S, Tetzlaff J (2021) Völlig unterschiedlich oder doch recht ähnlich? Die soziodemografische Struktur der AOK Niedersachsen im Vergleich zur niedersächsischen und bundesweiten Allgemein- und Erwerbsbevölkerung. Gesundheitswesen 83:77–86
Article Google Scholar
Frick J, Möckel M, Muller R, Searle J, Somasundaram R, Slagman A (2017) Suitability of current definitions of ambulatory care sensitive conditions for research in emergency department patients: a secondary health data analysis. BMJ Open 7:e16109
PubMed PubMed Central Google Scholar
Geraedts M, Ebbeler D, Timmesfeld N, Kaps M, Berger K, Misselwitz B, Günster C, Dröge P, Schneider M (2021) Quality assurance measures and mortality after stroke. Dtsch Arztebl Int 118:857–863
PubMed PubMed Central Google Scholar
Forschungsdatenzentrum der Statistischen Ämter der Länder Krankenhausstatistik. https://www.forschungsdatenzentrum.de/de/gesundheit/krankenhaus. Zugegriffen: 2. Dez. 2022
Hoffmann F, Icks A (2012) Unterschiede in der Versichertenstruktur von Krankenkassen und deren Auswirkungen für die Versorgungsforschung: Ergebnisse des Bertelsmann-Gesundheitsmonitors. Gesundheitswesen 74:291–297
Article CAS PubMed Google Scholar
Hoffmann F, Kaiser T, Apfelbacher C, Benz S, Bierbaum T, Dreinhöfer K, Hauptmann M, Heidecke CD, Koller M, Kostuj T, Ortmann O, Schmitt J, Schünemann H, Veit C, Hoffmann W, Klinkhammer-Schalke M (2021) Versorgungsnahe Daten zur Evaluation von Interventionseffekten: Teil 2 des Manuals. Gesundheitswesen 83:470–480
Article PubMed Google Scholar
Kohl R, Schwinger A, Jürchott K, Hering C, Gangnus A, Steinahegen-Thiessen E, Kuhlmey A, Gellert P (2022) Mortality among hospitalized nursing home residents with COVID-19. Dtsch Arztebl Int 119:293–294
PubMed PubMed Central Google Scholar
Kreis K, Neubauer S, Klora M, Lange A, Zeidler J (2016) Status and perspectives of claims data analyses in Germany—a systematic review. Health Policy 120:213–226
Article PubMed Google Scholar
March S, Andrich S, Drepper J, Horenkamp-Sonntag D, Icks A, Ihle P, Kieschke J, Kollhorst B, Maier B, Meyer I, Müller G, Ohlmeier C, Peschke D, Richter A, Rosenbusch ML, Scholten N, Schulz M, Stallmann C, Swart E, Wobbe-Ribinski S, Wolter A, Zeidler J, Hoffmann F (2019) Gute Praxis Datenlinkage (GPD). Gesundheitswesen 81:636–650
Article PubMed Google Scholar
March S, Antoni M, Kieschke J, Kollhorst B, Maier B, Müller G, Sariyar M, Schulz M, Swart E, Zeidler J, Hoffmann F (2018) Quo vadis Datenlinkage in Deutschland? Eine erste Bestandsaufnahme. Gesundheitswesen 57:e20–e31
Article Google Scholar
Möckel M, Searle J, Muller R, Slagman A, Storchmann H, Oestereich P, Wyrich W, Ale-Abaei A, Vollert J, Koch M, Somasundaram R (2013) Chief complaints in medical emergencies: do they relate to underlying disease and outcome? The Charité Emergency Medicine Study (CHARITEM). Eur J Emerg Med 20:103–108
Article PubMed Google Scholar
Riedlinger D, Möckel M, Müller C, Holert F, Searle J, von Recum J, Slagman A (2018) High-sensitivity cardiac troponin T for diagnosis of NSTEMI in the elderly emergency department patient: a clinical cohort study. Biomarkers 23:551–557
Article CAS PubMed Google Scholar
Schipf S, Schöne G, Schmidt B, Günther K, Stübs G, Greiser KH, Bamberg F, Meinke-Franze C, Becher H, Berger K, Brenner H, Castell S, Damms-Machado A, Fischer B, Franzke CW, Fricke J, Gastell S, Günther M, Hoffmann W, Holleczek B, Jaeschke L, Jagodzinski A, Jöckel KH, Kaaks R, Kauczor HU, Kemmling Y, Kluttig A, Krist L, Kurth B, Kuß O, Legath N, Leitzmann M, Lieb W, Linseisen J, Löffler M, Michels KB, Mikolajczyk R, Pigeot I, Mueller U, Peters A, Rach S, Schikowski T, Schulze MB, Stallmann C, Stang A, Swart E, Waniek S, Wirkner K, Völzke H, Pischon T, Ahrens W (2020) Die Basiserhebung der NAKO Gesundheitsstudie: Teilnahme an den Untersuchungsmodulen, Qualitätssicherung und Nutzung von Sekundärdaten. Bundesgesundheitsblatt Gesundheitsforschung Gesundheitsschutz 63:254–266
Article PubMed Google Scholar
Schönfelder T, Balázs S, Klewer J (2009) Kosten aufgrund von DRG-Upcoding durch die Einführung der Diagnosis Related Groups in Deutschland. Heilberufe 61:77–81
Article Google Scholar
Schubert I, Ihle P, Köster I (2010) Interne Validierung von Diagnosen in GKV-Routinedaten: Konzeption mit Beispielen und Falldefinition. Gesundheitswesen 72:316–322
Article CAS PubMed Google Scholar
Slagman A, Searle J, Vollert JO, Müller C, Muller R, Somasudndaram R, Möckel M (2015) Predicting in-hospital mortality using routine parameters in unselected nonsurgical emergency department patients. Notfall Rettungsmed 18:501–509
Article Google Scholar
Slagman A, Searle J, Vollert JO, Storchmann H, Zum Büschenfelde DM, von Recum J, Vlasny D, Abaei AA, Koch M, Müller C, Müller R, Somasundaram R, Möckel M (2015) Sex differences of troponin test performance in chest pain patients. Int J Cardiol 187:246–251
Article PubMed Google Scholar
Slagman A, Harriss L, Campbell S, Muller R, McDermott R (2019) Folic acid deficiency declined substantially after introduction of the mandatory fortification programme in Queensland, Australia: a secondary health data analysis. Public Health Nutr 22:3426–3434
Article PubMed Google Scholar
Slagman A, Harriss L, Campbell S, Muller R, McDermott R (2019) Low proportions of folic acid deficiency after introduction of mandatory folic acid fortification in remote areas of northern Queensland, Australia: a secondary health data analysis. Biomarkers 24:684–691
Article CAS PubMed Google Scholar
Slagman A, Behringer W, Greiner F, Klein M, Weismann D, Erdmann B, Pigorsch M, Möckel M (2020) Medical emergencies during the COVID-19 pandemic. Dtsch Arztebl Int 117:545–552
PubMed PubMed Central Google Scholar
Strumann C, Steinhauser J (2021) Evaluation of a direct-to-patient telehealth service in Germany (docdirekt) based on routine data. Dtsch Arztebl Int 118:872–873
PubMed PubMed Central Google Scholar
Swart E, Ihle P, Gothe H, Matusiewicz D (2014) Routinedaten im Gesundheitswesen. In: Handbuch Sekundärdatenanalyse: Grundlagen, Methoden und Perspektiven, 2. Aufl. Huber, Bern
Google Scholar
Swart E, Gothe H, Geyer S, Jaunzeme J, Maier B, Grobe TG, Ihle P (2015) Gute Praxis Sekundärdatenanalyse (GPS): Leitlinien und Empfehlungen. Gesundheitswesen 77:120–126
Article CAS PubMed Google Scholar
Swart E, Bitzer E, Gothe H, Harling M, Hoffmann F, Horenkamp-Sonntag D, Maier B, MArch S, Petzold T, Röhrig R, Rommel A, Schink T, Wagner C, Wobbe S, Schmitt J (2016) Standardisierte Berichtsroutine für Sekundärdaten Analysen (STROSA) – ein konsentierter Berichtsstandard für Deutschland, Version 2. Gesundheitswesen 78:e145–e60
Article CAS PubMed Google Scholar
Swart E, Gothe H, Hoffmann F, Ihle P, Semler SC, March S (2021) Jetzt die Weichen stellen für ein leistungsfähiges Forschungsdatenzentrum Gesundheit. Gesundheitswesen 83:139–141
Article Google Scholar
Ulrich R, Pischon T, Robra B‑P, Freier C, Heintze C, Herrmann WJ (2020) Health care utilisation and medication one year after myocardial infarction in Germany—a claims data analysis. Int J Cardiol 300:20–26
Article PubMed Google Scholar
Vogt V, Siegel M, Sundmacher L (2014) Examining regional variation in the use of cancer screening in Germany. Soc Sci Med 110:74–80
Article PubMed Google Scholar

Download references

Funding

Open Access funding enabled and organized by Projekt DEAL.

Author information

Authors and Affiliations

Notfallmedizinische Versorgungsforschung, Notfall- und Akutmedizin (CVK, CCM), Charité – Universitätsmedizin Berlin, Berlin, Deutschland
Anna Slagman
Board der Plattform Charité Versorgungsforschung, Charité – Universitätsmedizin Berlin, Berlin, Deutschland
Anna Slagman & Wolfram J. Herrmann
Fakultät VI – Medizin und Gesundheitswissenschaften, Carl von Ossietzky Universität Oldenburg, Oldenburg, Deutschland
Falk Hoffmann
Abteilung Versorgungsmanagement, Techniker Krankenkasse, Hamburg, Deutschland
Dirk Horenkamp-Sonntag
Institut für Sozialmedizin und Gesundheitssystemforschung (ISMG), Otto-von-Guericke Universität Magdeburg, Magdeburg, Deutschland
Enno Swart
Fachgebiet Management im Gesundheitswesen, Technische Universität Berlin, Berlin, Deutschland
Verena Vogt
Institut für Allgemeinmedizin, Charité – Universitätsmedizin Berlin, Berlin, Deutschland
Wolfram J. Herrmann

Authors

Anna Slagman
View author publications
You can also search for this author in PubMed Google Scholar
Falk Hoffmann
View author publications
You can also search for this author in PubMed Google Scholar
Dirk Horenkamp-Sonntag
View author publications
You can also search for this author in PubMed Google Scholar
Enno Swart
View author publications
You can also search for this author in PubMed Google Scholar
Verena Vogt
View author publications
You can also search for this author in PubMed Google Scholar
Wolfram J. Herrmann
View author publications
You can also search for this author in PubMed Google Scholar

Corresponding author

Correspondence to Anna Slagman.

Ethics declarations

Interessenkonflikt

A. Slagman, F. Hoffmann, D. Horenkamp-Sonntag, E. Swart, V. Vogt und W.J. Herrmann geben an, dass kein Interessenkonflikt besteht.

Für diesen Beitrag wurden von den Autor/-innen keine Studien an Menschen oder Tieren durchgeführt. Für die aufgeführten Studien gelten die jeweils dort angegebenen ethischen Richtlinien.

Additional information

QR-Code scannen & Beitrag online lesen

Rights and permissions

Open Access Dieser Artikel wird unter der Creative Commons Namensnennung 4.0 International Lizenz veröffentlicht, welche die Nutzung, Vervielfältigung, Bearbeitung, Verbreitung und Wiedergabe in jeglichem Medium und Format erlaubt, sofern Sie den/die ursprünglichen Autor(en) und die Quelle ordnungsgemäß nennen, einen Link zur Creative Commons Lizenz beifügen und angeben, ob Änderungen vorgenommen wurden.

Die in diesem Artikel enthaltenen Bilder und sonstiges Drittmaterial unterliegen ebenfalls der genannten Creative Commons Lizenz, sofern sich aus der Abbildungslegende nichts anderes ergibt. Sofern das betreffende Material nicht unter der genannten Creative Commons Lizenz steht und die betreffende Handlung nicht nach gesetzlichen Vorschriften erlaubt ist, ist für die oben aufgeführten Weiterverwendungen des Materials die Einwilligung des jeweiligen Rechteinhabers einzuholen.

Weitere Details zur Lizenz entnehmen Sie bitte der Lizenzinformation auf http://creativecommons.org/licenses/by/4.0/deed.de.

Reprints and permissions

About this article

Cite this article

Slagman, A., Hoffmann, F., Horenkamp-Sonntag, D. et al. Analyse von Routinedaten in der Gesundheitsforschung: Validität, Generalisierbarkeit und Herausforderungen. Z Allg Med 99, 86–92 (2023). https://doi.org/10.1007/s44266-022-00004-0

Download citation

Accepted: 19 December 2022
Published: 30 January 2023
Issue Date: April 2023
DOI: https://doi.org/10.1007/s44266-022-00004-0

Schlüsselwörter

Keywords

Use our pre-submission checklist

Avoid common mistakes on your manuscript.

Analyse von Routinedaten in der Gesundheitsforschung: Validität, Generalisierbarkeit und Herausforderungen

Zusammenfassung

Hintergrund

Ziel der Arbeit

Material und Methoden

Ergebnisse

Diskussion

Abstract

Background

Aim

Materials and methods

Results

Conclusion

Hintergrund

Definitionen

Datenquellen für Sekundärdatenanalysen in der Gesundheitsforschung

Leitlinien zur Durchführung und Berichterstattung von Sekundärdatenanalysen

Vor- und Nachteile von Sekundärdatenanalysen

Generelle Aspekte

Selektionsbias und Generalisierbarkeit

Validität und Plausibilität von Sekundärdaten und Sekundärdatenanalysen

Weitere spezifische Herausforderungen

Ausblick

Fazit für die Praxis

Literatur

Funding

Author information

Authors and Affiliations

Corresponding author

Ethics declarations

Interessenkonflikt

Additional information

Rights and permissions

About this article

Cite this article

Share this article

Schlüsselwörter

Keywords

Search

Navigation