Hinweis: Bei den FAQs handelt es sich um unverbindliche Wissenserklärungen. Bitte beachten Sie, dass daraus dem Grunde nach keine rechtlichen Bindungswirkungen abzuleiten sind.

Wir werden Sie unterstützen, soweit uns dies möglich ist. Dazu gestalten und organisieren wir beispielsweise gemeinsam mit verschiedenen Fachgruppen und der TMF e.V. Workshops. Gerne nutzen wir auch andere Gelegenheiten, um mit Ihnen ins Gespräch zu kommen. Vorrang hat letztlich jedoch immer die Bearbeitung der Anträge.

Eine ausführliche Datensatzbeschreibung finden Sie auf der unten angegebenen Webseite.

Nein, dies ist nicht möglich.

Sie können jedoch ggf. die Rohdaten unmittelbar nutzen. Dies ist auf Antrag und nur in unseren Räumlichkeiten möglich, wenn ihrer Fragestellung nicht anderweitig nachgegangen werden kann.

An diese "On-Site Nutzung" sind besondere Bedingungen und Vorgaben geknüpft. Daher können wir sie erst in einer späteren Ausbaustufe anbieten.

Siehe dazu § 5 Absatz 5 der Datentransparenzverordnung:
Die Datenaufbereitungsstelle stellt den Nutzungsberechtigten die Daten ausnahmsweise als Einzeldatensätze pseudonymisiert bereit, wenn der angegebene und nach § 303e Absatz 2 des Fünften Buches Sozialgesetzbuch zulässige Nutzungszweck nicht durch die Verarbeitung von anonymisierten Daten erreicht werden kann. Bei einer solchen Bereitstellung ist zu gewährleisten, dass die betroffenen Versicherten nicht wieder identifiziert werden können. Die pseudonymisierten Einzeldatensätze werden in den Räumen der Datenaufbereitungsstelle bereitgestellt.

Ja. Nähere Informationen haben wir für Sie auf unserer unten angegebenen Webseite zusammengestellt.

Ja, unter der Voraussetzung, dass Sie die Einwilligung der jeweiligen Krankenkassen vorab eingeholt haben und uns diese mit Ihrem Antrag vorlegen. Grundlage hierfür ist der § 5 Abs. 6 der Datentransparenzverordnung.

Für die Berichtsjahre 2009 und 2010 liegen beispielsweise Regionaldaten und Diagnosedaten vor. Weitere Details zur Verfügbarkeit von Regionaldaten und dem Aufbau des amtlichen Gemeindeschlüssels finden Sie in der den Informationen zur Datensatzbeschreibung.

Darüber hinaus wäre natürlich auch in diesem Fall sicherzustellen, dass die Ergebnismenge für sich genommen faktisch anonymisiert ist.

Für das Berichtsjahr 2008 liegen nicht alle Daten vor. Ab dem Berichtsjahr 2009 liegen die Daten pro Berichtsjahr mit einem Zeitverzug von 4 Jahren komplett vor. Dies liegt an dem besonderen Datenzuschnitt, den die DaTraV-Daten aufgrund der Orientierung am sogenannten Ausgleichsjahr des Morbi-RSA aufweisen. Der Zeitverzug ergibt sich aus den rechtlichen Rahmenbedingungen.

Nähere Informationen zu den derzeit vorliegen Daten und deren Zuschnitt können Sie der Datensatzbeschreibung und unserem FAQ-Eintrag "Datenzuschnitt" entnehmen.

Bitte beachten Sie in diesem Kontext insbesondere auch unsere FAQ-Einträge zu den Themen Auswertungspopulation und fehlende Diagnose- und Arzneimitteldaten (Stichwort: Inzidente Fälle).

Die DaTraV-Daten bestehen aus pseudonymisierten Einzeldatensätzen, die alle einen Versichertenbezug haben. Versicherte wiederum lassen sich über mehrere Jahre mithilfe eines jahresübergreifenden Pseudonyms verfolgen. Voraussetzung ist, dass sie bei Erzeugung dieses Pseudonyms eindeutig anhand einer einheitlichen Krankenversicherungsnummer identifizierbar waren. Das war beispielsweise in den Ausgleichsjahren 2009 und 2010 für 225.000 bzw. 185.000 Versicherungsnummern nicht der Fall.

Das jahresübergreifende Pseudonym bleibt gleich, wenn Versicherte die Krankenkasse wechseln. Daher lassen sich Versicherte mit jahresübergreifendem Pseudonym über die Jahre und auch zwischen Krankenkassen verfolgen.

Hierzu finden Sie ausführliche Informationen auf unserer Webseite im Bereich Datensatzbeschreibung / Regionaldaten.

Nein, die DaTraV-Daten enthalten alle ambulanten und stationären Diagnosen, die für die Abrechnung mit den gesetzlichen Krankenkassen dokumentiert und an diese übermittelt wurden.

Allerdings fehlen quartalsinterne Duplikate (z.B. Wiedervorstellung zur Kontrolle). Ebenfalls nicht enthalten sind die inzidenten Fälle eines Jahres, die im Folgejahr nicht mehr GKV-versichert sind (s. Link unten).

Nein. Wir können Ihnen grundsätzlich nur anonymisierte und zusammengefasst Daten, eben Ergebnismengen (§5 Abs.4 DaTraV) übermitteln. Daten direkt in Form von Einzeldatensätzen bereitzustellen ist nur ausnahmsweise und in den Räumen des DIMDI gestattet.

Nein, bis auf weiteres können wir hier keine Praktika anbieten.

Stirbt ein Versicherter im Berichtsjahr oder versichert sich privat, gelangen seine Daten nicht in den Morbi-RSA-Datensatz des folgenden Ausgleichjahres. Denn der Morbi-RSA ist auf das Zukünftige ausgerichtet.

Die Stammdatentabelle SA151 eines Ausgleichjahres gibt u.a. an, welche Versicherte in dem Ausgleichsjahr verstorben sind. (Im Falle der Satzarten SA151 und SA751 (Leistungsausgaben) ist das Berichtsjahr gleich dem Ausgleichsjahr.) Der Stammdatentabelle SA151 kann also entnommen werden, wessen Daten damit im nachfolgenden Ausgleichsjahr unberücksichtigt bleiben. Werden diese Tabellen zweier aufeinander folgender Ausgleichsjahre verglichen, können näherungsweise die Versicherten bestimmt werden, deren Daten im zweiten Ausgleichsjahr fehlen (aufgrund von Tod, Auswanderung, Wechsel in private Krankenversicherung oder freie Heilfürsorge). Laut BVA sind dies pro Jahr ca. 1,5 Millionen Fälle, davon sind gut die Hälfte Todesfälle.

Ihr Antrag wird von uns im Rahmen einer formalen Prüfung, einer inhaltlichen Vorprüfung und einer inhaltlichen Prüfung geprüft. Falls erforderlich bitten wir Sie, zusätzliche Angaben einzureichen oder auch Korrekturen vorzunehmen. Die inhaltliche Vorprüfung erfolgt anhand des von Ihnen eingereichten Antrags. Nach dieser Vorprüfung wird in der Regel eine Ergebnismenge generiert, anhand derer die abschließende inhaltliche Prüfung erfolgt.

Das Verfahren ist als Sozialverwaltungsverfahren ausgestaltet. An dessen Ende erfahren Sie die Entscheidung der Datenaufbereitungsstelle mittels eines Bescheides. In der Regel werden hierin auch die zu zahlenden Gebühren festgesetzt. Gegen den Bescheid können Sie innerhalb eines Monats nach Bekanntgabe Widerspruch einlegen.

Generell müssen wir über Anträge innerhalb von drei Monaten nach Eingang der Unterlagen entscheiden, sofern wir die Antragsfrist nicht verlängern. Eine (von uns begründete) Verlängerung ist jeweils um 4 Wochen möglich.

In § 303e Absatz 1 des SGB V steht, wer nutzungsberechtigt ist. Sollten Sie unsicher sein, ob Sie bzw. Ihre Institution dazu gehört, können Sie uns über unser Kontaktformular eine Selbsteinschätzung inklusive Begründung senden. Dann erhalten Sie von uns eine entsprechende vorläufige Einschätzung. Eine offizielle und verbindliche Aussage können wir erst im Rahmen des Antragsverfahrens treffen.

Wie Sie uns Ihre SQL-Programme übermitteln, überlassen wir Ihnen. Sie können diese also je nach Schutzbedarf per E-Mail oder Post schicken.

Sie können Ihre Skripte auch gerne mit einem der üblichen Verfahren komprimieren und verschlüsseln, wie sie Packer/Entpacker-Programme mit AES-256-Verschlüsselungsfunktion anbieten (s. Link). In diesem Fall sollten Sie uns natürlich das entsprechende Passwort getrennt von den Skripten zusenden (per E-Mail, Brief oder Fax).

Eingereichte Skripte führen wir in einem speziell für jeden einzelnen Antrag angelegten Schema aus. Innerhalb dieses Schemas sollten Sie ohne Angabe eines weiteren Schemas auf die DaTraV-Daten per View zugreifen. Die Namen der Views entsprechen den Namen, die Sie in unserer Datensatzbeschreibung finden. Sie können die Skripte gerne auch so programmieren, dass das zu referenzierende Schema über einen Parameter an einer Stelle für alle Abfragen festgelegt werden kann.

Die Ergebnisse Ihrer Auswertung, sind in möglichst themenspezifische Tabellen zu schreiben. Dies erleichtert uns die Prüfung und beschleunigt somit die Bearbeitung Ihres Antrags.

Es empfiehlt sich für diese Ergebnistabellen und die ggf. erzeugten temporären Tabellen und/oder Schlüsseltabellen jeweils andere Benennungsschemata anzuwenden. Beispielsweise könnten Sie jeder Ergebnistabelle ein 'rt_' , jeder temporären Tabelle ein 'tt_' und jeder Schlüsseltabelle ein 'pk_' als Prefix voranstellen.

Ergänzende Informationen finden Sie in unseren Regeln für den Programmcode (PDF, 479 kB)

Wir behalten uns Anpassungen vor. Sollten wir Skripte anpassen, werden wir Änderungen nachvollziehbar vornehmen. Hierzu nutzen wir u.a. ein Versionskontrollsystem.

Änderungen, die über anzupassende Schema-Angaben oder einzufügende Protokollfunktionen zur Erfassung von Laufzeiten hinausgehen, werden wir mit Ihnen besprechen.

Die DaTraV-Daten beinhalten keine Angaben zu Operationen, Prozeduren oder allgemeinen medizinischen Maßnahmen im stationären Bereich oder beim ambulanten Operieren.

In keinem Datenfeld werden nach OPS klassifizierte Daten erfasst. Auch Labordaten sind nicht vorhanden.

Die gesetzlichen Vorgaben sehen dies nicht vor. Jedoch ist es in begründeten Ausnahmefällen möglich, einen Antrag temporär auszusetzen. Da wir mit Abschluss der inhaltlichen Vorprüfung die Erfolgsaussichten Ihres Antrags i.d.R. recht gut beurteilen können, bieten wir Ihnen die Möglichkeit an, eine temporäre Aussetzung Ihres Antrags zu beantragen. Dazu ist das Antragsformular zur Nutzung der DaTraV-Daten entsprechend zu kennzeichnen und zu begründen. Machen Sie von dieser Möglichkeit Gebrauch, so werden wir Ihnen nach der inhaltlichen Vorprüfung eine Mitteilung über unsere Einschätzung der Erfolgsaussichten Ihres Antrags zukommen lassen.

Bitte beachten Sie, dass:

  • für die Dauer der Aussetzung des Verfahrens auch die gesetzliche Bearbeitungsfrist von drei Monaten ausgesetzt wird.
  • auch bei einem durch Sie ausgesetzten Verfahren im Falle einer Antragsrücknahme Gebühren fällig werden.

Tabelle: Datenzuschnitt der Ausgleichsjahre

Berichtsjahr 2008 2009 2010 2011 (...) 2014 2015
Stammdaten
der Versicherten I
 - V2009 SA151 V2010 SA151 V2011 SA151 (...) V2014 SA151 V2015 SA151
Stammdaten
der Versicherten II
V2009 SA152 V2010 SA152 V2011 SA152 (...) V2014 SA152 V2015 SA152 -
Extrakorporale
Blutreinigung
V2009 SA153 V2010 SA153 V2011 SA153 (...) V2014 SA153 V2015 SA153 -
ambulant verordnete und abgerechnete Arzneimittel V2009 SA451 V2010 SA451 V2011 SA451 (...) V2014 SA451 V2015 SA451 -
stationäre Diagnosen V2009 SA551 V2010 SA551 V2011 SA551 (...) V2014 SA551 V2015 SA551 -
ambulante Diagnosen V2009 SA651 V2010 SA651 V2011 SA651 (...) V2014 SA651 V2015 SA651 -
Leistungsausgaben  - V2009 SA751 V2010 SA751 V2011 SA751 (...) V2014 SA751 V2015 SA751
Amtlicher Gemeindeschlüssel  - V2009 SA999 V2010 SA999  -  -  - -

 

Das Minuszeichen bedeutet, dass keine Daten vorhanden sind.

Farbskala für den Datenumfang eines Ausgleichsjahres:

Ausgleichsjahr 2009 Ausgleichsjahr 2010 Ausgleichsjahr 2011 (...) Ausgleichsjahr 2014 Ausgleichsjahr 2015

 

Der Zuschnitt der Daten eines Ausgleichsjahres erklärt sich aus dem Verwendungszweck. So dienen diese Daten vereinfacht gesagt dazu folgende Frage zu beantworten:

Welche Leistungsausgaben haben sich im Ausgleichsjahr für GKV-Versicherte ergeben, die im Vorjahr an einer der Morbi-RSA-relevanten Krankheiten erkrankt waren?

Bei der Berechnung des Morbi-RSA für ein Ausgleichsjahr werden somit die Diagnosen, abgerechneten Arzneimittelverordnungen und extrakorporalen Blutreinigungen der im Ausgleichsjahr GKV-Versicherten betrachtet, die im Jahr davor dokumentiert wurden. D.h. zum Beispiel:

  • Für das Ausgleichsjahr 2009 muss zunächst einmal bestimmt werden, wer für wie lange 2009 GKV-versichert war. In der Tabelle der Satzart 151 für das Ausgleichsjahr 2009 (V2009SA151) sind diese Informationen zusammengestellt.
  • Anschließend kann anhand der Daten in der V2009SA151 abgeleitet werden, welche der in 2008
    • erhobenen Angaben u.a. zur Anzahl der Versichertentage mit Kostenerstattung (siehe Tabelle V2009SA152) und
    • erhobenen Angaben zur extrakorporalen Blutreinigung (siehe Tabelle V2009SA153),
    • abgerechnete Arzneimittelverordnungen (siehe Tabelle V2009SA451),
    • dokumentierten Diagnosen (siehe Tabelle V2009SA551, V2009SA651)

          für die Berechnung des Morbi-RSA für das Ausgleichsjahr 2009 relevant sind.

Dies bedeutet zum Beispiel für eine perioden-bezogene Auswertung, bei der die Versicherten zumindest 360 Tage im betrachteten Jahr GKV-versichert gewesen sein sollten, dass alle relevanten Daten für die Berichtsjahre 2009 bis 2014 zur Verfügung stehen (siehe Tabelle).

Für den Fall, dass die Grundgesamtheit (Studienpopulation/Nenner) unabhängig von der Zahl der Versichertentage innerhalb eines Jahres bestimmt werden kann, stehen die Daten für die Berichtsjahre 2008 bis 2015 zur Verfügung.

Die Summe der dokumentierten Versichertentage für Versicherte mit einem überjährigen Pseudonym für die Jahre 2009 und 2010 ergibt mehr als 365 Versichertentage

  • für 2009 bei knapp 30.000 Versicherten und
  • 2010 bei gut 20.000 Versicherten.

Dies beruht darauf, dass die Daten der Versicherten, die GKV-weit auf mehr Versichertentage als Tage im Jahr kommen, ungekürzt für die Bereitstellung an das DIMDI vom BVA bezogen werden. Das bedeutet, dass die die sich aus der Plausibilitätsprüfung der Versichertentage ergebenden "Korrekturen" nicht vorgenommen werden.

Bei diesen Korrekturen handelt es sich um eine RSA-spezifische Kürzungen der Versichertentage nach folgenden Regeln:

  • Die Tage die ein GKV-Pseudonym über der Anzahl an Tagen im Jahr liegt (Überschusstage) werden als Kürzungstage jedem einzelnen Datensatz angespielt.
  • Liegen die Kürzungstage über die Versichertentage eines Datensatzes (s. Beispiel 2 letzte Zeile; hellblau) erfolgt eine Kappung der Kürzungstage auf die Höhe der Versichertentage. Gekürzt ergeben sich somit maximal 0 (und niemals negative) gekürzte Versichertentage.
  • Die Kürzungenstage werden auch auf die übrigen auf Tage basierenden Spalten angewandt. Bei Ihnen wäre das z.B. die Spalte "Versichertentage Krankengeld".

Wie schon erwähnt, ist dieses Vorgehen bei den Korrekturen sehr auf das RSA-Verfahren abgestimmt. Würde es auch auf die übermittelten Daten angewandt, könnte es zum Beispiel Ergebnisse von Auswertungen der Arzneimitteldaten (z.B. DDD / Behandlungstage) verfälschen.

Beispiel 1 - Kürzung der Versichertentage (VT)

Satzart Jahr Pseudonym Kasse VT VT-Krankengeld VT-Kürzung VT gekürzt VT-Krankengeld gekürzt
151 2012 4711 A 330 290 4 326 286
151 2012 4711 B 40 40 4 36 36

Summe VT: 370
Tage im Jahr 2012: 366
Überschusstage: 4

Beispiel 2 - Maximale Kürzung der Versichertentage

Satzart Jahr Pseudonym Kasse VT VT-Krankengeld VT-Kürzung VT gekürzt VT-Krankengeld gekürzt
151 2012 4711 A 330 290 34 296 256
151 2012 4711 B 40 40 34 6 6
151 2012 4711 C 30 30 30* 0 0

* Eine Kürzung um 34 VT ist hier nicht zulässig. Es darf maximal um den Wert 30 gekürzt werden.
Summe VT: 400
Tage im Jahr 2012: 366
Überschusstage: 34

Das Berichtsjahr ist das Jahr, in dem die Daten erhoben wurden.

Das Ausgleichsjahr ist das Jahr, für das der Morbi-RSA-Jahresausgleich durchgeführt wird.

Für die meisten Satzarten gilt: Ausgleichsjahr minus 1 gleich Berichtsjahr. Für einige wenige Satzarten entspricht das Ausgleichsjahr dem Berichtsjahr. Genaueres hierzu können Sie dem FAQ-Eintrag Datenzuschnitt und der Datensatzbeschreibung entnehmen.

In unserem Antragsformular geben Sie die gewünschten Berichtsjahre an, für die eine Analyse durchgeführt werden soll.

Ja, Sie können gegen die im Bescheid getroffenen Entscheidungen Widerspruch einlegen (s. Abschnitt "Rechtsbehelfsbelehrung" des Bescheids).

So können Sie z.B. im Falle, dass die Ergebnismenge widererwarten nicht für die Beantwortung der in Ihrem Antrag formulierten Fragestellung geeignet ist, um die Bereitstellung einer modifizierten oder ergänzenden Ergebnismenge innerhalb eines Monats nach Bekanntgabe schriftlich oder zur Niederschrift bitten. Ihre Bitte werten wir als Widerspruch. Wenn wir Ihre Bitte nachvollziehen können, erhalten Sie eine modifizierte Ergebnismenge mit einem Widerspruchsbescheid. Andernfalls wird der Widerspruch als unzulässig oder unbegründet zurückgewiesen.

Sie können auch gegen eine bzw. die mit dem Bescheid erlassenen Auflagen Widerspruch innerhalb eines Monats nach Bekanntgabe schriftlich oder zur Niederschrift einlegen.

In jedem Fall bitten wir Sie, Ihren Widerspruch nachvollziehbar zu begründen.

Auch gegen einen Widerspruchsbescheid können Sie vorgehen. Dazu ist eine Klage beim zuständigen Gericht einzureichen. Nähere Informationen entnehmen Sie bitte den Hinweisen unter "Rechtsbehelfsbelehrung" des Widerspruchbescheids.

Das Widerspruchsverfahren ist kostenfrei, im Klageverfahren können gegebenenfalls Kosten auf Sie zukommen.

Hintergrundinformationen zum Feld SA651_ABRECHNUNGSWEG

Die Satzart 651 beinhaltet ambulante Diagnosen aus dem Vorjahr des Ausgleichsjahres. Gemäß der DaTraV-Datensatzbeschreibung sind folgende Merkmalsausprägungen möglich:
1 = Diagnose gem. § 295 SGB V
2 = Diagnose aus ambulanter Behandlung im Krankenhaus.
3 = Sonstiges

Gemäß den Bestimmungen des GKV-Spitzenverbandes (siehe [1]) werden die Ausprägungen der Werte wie folgt beschrieben:

Das Feld Abrechnungsweg ist wie folgt zu melden:
1 = Diagnosen, die per DTA nach § 295 SGB V übermittelt wurden.

2 = ambulante vertragsärztliche Diagnosen, die im Rahmen der stationsnahen
Versorgung gem. §§ 116a, 116b, 117, 118, 119 und 120 Abs. 1a SGB V dokumentiert
aber nicht über DTA (Datenträgeraustausch) nach § 295 SGB V übermittelt werden.

3 = Diagnosen von Sonstigen Leistungserbringern der ambulanten vertragsärztlichen
Versorgung, soweit diese weder über DTA nach § 295 SGB V abgerechnet
noch den Diagnosen der stationsnahen Versorgung (2) zugeordnet wurden.
Soweit keine Informationen vorliegen, die eine Zuordnung zum Kennzeichen "1"
oder "2" erlauben, erfolgt die Kennzeichnung mit "3".

Hinweise:

  • Die Daten im Feld SA651_ABRECHNUNGSWEG weisen eine unterschiedliche Qualität im Zeitverlauf je nach Abrechnungsbereich auf (siehe [2]). Dies liegt u.a. daran, dass einzelne Abrechnungsbereiche in unterschiedlichen Jahren vom Ersatzverfahren nach § 120 SGB V auf das Regelverfahren umgestellt haben.
  • Es wird angeraten, zusätzliche Recherchen zur historischen Datenmeldung bezüglich des Abrechnungsweges und der dahinterstehenden Verträge durchzuführen, ggf. bis auf die Ebene der Servicezentren der einzelnen Krankenkassen, welche die Datenmelder sind.

Fallbeispiele zum Feld SA651_ABRECHNUNGSWEG

Im Folgenden werden beispielhaft zwei Fragestellungen aufgezeigt, bei denen die oben genannten Restriktionen Auswirkungen auf die Analyse haben.

Frage 1: Werden im Feld SA651_ABRECHNUNGSWEG mit dem Wert 2 die in Krankenhäusern durchgeführten und abgerechneten ambulanten Behandlungsfälle nach § 295 Abs. 1 SGB V erfasst?

Nein, der Ort der Leistungserbringung "Krankenhaus" ist nicht eindeutig über das Feld SA651_ABRECHNUNGSWEG zu identifizieren.
Das Feld ist auf Grundlage der Verträge über den Datenträgeraustausch (DTA) gefüllt.

Es ist eine "2" vergeben, wenn es sich um ambulante vertragsärztliche Diagnosen handelt, "die im Rahmen der stationsnahen Versorgung gem. §§ 116a, 116b, 117, 118, 119 und 120 Abs. 1a SGB V dokumentiert aber nicht über DTA nach § 295 SGB V übermittelt" werden (siehe Bestimmung des GKV-Spitzenverbandes nach § 267 Abs. 7 Nr. 1 und 2 SGB V).

Es ist demnach möglich, dass in Krankenhäusern oder anderen Einrichtungen durchgeführte und abgerechnete ambulante Leistungen nach § 295 SGB V im Feld Abrechnungsweg mit dem Wert "1" gekennzeichnet sind.

Unter Beachtung der oben genannten Restriktionen sollte durch den Antragsteller vorab bewertet werden, ob die DatraV-Daten im Feld SA651_ABRECHNUNGSWEG mit dem Wert "2" ausreichen, um die Frage zufriedenstellend zu beantworten.

Es wird auf jeden Fall empfohlen die Werte "1" und "3" ebenfalls zu betrachten und ggf. Recherchen zur Datenmeldung, den Hintergründen und zu den genannten gesetzlichen Vorgaben und Verträgen durchzuführen. Dabei sollten auch zeitliche Aspekte und Verfahrensänderungen bei der inhaltlichen Bewertung der Daten berücksichtigt werden.

Frage 2: Ist es möglich zu analysieren, ob sich das Verhältnis der ambulanten Behandlungsfälle in Krankenhäusern zu den in den Praxen der niedergelassenen Vertragsärzte erbrachten über die Zeit verändert hat?

Es gelten die oben genannten Hinweise zur Abgrenzung der ambulanten vertragsärztlichen Diagnosen in Krankenhäusern oder anderen Einrichtungen. Darüber hinaus sind in den Diagnosedaten der DaTraV-Daten keine quartalsinternen Duplikate (z.B. Wiedervorstellung zur Kontrolle) enthalten. Somit kann keine Aussage über die Anzahl der Arztkontakte oder Anzahl der ambulanten Behandlungsfälle (die unterschiedlich definiert sein können) abgeleitet werden.

Nach Auffassung der Bundesbeauftragten für den Datenschutz und die Informationsfreiheit ist die Ausarbeitung zur Erlangung eines akademischen Grades, wie z.B. eine Promotion, eine Habilitation, einer Masterarbeit etc. immer eine Privatangelegenheit, so dass eine Antragsberechtigung verneint werden muss.

Nur als Mitarbeiter einer antragsberechtigten Institution (s. § 303 e SGB V) können Sie entsprechende Anträge stellen und gegebenenfalls Ergebnismengen erhalten. Eine Weiterverwendung der Ergebnismenge für Ihre persönlichen Zwecke ist jedoch nicht gestattet.

Uns ist bewusst, dass dies für eine angemessene wissenschaftliche Erschließung der DaTraV-Daten ein relevantes Problem darstellt. Daher suchen wir nach möglichen Lösungen.

Leider ist zu erwarten, dass hier keine kurzfristige Regelung in Ihrem Sinne getroffen werden kann.

Nein, davon kann man nicht ausgehen. Es gibt Versicherte, die die Krankenkasse gewechselt haben. Bei diesen kann - anders als man dies vielleicht erwartet - infolge einer sich ändernden Versichertennummer mehr als ein Datensatz pro Versicherten im Berichtsjahr vorliegen. Dies betrifft die folgenden Satzarten:

  • SA151 - Stammdaten
  • SA152 - Stammdaten
  • SA153 - extrakorporale Blutreinigung
  • SA751 - Leistungsausgaben
  • SA999 - Gemeindeschlüssel

Es könnte also aus diesem Grund sogar Versicherte mit unterschiedlichen Angaben zum Geschlecht, Geburtsjahr, zum Versterben und/oder zum Gemeindeschlüssel innerhalb eines Berichtsjahres geben.

In jedem Fall ist dieser Umstand bei der Auswertung von Versichertentagen und Leistungsausgaben zu beachten. Will man diese versichertenbezogen auswerten, sollten die relevanten Angaben pro Versicherten, der anhand des überjährigen Pseudonyms eindeutig identifiziert werden kann (PSID), aufsummiert werden. Bei der Aufsummierung der Versichertentage besteht allerdings ein Problem, denn Versichertenzeiten können sich zum Teil erheblich überlappen (s. FAQ): Laut den DaTraV-Daten waren fast 10.000 Versicherte jeweils mehr als 600 Tage im Jahr 2009 GKV-versichert. In den folgenden Jahren ist diese Zahl gesunken. Im Jahr 2012 waren dann "nur" noch 3.000 Versicherte jeweils mehr als 600 Tage GKV-versichert. Ein Grund dürfte sein, dass die gesetzlichen Krankenversicherungen seit 2006 ihren Bestand an Versichertennummern zunehmend auf eine bundeseinheitliche Versichertennummer umgestellt haben und dies Korrekturen ermöglicht, die zuvor nicht möglich waren.

Es macht in der Regel Sinn, eine Auswertungspopulation zu definieren, da z.B.

  • inkonsistente Angaben zum Geschlecht, Geburtsjahr, Versterben und/oder zum Gemeindeschlüssel innerhalb eines Berichtsjahres vorliegen können. (s. FAQ)
  • inkonsistente Angaben zum Geschlecht, Geburtsjahr und/oder zum Versterben von Berichtsjahr zu Berichtsjahr vorliegen können

Für unterschiedliche Angaben zum Geschlecht eines Versicherten kann es durchaus gute inhaltliche Gründe (z.B. eine Geschlechtsumwandlung) geben. Leider ist es aber anhand der Daten nicht möglich, zwischen einer inhaltlich begründeten Änderung und einer fehlerhaften Angabe zu unterscheiden. Man kann auch nicht einfach davon ausgehen, dass die jüngste Angabe die korrekte ist. Sie sollten also eine bewusste Entscheidung treffen, dokumentieren und kommunizieren, wie Sie mit unterschiedlichen Angaben zum Geschlecht eines Versicherten im Rahmen Ihrer Analyse umgehen wollen.

Unterschiedliche Angaben zum Geburtsjahr können sich zumindest zu Teilen aus unterschiedlichen Herangehensweisen an die Registrierung von Geburten ergeben, die sich aus dem Geburtsort und der Historie des Geburtslandes ergeben können. Insofern könnte die Festlegung, nur Versicherte mit konsistenten Angaben zum Geburtsjahr im Rahmen einer Analyse zu betrachten, durchaus einmal zu unerwünschten Verzerrungen führen. Sie sollten also auch zu diesem Aspekt eine bewusste Entscheidung treffen, diese dokumentieren und kommunizieren, wie Sie mit unterschiedlichen Angaben zum Geburtsjahr eines Versicherten im Rahmen Ihrer Analyse umgehen wollen.

In den Daten kommen auch Versicherte vor, die in einem Jahr als verstorben gekennzeichnet sind und in Folgejahren dennoch wieder erscheinen. Für Ihre Analyse könnte dies aber durchaus von Bedeutung sein, und daher sollten Sie auch zu diesem Aspekt eine bewusste Entscheidung treffen.

Nicht für alle Versicherten liegen die vollständigen Informationen z.B. zu Diagnosen und Arzneimittelverordnungen pro Berichtsjahr vor. Dies ist u.a. der Fall, wenn Versicherte im Folgejahr das GKV-System verlassen haben (s. FAQ). Aber auch Dokumentationslücken, die sich z.B. aus einem Kassenwechsel innerhalb des GKV-Systems oder durch Erstattung der ambulant erbrachten Leistungen nach § 13(2) oder § 53(4) SBG V ergeben, können einen relevanten Einfluss auf das Analyseergebnis haben. Ob und ggf. in welchem Umfang Sie Dokumentationslücken für Ihre Analyse in Kauf nehmen können, sollten Sie ebenfalls bewusst entscheiden, dokumentieren und kommunizieren.

Wir empfehlen in jedem Fall konkret zu erwägen, ob die Auswertungspopulation anhand folgender Kriterien im Kontext Ihrer Fragestellung hinreichend gut definiert werden kann:

  • konsistente Angaben zum Geburtsjahr
  • konsistente Angaben zum Geschlecht
  • mindestens 360 Versichertentage pro Berichtsjahr
  • Ausschluss von Versicherten mit Versichertentagen nach § 13(2) und § 53(4) SGB V

Hinweis: Es kann sinnvoll sein, die Anwendung dieser und auch anderer von Ihnen in Betracht gezogener Kriterien auf ihre möglichen Auswirkungen hin zu analysieren. Dies gilt beispielsweise dann, wenn Sie sehr seltene Erkrankungen untersuchen wollen.

Bei so gut wie allen bisher eingereichten Anträgen ist der Beratungs- und Abstimmungsbedarf zur Methodik, deren Umsetzung und zu den Maßnahmen zur Wahrung des Identitätsschutzes der Versicherten sehr hoch (s. Evaluationsbericht Abschnitte 5.1.4 und 6.2.3, vgl. [ID 24 - ID 26]). Hinweis: Mit dem Kürzel [ID XX] wird auf Handlungsoptionen hingewiesen, die insbesondere im Teil 2 des Evaluationsberichts erläutert und bewertet werden.

Eine Abwägung des angestrebten Erkenntnisgewinns und des Identitätsschutzes der Versicherten ist erforderlich. Sie ist im Rahmen der Prüfung eines Antrags nach § 303e (3) SGB V bzw. § 5 (3) DaTraV sowie bei der Festlegung der Maßnahmen zur Sicherstellung der primären und sekundären Geheimhaltung vorzunehmen. Sie ist i.d.R. aufwendig. Sie erfordert u.a. eine inhaltliche Einarbeitung und Bewertung der Fragestellung, der Methodik, deren Umsetzung sowie der Ergebnismenge (s. Evaluationsbericht Abschnitt 5.1.4, vgl. [ID 12 - ID 14]).

Im Rahmen der Wahrung des Identitätsschutzes der Versicherten ist auszuschließen, dass aufgrund der Mindestfallzahlregelung modifizierte Werte (primäre Geheimhaltung) anhand anderer, nicht modifizierter Werte zurückgerechnet werden können. Diese Sicherstellung der sekundären Geheimhaltung ist aufwendig, da sie antragsspezifisch zu konzipieren, umzusetzen und zu prüfen ist (vgl. [ID 51]). Im Gegensatz zur primären Geheimhaltung kann sie nicht (ohne weiteres und ohne andere Nachteile) automatisiert werden.

Aufgrund sehr häufiger und auch länger andauernder Unterbrechungen ist immer wieder eine Einarbeitung in die Inhalte eines Antrags erforderlich. Dazu kommt es, da die beiden Analysten zahlreiche weitere Aufgaben haben (siehe Evaluationsbericht Abschnitt 10.4), Antragsteller Rückfragen des Öfteren nicht zeitnah beantworten oder das First-In-First-Out-Prinzip nicht eingehalten werden kann (vgl. [ID 42 - ID 43]). Dies führt auch dazu, dass eine Einschätzung der Zeit bis zur Bescheidung eines Antrags leider nicht möglich ist.

Den Bearbeitungsaufwand erhöht auch die - aus Sicht der IT-Sicherheit unverzichtbare - Notwendigkeit, dass die DaTraV-Daten auf einem komplett abgeschotteten, von außen also nicht erreichbarem System vorgehalten und ausgewertet werden. Für jede Bereitstellung einer Ergebnismenge oder für jedes Einspielen eines eingereichten Skripts ist daher eine sogenannte "Datenschleusung" mit verschiedenen Prüfschritten vorzunehmen.

Nicht unerwähnt bleiben sollte in diesem Kontext, dass zur Qualitätssicherung auch an anderen Stellen Prüfungen erforderlich sind. So gilt z.B. im Rahmen der Identitätsschutzprüfung bei Vorliegen eines Skripts und der Ergebnismenge (inhaltliche Prüfung II) das Vier-Augen-Prinzip (vgl. [ID 31]).

Die langen Bearbeitungszeiten ergeben sich aus den vorgenannten Gründen. Hinzu kommt noch, dass Anträge mit sehr hohem Beratungs- / Abstimmungsbedarf und einfache Anträge nicht unabhängig voneinander bearbeitet werden können. Einfache Anträge werden quasi durch schwierige Anträge ausgebremst (vgl. [ID 29]).

Im Evaluationsbericht Abschnitt 5.1.2. und 5.1.3 finden sich Empfehlungen wie der Bearbeitungsaufwand und die Bearbeitungsdauer abgesenkt werden können.