Demographie der Spender:innen in der Studie „Tests, Symptome und Lebenssituation“

Einleitung

In den bisherigen Blogposts sind wir schon einmal auf die Soziodemographie und räumliche Verteilung der Spender:innen eingegangen.

In diesem Blogpost wollen wir uns erneut mit der soziodemographischen Zusammensetzung und der räumlichen Verteilung der Spender:innen beschäftigen. Wir werden für die Analyse jeweils zwei Auswahlebenen bzw. Selektionsstufen betrachten und diese mit der tatsächlichen Bevölkerungszusammensetzung (Fortschreibung des Zensus, Stand: 31.12.2019) vergleichen. Dazu schauen wir uns die Soziodemographie und die räumliche Verteilung anhand von drei Variablen an: räumliche Verteilung auf Bundeslandebene (anhand der ersten drei Stellen der angegebenen Postleitzahl klassifiziert), Geschlecht und Alter (erfasst in 10er Kategorien). In der ersten Gruppe werden die Daten der Selbstangabe bei Neuregistrierung aller Datenspender:innen ausgewertet, in der zweiten Gruppe die Daten der Teil-Studie „Tests, Symptome und Lebenssituation“. Wir möchten damit zwei Fragen nachgehen:

  1. Wie sehr weicht die aktuelle Stichprobe aller an der Datenspende teilnehmenden Personen von der wahren Verteilung in der Bevölkerung (Bevölkerungsfortschreibung Stand: 31.12.2019) ab?
  2. Wie sehr unterscheiden sich Spender:innen, die an der Teil-Studie „Tests, Symptome und Lebenssituation“ teilgenommen haben, von der gesamten Spender:innen-Stichprobe?

Regionale Verteilung

Um die regionale Verteilung der Spender:innen abzubilden, schauen wir zunächst auf die Postleitzahl der Spender:innen. Diese ordnen wir dem entsprechenden Bundesland zu. Aus Gründen des Datenschutzes erheben wir dabei nur die ersten drei Ziffern der Postleitzahl der Spender:innen (und geben somit keine Verteilung auf Landkreisebene mehr an).

Betrachten wir die räumliche Verteilung innerhalb der Bundesländer im Vergleich zur wahren Verteilung in der Bevölkerung (Abbildung 1, Balkendiagramm) zeigen sich unterschiedliche Teilnahmeraten in den Bundesländern. In den Bundesländern Hamburg und Berlin sehen wir, dass die Spender:innen überproportional häufig im Verhältnis zur Bevölkerungsverteilung vertreten sind. So sagt der Wert 0.41 von Hamburg aus, dass im Vergleich zur Verteilung in der Bevölkerung rund 40 Prozent mehr Hamburger:innen in der Datenspende Stichprobe vertreten sind, als nach der Bevölkerungsverteilung in Hamburg zu erwarten wäre. Dahingegen lässt sich erkennen, dass die Bundesländer Sachsen-Anhalt, Thüringen, Mecklenburg-Vorpommern und Sachsen deutlich unterrepräsentiert sind. Diese Verteilung spiegelt sich auch dann wieder, wenn wir uns alle Spender:innen berechnet auf jeweils 100.000 Einwohner pro Bundesland anschauen (Abbildung 1, Deutschlandkarte).

Abbildung 1: Verteilung der gesamten Datenspende-Stichprobe berechnet auf 100.000 Einwohner in den Bundesländern (Karte) und Vergleich der Bundeslandverteilung der Datenspender-Stichprobe zur Bevölkerungsfortschreibung Stand: 31.12.2019 (Balkendiagramm)

Ähnliche Ergebnisse sehen wir auch bei dem Vergleich der Teilnehmenden der Teil-Studie „Tests, Symptome und Lebenssituation“ mit der Verteilung in der Bevölkerung (Abbildung 2, Balkendiagramm). Die Verteilung der Teil-Studie entspricht fast der Verteilung aller an der Datenspende teilnehmenden Personen innerhalb der Bundesländer im Bezug zur Bevölkerung. Hier ist die relative Verteilung der Teil-Studien-Teilnehmenden in den Bundesländern Hamburg und Berlin ebenfalls deutlich höher, als die Verteilung in der Bevölkerung. Am stärksten unterrepräsentiert sind auch hier die Bundesländer Sachsen-Anhalt, Mecklenburg-Vorpommern und Thüringen, dicht gefolgt von Sachsen. Diese Verteilung spiegelt sich auch dann wieder, wenn wir uns alle Spender:innen berechnet auf jeweils 100.000 Einwohner pro Bundesland anschauen (Abbildung 2, Karte).

Abbildung 2: Verteilung der Teil-Studie berechnet auf 100.000 Einwohner in den Bundesländern (Karte) und Vergleich der Bundeslandverteilung der Teil-Studie-Stichprobe zur Bevölkerungsfortschreibung Stand: 31.12.2019 (Balkendiagramm)

Geschlechtsverteilung

Im nächsten Schritt betrachten wir die Geschlechterverteilung unter allen Datenspender:innen und unter den Spender:innen der Teil-Studie. Auf den ersten Blick fällt auf, dass im Vergleich zur Gesamtbevölkerung Datenspender überrepräsentiert und Datenspenderinnen unterrepräsentiert sind. Dasselbe Ergebnis sehen wir auch für die Teilnehmenden der Teil-Studie. Hier sehen wir außerdem, dass sich der Geschlechterunterschied in der Teil-Studie verstärkt. In unserem alten Blogpost zur Soziodemographie der Spender:innen mussten wir bei der Geschlechtsverteilung eine Korrektur vornehmen. Bereits seit Start der Datenspende nehmen mehr Männer als Frauen an der Datenspende teil.

Abbildung 3: Geschlechts-Verteilung der Datenspender-Stichprobe (Bevölkerungsfortschreibung Stand: 31.12.2019)

Altersverteilung

Im Wesentlichen sehen wir eine unterschiedliche Altersverteilung in unseren Daten im Vergleich zur Altersverteilung der Gesamtbevölkerung. Wir sehen, dass sowohl die Teilnehmenden an der Datenspende, als auch die Teilnehmenden der Teil-Studie in der jüngsten leicht und in älteren Altersgruppen stark unterrepräsentiert sind. Deutlich überrepräsentiert im Vergleich zur Gesamtbevölkerung sind die Altersgruppen von 30 bis 59 Jahren. Der Vergleich zwischen den Teilnehmenden an der Datenspende und den Teilnehmenden an der Substudie, zeigt nur geringfügige Selektionseffekte hinsichtlich des Alters. Betrachten wir die Altersverteilung differenziert nach Geschlecht, so sehen wir bei den Frauen größere Unterschiede in der Teilnahmebereitschaft zwischen der Datenspende sowie der Teil-Studie, insbesondere bei den Altersgruppen 40 bis 59 Jahren.

Abbildung 4: Verteilung des Alters für die Datenspende (Bevölkerungsfortschreibung Stand: 31.12.2019)

Ausblick oder was erwartet euch im nächsten Post?

Im nächsten Post werden wir euch einen weiteren Einblick zur soziodemographischen und zur gesundheitlichen Lage der Datenspender:innen in der Studie „Tests, Symptome und Lebenssituation“ geben. Wir werden weitere Vergleiche bspw. zur subjektiv eingeschätzten Gesundheit mit Referenzdaten (auch Benchmark genannt) aus repräsentativen Gesundheitsstudien des RKI darstellen. So nähern wir uns immer weiter einem der Ziele der Teil-Studie, die Stichprobenzusammensetzung genauer zu beschreiben.

Johannes Lemcke
Robert Koch Institute
Daniel Grams
Robert Koch Institute
Ilter Öztürk
Robert Koch Institute
Ronny Kuhnert
Robert Koch Institute