COVID-19 & Fiebermessungen
Die Corona Datenspende wurde konzipiert, um in den Zeitreihen des Ruhepulses und der täglichen Schrittanzahl der Spender:innen Anomalien zu identifizieren und damit Fiebersymptomatik zu detektieren. Im Blogpost “Wie funktioniert die Corona-Datenspende?” wurden die Grundidee und die Funktionsweise genauer erklärt und im Post “Fieberhaft” haben wir erste Ergebnisse gezeigt.
Im Zusammenhang mit der Pandemie ist das wichtig, weil Fieber ein typisches Symptom der COVID-19-Erkrankung sein kann. Wenn wir nun einen Anstieg in den potenziellen Fieber-Detektionen messen, kann das ein Zeichen sein, dass auch die Anzahl der COVID-19 Fälle in Deutschland steigt.
Aber funktioniert das?
Um die Funktionsweise zu testen, vergleichen wir die zeitliche Entwicklung der bestätigten täglichen COVID-19-Neuerkrankungen mit den aus der Corona Datenspende errechneten Fieberfällen in der Gemeinschaft der Spender:innen. Wenn beide Zeitverläufe eine gleiche oder ähnliche Form haben, wenn sie also ähnliche “Berge” oder “Täler” im Kurvenverlauf zeigen, ist das ein Indiz dafür, dass wir auf der richtigen Spur sind und dass das Projekt funktioniert - also die Ermittlung von Fieber aus Fitness-Tracker-Daten. Die nächste Abbildung zeigt genau diesen Vergleich:
In der Abbildung sieht man den vollständigen zeitlichen Verlauf der COVID-19-Neuerkrankungen in Deutschland zwischen Anfang März und Ende August 2020. Im Vergleich dazu zeigt die Abbildung die berechnete Fieber-Detektionskurve, die aus den Daten der Spender:innen ermittelt wurde. Diese Kurve deckt nur das Zeitfenster von Ende Mai bis Ende August ab, da das Corona Datenspende Projekt erst im April gestartet wurde. Beim Vergleich der Kurven kommt es nicht darauf an, dass sie deckungsgleich übereinander liegen, sondern proportional zueinander verlaufen, denn die COVID-19 Fallzahlen sind nicht identisch mit den Fieberfallzahlen. Viel wichtiger ist, dass die Kurven ähnliche “Ups-and-Downs” zeigen.
Unterm Strich: Dass beide Kurven in etwa gleiche Trends aufweisen, ist ein Indiz dafür, dass die Fieber-Detektion auf Basis der Spender:innen-Daten auf das Signal “COVID-19-Neuinfektionen” reagiert. Das sind gute Nachrichten! Aber: man muss immer bedenken, dass dies nur die ersten Schritte auf dem Weg in die richtige Richtung sind und der Prozess als Ganzes noch verbessert werden muss. Als erstes Ergebnis ist das aber außerordentlich vielversprechend.
Es lohnt sich sogar genauer hinzuschauen und die letzten Wochen unter die Lupe zu nehmen:
Im oberen Bild sieht man erneut den Vergleich zwischen COVID-19-Neuinfektionen und den aus der Datenspende errechneten Fieberfallzahlen der letzten 14 Wochen. Man kann ein paar wichtige Elemente erkennen, z.B. deckt sich der Anstieg der COVID-19-Neuerkrankungen zwischen Anfang Juli bis Mitte August 2020 mit dem Anstieg der Fieber-Detektionen. Außerdem scheint die Fieberkurve den gemeldeten COVID-19-Fällen etwa eine Woche “voraus” zu sein. Das könnte bedeuten, dass wir in den Corona Datenspende Daten einen möglichen Anstieg der Fallzahlen schon eine Woche früher sehen. In diesem Fall wäre die Corona Datenspende ein wertvolles Frühwarnsystem. Allerdings müssen wir noch einige wichtige Tests durchführen, um in dieser Sache Gewissheit zu haben und Zufall ausschließen zu können.
Fieber bedeutet nicht COVID-19
Das sind alles gute Neuigkeiten. Aber wir müssen bedenken, dass die Corona Datenspende konzipiert wurde, um aus den Zeitreihen der Fitnesstracker auf Fieber zu schließen. Ob eine COVID-19-Erkrankung vorliegt, kann das System (noch) nicht feststellen. Neben COVID-19 gibt es viele andere Infektionskrankheiten, die ein Fieber verursachen können. Die Corona Datenspende Algorithmen können (noch) nicht differenzieren. Also ist es wichtig zu untersuchen, ob die gemessenen Fieberkurven vielleicht durch andere Infektionskrankheiten dominiert werden, z.B. grippale Infekte oder andere Atemwegserkrankungen.
In der nächsten Abbildung vergleichen wir deshalb die COVID-19-Neuerkrankungen und die gemessenen Fieberkurven mit wöchentlich aggregierten Daten zu grippeähnlichen Erkrankungen und akuten Atemswegserkrankungen, die über das GrippeWeb Portal des RKI gesammelt werden.
Die Daten in der Abbildung sind auf Wochenbasis aggregiert. Wenn man die Kurven vergleicht, ist kein starker Einfluss der grippeähnlichen Erkrankungen oder der akuten Atemwegserkrankungen auf die gemessenen Fieberkurven erkennbar. Jedoch ähneln sich die Kurvenverläufe der COVID-19-Fallzahlen und der Corona Datenspende Fieber-Detektionen stark. Das ist jedoch nur ein erstes Indiz, dass die Corona Datenspende Analyse ein Indikator für die COVID-19 Dynamik darstellt, denn es spielen noch andere Faktoren eine Rolle, die wir bisher nicht ausschließen können.
Was kommt als nächstes?
Motiviert durch diese vielversprechenden Ergebnisse wollen wir unsere Methoden weiter verfeinern und verbessern. Zusätzlich zu den statistischen Methoden, die wir momentan für die Detektion verwenden, wollen wir untersuchen, ob diese noch verbessert werden können, beispielsweise durch Mustererkennungsverfahren, die noch genauer Anomalien in den Ruhepuls- und Schrittzahldaten erkennen. So könnten wir den Anteil von falschen Fieber-Detektionen weiter verringern. Ebenso müssen wir den Einfluss externer Faktoren wie Wetteränderungen und Klima untersuchen. Es bleibt also noch viel Spielraum für Verbesserungen und Weiterentwicklungen.