Fieberhaft
Erinnert Ihr euch an das Ziel der Datenspende? Als wir dieses Projekt vor drei Monaten konzipiert und gestartet haben, wollten wir die täglichen Spenden von Vitaldaten nutzen, um bei Spender:innen beginnendes Fieber zu detektieren. Da Fieber ja ein wesentliches Symptom der COVID-Erkrankung ist, hoffen wir damit indirekt Veränderungen in der Dynamik der COVID-Pandemie erkennen und messen zu können. Die wissenschaftlichen Details dieser Idee haben wir im Blogpost Wie funktioniert die Datenspende? diskutiert.
Obwohl diese Idee konzeptionell einfach ist, steckt der Teufel im Detail. Wir mussten sicherstellen, dass zusätzliche Einflüsse wie Klima, Wetter, Ferien, und wöchentliche Modulationen der Spender:innen-Vitaldaten die Resultate nicht verfälschen und nebenher viele Algorithmen vergleichen, Optimierungen durchführen und mit Lücken in den Daten umgehen. Viele der hierzu notwendigen Analysen wurden in den vorherigen Blogposts diskutiert, und führten nebenbei zu spannenden wissenschaftlichen Einsichten, die zu Beginn außerhalb des Rahmens und der Zielsetzung des Projekts lagen.
Nun ist es aber soweit. Heute können wir mit euch die ersten soliden Resultate unserer Fieberdetektion teilen, basierend auf der Corona-Datenspende.
Das Ergebnis ist die erste Fieberkurve. Sie ist noch vorläufig und kann sich in Zukunft mit der Weiterentwicklung unseres Detektionsalgorithmus ändern. Aber nach allen Tests, die wir durchgeführt haben, sind wir heute sehr überzeugt, dass wir tatsächlich in den Daten ein “Signal sehen”. Die ganze Sache scheint zu funktionieren.
Nach welchen Signalen suchen wir?
Nochmal kurz rekapituliert: Viele Spender:innen haben mittlerweile lange Zeitreihen der täglichen Ruhepuls-Werte und der täglichen Schrittanzahl gespendet. In diesen individuellen Zeitreihen wollen wir Abweichungen von “normalen” Wertebereichen detektieren. Zum Beispiel können ein plötzlicher Anstieg des Ruhepulses und erhöhte Werte über einige Tage Fiebersymptome sein. Dazu müssen wir zuerst bestimmen, welche Werte für jede(n) einzelne(n) Spender:in “normal” sind. Das ist die sogenannte Baseline. Um eine belastbare Baseline zu bestimmen, benötigen wir viele Datenpunkte, also eine lange Vorlaufmessung, da Vitaldaten naturgemäß um die Baseline schwanken.
Baseline
Die obige Abbildung zeigt den zeitlichen Verlauf des Ruhepulses (RP) und die täglichen Schritte einer Spender:in. Die Zeitreihen zeigen keine ungewöhnlichen Abweichungen von den Basiswerten. Während des gesamten Beobachtungszeitraums sind die Kurven bis auf kleine, unregelmäßige Schwankungen flach. Der Ruhepuls schwankt dabei weniger, die Schrittzahlwerte merklich stärker. Das ist aber völlig normal, wie wir aus unseren anfänglichen Analysen dieser Größen wissen. Die wichtigsten Erkenntnisse findet ihr in den Blogposts Der Puls der Nation und Schritt für Schritt.
Vermutlich das falsche Signal
Im Vergleich dazu zeigt die nächste Abbildung die Zeitreihen einer Spender:in, die durchaus Abweichungen von der Baseline aufweisen.
Diese Spender:in hat einen typischen Ruhepuls von ungefähr 55 Schlägen pro Minute und eine typische tägliche Schrittzahl von ungefähr 5000 Schritten. Am Ende des Beobachtungszeitraums steigt der Ruhepuls plötzlich auf einen Wert, der deutlich über dem Basiswert liegt. Man bedenke, dass diese Zahlen Tagesmittelwerte sind. Könnte dies ein Hinweis auf Fieber sein? Wahrscheinlich nicht, weil der erhöhte Ruhepuls mit einem Anstieg der täglichen Schritte einhergeht. Möglicherweise handelt es sich also um eine Person, die Urlaub gemacht hat oder eine Zeit lang Sport treibt. Menschen mit Fieber haben vermutlich keinen signifikanten Anstieg in den Schrittanzahlwerten, sondern mit viel größerer Wahrscheinlichkeit eine Abnahme.
Detektionen
Schaut euch jetzt die Zeitreihen zwei weiterer Spender:innen in den nächsten beiden Abbildungen an. Beide weisen eine deutliche und gut definierte Abweichung des Ruhepulses auf, die “Fieberbeule”, die mehrere Tage anhält. Gleichzeitig nimmt die tägliche Schrittzahl im gleichen Zeitraum ab! Die Hypothese hier ist, dass dies Kandidat:innen für “krank und mit Fieber im Bett” sind.
Natürlich kann es unterschiedliche Erklärungen für dieses Verhalten geben. Solche Detektionen sind im Einzelfall nicht zuverlässig. Es kann falsch positive und falsch negative Detektionen geben.
Wenn wir jedoch Detektionen für die gesamte Bevölkerung aggregieren und die Erkennungen an jedem Tag zählen, können wir diese Tageswerte untereinander vergleichen. Dann können systematische Änderungen in der Anzahl der Detektionen auf systematische Änderungen in der realen Anzahl der fiebrigen Personen hinweisen.
Wie funktioniert die Detektion?
Jetzt können wir natürlich nicht alle Hunderttausende von Signalen einzeln betrachten. Wir müssen einen Algorithmus anwenden, der automatisch diejenigen kennzeichnet, die Spitzen und Kurvenverläufe wie die oben gezeigten aufweisen. Diese automatischen Erkennungsalgorithmen basieren auf statistischen Methoden, mit denen systematische Abweichungen von der Baseline quantifiziert werden (die oben gezeigten Kurven wurden auf diese Weise identifiziert). Nun gibt es verschiedene Möglichkeiten, die sich alle im Detail unterscheiden und alle versuchen, die Anzahl der falsch positiven und negativen Detektionen zu minimieren. Einige beinhalten dynamische Aspekte, andere nicht. Da wir noch nicht wissen, welcher Algorithmus am besten funktioniert, probieren wir verschiedene aus und vergleichen die Ergebnisse immer miteinander. Dabei achten wir besonders auf die Dinge, die gleich bleiben, egal welchen Algorithmus wir verwenden. Wenn wir auf vielen Wegen zum gleichen Ergebnis kommen, dann ist es wahrscheinlich, dass wir der wahren Fieberkurve dicht auf der Spur sind!
Signale anhand des Ruhepulses erkennen
Wenn wir den Algorithmus nur auf das Ruhepulssignal anwenden und die potenziellen “Fieber-Detektionen” täglich und für jede Spender:in mit ausreichend langen Zeitreihen berechnen, erhalten wir das folgende Ergebnis. Die erste Fieberkurve!!
In der Abbildung sind zwei verschiedene Kurven zu erkennen, die unterschiedlichen statistischen Methoden zur Erkennung von Fieber im Ruhepulssignal einzelner Spender:innen entsprechen. Die Kandidat:innen hatten alle im zweimonatigen Beobachtungszeitraum (23. April bis 23. Juni) an fast allen Tagen Daten beigesteuert. Beide Kurvenverläufe sind sich ähnlich aber verschoben. Ein Algorithmus scheint ein paar Fiebersignale mehr zu detektieren. Allerdings kannes sich dabei auch um falsche Detektionen handeln. Wir sehen auch, dass beide Kurven anfänglich abfallen. Möglicherweise hängt das mit der Abnahme von COVID-Fällen, anderen akuten Atemwegserkrankungen oder grippeähnlichen Krankheiten zusammen, die Fiebersymptomatik zeigen. Am Ende des Zeitfensters sehen wir einen steilen Anstieg der Anzahl der Detektionen. Wir können auch interessante Modulationen von Höhen und Tiefen im Zentrum der Beobachtungsperiode erkennen. Wir wissen noch nicht, woher diese kommen.
Hängt die Zunahme der Detektionen Mitte bis Ende Juni mit steigenden COVID-Infektionen zusammen und sind diese vielleicht die Konsequenz der Lockdown-Lockerungen? Vielleicht. Aber: Hier wurde ja nur der Ruhepuls betrachtet. Die Zunahme der Detektionen kann auch damit zusammenhängen, dass immer mehr Spender:innen in den Urlaub fahren und ungewöhnliche Kombinationen des Ruhepulses erzeugen, weil sie beispielsweise im Urlaub mehr Sport treiben.
Einbeziehung der täglichen Schrittanzahl
Um die Auswirkungen einer zunehmenden bevölkerungsweiten körperlichen Aktivität (Urlaub, Sommer usw.) auszuschließen, haben wir den Detektionsprozess verfeinert und erneut durchgeführt. Dieses Mal wird ein positives Signal nur gezählt, wenn ein ungewöhnlich hoher Anstieg des Ruhepulses mit einer Abnahme der täglichen Schrittanzahl zusammenfällt und diese Kombination einige Tage anhält.
Da dies eine restriktivere Methode ist, erkennen wir natürlich weniger Fälle. Wir sehen auch, dass die Zunahme der Detektionen am Ende des Beobachtungszeitraums erheblich verringert ist. Der zunehmende Trend ist jedoch weiterhin zu beobachten. Da der Anstieg in den Detektionen in der verfeinerten Methode immer noch sichtbar ist, glauben wir, dass wir hier tatsächlich einen Anstieg in der Zahl der Spender:innen mit Fieber sehen.
Das ist nicht überraschend. Der gemessene Effekt kann mit neuen COVID-19-Infektionen zusammenhängen. Denkt aber daran, dass die Methode nur Fieber misst und nicht direkt COVID-19-Infektionen messen kann. Offensichtlich führt die Aufhebung des Lockdowns zu einem Anstieg an Infektionen mit dem Coronavirus, aber auch alle anderen ähnlich übertragbaren Infektionskrankheiten werden nach dem Lockdown wieder leichter übertragen. Unsere Methode ist eben Proxy für die Messung aller Arten von Infektionen, die Fiebersymptomatik zeigen.
Vergleich mit anderen Datenquellen
Um die Plausibilität des Ansatzes zu überprüfen, haben wir die berechneten Fieberkurven mit anderen Datenquellen verglichen. Wir haben hier zwei relevante Datensätze verwendet: 1.) Die Anzahl der bestätigten Fälle von COVID-19 in Deutschland und 2.) die Inzidenz akuter Atemwegserkrankungen in Deutschland, die mit Hilfe des GrippeWeb-Projekts geschätzt und wöchentlich aktualisiert wird.
Die obige Abbildung vergleicht Wochenwerte der Inzidenz akuter Atemwegserkrankungen in Deutschland, die COVID-19-Fallzahlen und die Corona-Datenspende-Detektionskurve. Dieser Vergleich ist vielversprechend. Zum Beispiel stimmt der vom GrippeWeb gemessene Anstieg der Atemwegserkrankungen mit unseren Vorhersagen überein und die Gesamtform der Kurven ähnelt sich.
Wir müssen diese Datenquellen länger vergleichen, aber im Moment sieht das alles sehr gut aus. Wir sind also optimistisch, dass die Methode funktioniert!
Was kommt als nächstes?
Hier die nächsten Schritte auf unserer To-Do-Liste:
- Verfeinern und Testen des Detektionsalgorithmus. Wir planen, Techniken zu integrieren, die aus der Theorie dynamischer Systeme und der Mustererkennung stammen. Möglicherweise können wir einzelne Fieberkurven dann besser unterscheiden.
- Wir werden dieselbe Analyse, wie wir sie hier zeigen, auch auf der Ebene der Bundesländer durchführen, damit wir sehen können, ob jedes Bundesland den gleichen universellen Trend aufweist oder ob der Trend auf nationaler Ebene von dominanten Bundesländern bestimmt wird.
- Wir werden auch versuchen, mithilfe dieser Methode in Kombination mit Korrelationsanalysen zu ermitteln, ob wir Signale lokaler COVID-19-Ausbrüche erfassen können.