Pharmazeutische Zeitung online Avoxa
whatsApp instagram facebook bluesky linkedin xign

Von Google finanziert
-
Covid-19-Datenbank listet Millionen von Einzelfällen

Wie schnell breiten sich neue Coronavirus-Varianten unter den Menschen aus? Schützen Impfstoffe auch vor Infektionen mit dem Virus und wie lange hält die Immunität gegen Covid-19 an? Zur Beantwortung derartiger Fragen können Experten seit letzter Woche eine riesige internationale Datenbank zu Rate ziehen, die von Google finanziert und für jedermann freigegeben wurde.
AutorKontaktTheo Dingermann
Datum 01.03.2021  15:30 Uhr

Von der Einzelinitiative zum Gigaprojekt

Seinen Ursprung hatte das Projekt in der Erstellung einer simplen Google-Tabelle genommen, die auf Basis individueller Initiativen von Epidemiologen im Januar 2020 angelegt worden war, um einen Überblick über die neue Krankheit aus dem chinesischen Wuhan zu bekommen. Dieses händische Projekt stieß jedoch schon bald an seine technische Obergrenze. Nachdem die Zahl von etwa 100.000 Datensätzen überschritten wurde, suchten die Protagonisten nach Hilfe und baten um Unterstützung.

Im April begannen dann Produktentwickler bei Google und Google.org, dem gemeinnützigen Arm des Datengiganten aus dem Silicon Valley, die Forscher zu unterstützen. Gemeinsam schrieb das Konsortium Computerprogramme, die automatisch die täglichen Coronavirus-Daten von etwa 60 Regierungen in ein standardisiertes Format integrierten. Zudem wurden die Daten programmgesteuert auf Dopplungen überprüft und es wurde ein Algorithmus entwickelt, der die aus der ganzen Welt einlaufenden Informationen in eine einzige Cloud-basierte Datenbank zusammenführte.

Priorität auf Datenschutz

Die Datenbank ist zugänglich für jedermann. Man muss sich registrieren und kann dann auf bis zu 8 Gigabyte an anonymisierten Daten der neuesten Version der Global.health-Datenbank zugreifen. »Bei etwa der Hälfte der 24 Millionen Einzelfälle wurden Daten für ein Dutzend Variablen mitintegriert und etwa 10 Prozent der Datensätze enthalten noch mehr Variablen«, sagt Professor Dr. Samuel Scarpino, ein Epidemiologe, der das Emergent Epidemics Lab an der Northeastern University in Boston leitet. Insgesamt könnten bis zu 40 Variablen pro Fall eingetragen werden.

Entfernt werden alle Daten, die Erkrankte identifizierbar machen. Für die Fälle aus Deutschland gibt es etwa Angaben über das ungefähre Alter, das Geschlecht und das Datum der ersten Symptome. Offenbar stammen aus Deutschland überdurchschnittlich viele Einträge. Momentan sind mehr als 2,26 Millionen Fällen aus der Bundesrepublik in der Datenbank enthalten. Andere Staaten, darunter beispielsweise Frankreich, beteiligen sich derzeit noch gar nicht.

Im Moment beschränken sich die Datenvisualisierungen der Website auf Karten, die die vom Team gesammelten Daten anzeigen. Scarpino merkt an, dass Infografiken nicht im Fokus standen, weil zunächst besonderes Augenmerk auf die Standardisierung der Datenerfassung und den Umgang mit Datenschutzfragen gerichtet wurde. Man habe sich mit Rechts- und Ethikexperten darüber beraten, wie man anonymisierte Daten über Einzelpersonen, die von Regierungsbehörden, Universitäten und Krankenhäusern oft streng gehütet werden, sicher handhaben und weitergeben kann, sagt er.

Und man denkt auch schon weiter. Scarpino hofft, die Covid-19-Datenbank irgendwann auf eine anpassbare Plattform zu erweitern, um andere Krankheiten zu erfassen – insbesondere im Zusammenhang mit möglichen neuen Epidemien. Aber dazu bräuchte man ein Unternehmen oder eine gemeinnützige Organisation, die ein solches Projekt vorantreibt.

Mehr von Avoxa