Pharmazeutische Zeitung online
Von Google finanziert

Covid-19-Datenbank listet Millionen von Einzelfällen

Wie schnell breiten sich neue Coronavirus-Varianten unter den Menschen aus? Schützen Impfstoffe auch vor Infektionen mit dem Virus und wie lange hält die Immunität gegen Covid-19 an? Zur Beantwortung derartiger Fragen können Experten seit letzter Woche eine riesige internationale Datenbank zu Rate ziehen, die von Google finanziert und für jedermann freigegeben wurde.
Theo Dingermann
01.03.2021  15:30 Uhr

Die Datenflut rund um das neue Coronavirus und um die von ihm verursachten epidemiologischen und pathologischen Probleme ist mittlerweile riesig. Um dennoch die Übersicht nicht zu verlieren, hilft jetzt eine neue Datenbank. In diese wurden von der Data-Science-Initiative »Global.health« eine noch nie dagewesene Menge an anonymisierten Informationen über einzelne Fälle eingestellt. Für jeden dieser Fälle lassen sich bis zu 40 Variablen abfragen, darunter zum Beispiel das Datum, an dem eine Person zum ersten Mal Covid-19-Symptome verspürte, das Datum, an dem die Infektion durch einen positiven Test bestätigt wurde, oder auch Bewegungsdaten.

Die Datenbank wurde von 21 Forschern an sieben akademischen Einrichtungen in den USA und Europa erstellt. Dies waren die Universitäten Oxford, Harvard und Northeastern, das Boston Children's Hospital, die Georgetown-Universität und die University of Washington sowie das Johns Hopkins Center for Health Security. Technische und finanzielle Unterstützung hatten die Wissenschaftler von Google und der Rockefeller Foundation erhalten. Bislang hat das Team Informationen von 24 Millionen Fällen aus rund 150 Ländern gesammelt. Die Forscher hoffen, dass die Datenbank ihnen helfen wird, Coronavirus-Varianten und Impfstoffe in den kommenden Monaten zu überwachen und eine Vorlage für die Verfolgung von Echtzeitdaten bei zukünftigen Epidemien zu liefern.

Mehrere Wissenschaftler äußerten sich begeistert. Sie sind sicher, dass diese umfassende, internationale und öffentlich zugänglichen Datenbank die Forschung an mehreren Fronten beflügeln wird. »Das ist wirklich gut und muss gemacht sein«, sagt etwa Professor Dr. Robert Garry, ein Virologe an der Tulane University in New Orleans, Louisiana. »So etwas gibt es bisher nicht, da es so schwer ist, Daten in dieser Weise zusammenzutragen«, meint der Wissenschaftler gegenüber »Nature News«.

Von der Einzelinitiative zum Gigaprojekt

Seinen Ursprung hatte das Projekt in der Erstellung einer simplen Google-Tabelle genommen, die auf Basis individueller Initiativen von Epidemiologen im Januar 2020 angelegt worden war, um einen Überblick über die neue Krankheit aus dem chinesischen Wuhan zu bekommen. Dieses händische Projekt stieß jedoch schon bald an seine technische Obergrenze. Nachdem die Zahl von etwa 100.000 Datensätzen überschritten wurde, suchten die Protagonisten nach Hilfe und baten um Unterstützung.

Im April begannen dann Produktentwickler bei Google und Google.org, dem gemeinnützigen Arm des Datengiganten aus dem Silicon Valley, die Forscher zu unterstützen. Gemeinsam schrieb das Konsortium Computerprogramme, die automatisch die täglichen Coronavirus-Daten von etwa 60 Regierungen in ein standardisiertes Format integrierten. Zudem wurden die Daten programmgesteuert auf Dopplungen überprüft und es wurde ein Algorithmus entwickelt, der die aus der ganzen Welt einlaufenden Informationen in eine einzige Cloud-basierte Datenbank zusammenführte.

Priorität auf Datenschutz

Die Datenbank ist zugänglich für jedermann. Man muss sich registrieren und kann dann auf bis zu 8 Gigabyte an anonymisierten Daten der neuesten Version der Global.health-Datenbank zugreifen. »Bei etwa der Hälfte der 24 Millionen Einzelfälle wurden Daten für ein Dutzend Variablen mitintegriert und etwa 10 Prozent der Datensätze enthalten noch mehr Variablen«, sagt Professor Dr. Samuel Scarpino, ein Epidemiologe, der das Emergent Epidemics Lab an der Northeastern University in Boston leitet. Insgesamt könnten bis zu 40 Variablen pro Fall eingetragen werden.

Entfernt werden alle Daten, die Erkrankte identifizierbar machen. Für die Fälle aus Deutschland gibt es etwa Angaben über das ungefähre Alter, das Geschlecht und das Datum der ersten Symptome. Offenbar stammen aus Deutschland überdurchschnittlich viele Einträge. Momentan sind mehr als 2,26 Millionen Fällen aus der Bundesrepublik in der Datenbank enthalten. Andere Staaten, darunter beispielsweise Frankreich, beteiligen sich derzeit noch gar nicht.

Im Moment beschränken sich die Datenvisualisierungen der Website auf Karten, die die vom Team gesammelten Daten anzeigen. Scarpino merkt an, dass Infografiken nicht im Fokus standen, weil zunächst besonderes Augenmerk auf die Standardisierung der Datenerfassung und den Umgang mit Datenschutzfragen gerichtet wurde. Man habe sich mit Rechts- und Ethikexperten darüber beraten, wie man anonymisierte Daten über Einzelpersonen, die von Regierungsbehörden, Universitäten und Krankenhäusern oft streng gehütet werden, sicher handhaben und weitergeben kann, sagt er.

Und man denkt auch schon weiter. Scarpino hofft, die Covid-19-Datenbank irgendwann auf eine anpassbare Plattform zu erweitern, um andere Krankheiten zu erfassen – insbesondere im Zusammenhang mit möglichen neuen Epidemien. Aber dazu bräuchte man ein Unternehmen oder eine gemeinnützige Organisation, die ein solches Projekt vorantreibt.

Starkes Engagement von Google in der Pandemie

Google hat in einem Open-Data-Portal verschiedene Daten zusammengetragen, die zum Verständnis der Coronavirus-Pandemie beitragen können. Das teilte der US-Konzern mit. Man erweitere damit auch sein eigenes Datenangebot, das auf riesiges Interesse gestoßen sei. So macht das Unternehmen seit April Daten zur Mobilität vieler Millionen Nutzer zugänglich, die bis auf die regionale Ebene Auskunft dazu geben, wie die Menschen in der Pandemie etwa den öffentlichen Nahverkehr nutzen oder zur Arbeit gehen. Mit den Daten zur Mobilität wolle man »Gesundheitsbehörden bei kritischen Entscheidungen zur Bekämpfung des Coronavirus helfen«. Sie sollten beispielsweise zeigen, wie sich die teilweise drastischen Einschränkungen des öffentlichen Lebens auf die Bewegungstrends auswirken.

Noch mehr Daten sammelt Google nun in dem sogenannten »Covid-19 Open Data repository« auf Github. Mit dem »Covid-19 Open-Data explorer« lassen sich die Daten für einzelne Länder leicht visualisieren. Hierzu mahnt Scarpino an: »Das kann keine Eintagsfliege sein.«

Die experimentelle KI
von PZ und PTA-Forum
Die experimentelle KI
von PZ und PTA-Forum
Die experimentelle KI
von PZ und PTA-Forum
 
FAQ
SENDEN
Wie kann man die CAR-T-Zelltherapie einfach erklären?
Warum gibt es keinen Impfstoff gegen HIV?
Was hat der BGH im Fall von AvP entschieden?
GESAMTER ZEITRAUM
3 JAHRE
1 JAHR
SENDEN
IHRE FRAGE WIRD BEARBEITET ...
UNSERE ANTWORT
QUELLEN
22.01.2023 – Fehlende Evidenz?
LAV Niedersachsen sieht Verbesserungsbedarf
» ... Frag die KI ist ein experimentelles Angebot der Pharmazeutischen Zeitung. Es nutzt Künstliche Intelligenz, um Fragen zu Themen der Branche zu beantworten. Die Antworten basieren auf dem Artikelarchiv der Pharmazeutischen Zeitung und des PTA-Forums. Die durch die KI generierten Antworten sind mit Links zu den Originalartikeln. ... «
Ihr Feedback
War diese Antwort für Sie hilfreich?
 
 
FEEDBACK SENDEN
FAQ
Was ist »Frag die KI«?
»Frag die KI« ist ein experimentelles Angebot der Pharmazeutischen Zeitung. Es nutzt Künstliche Intelligenz, um Fragen zu Themen der Branche zu beantworten. Die Antworten basieren auf dem Artikelarchiv der Pharmazeutischen Zeitung und des PTA-Forums. Die durch die KI generierten Antworten sind mit Links zu den Originalartikeln der Pharmazeutischen Zeitung und des PTA-Forums versehen, in denen mehr Informationen zu finden sind. Die Redaktion der Pharmazeutischen Zeitung verfolgt in ihren Artikeln das Ziel, kompetent, seriös, umfassend und zeitnah über berufspolitische und gesundheitspolitische Entwicklungen, relevante Entwicklungen in der pharmazeutischen Forschung sowie den aktuellen Stand der pharmazeutischen Praxis zu informieren.
Was sollte ich bei den Fragen beachten?
Damit die KI die besten und hilfreichsten Antworten geben kann, sollten verschiedene Tipps beachtet werden. Die Frage sollte möglichst präzise gestellt werden. Denn je genauer die Frage formuliert ist, desto zielgerichteter kann die KI antworten. Vollständige Sätze erhöhen die Wahrscheinlichkeit einer guten Antwort.
Wie nutze ich den Zeitfilter?
Damit die KI sich bei ihrer Antwort auf aktuelle Beiträge beschränkt, kann die Suche zeitlich eingegrenzt werden. Artikel, die älter als sieben Jahre sind, werden derzeit nicht berücksichtigt.
Sind die Ergebnisse der KI-Fragen durchweg korrekt?
Die KI kann nicht auf jede Frage eine Antwort liefern. Wenn die Frage ein Thema betrifft, zu dem wir keine Artikel veröffentlicht haben, wird die KI dies in ihrer Antwort entsprechend mitteilen. Es besteht zudem eine Wahrscheinlichkeit, dass die Antwort unvollständig, veraltet oder falsch sein kann. Die Redaktion der Pharmazeutischen Zeitung übernimmt keine Verantwortung für die Richtigkeit der KI-Antworten.
Werden meine Daten gespeichert oder verarbeitet?
Wir nutzen gestellte Fragen und Feedback ausschließlich zur Generierung einer Antwort innerhalb unserer Anwendung und zur Verbesserung der Qualität zukünftiger Ergebnisse. Dabei werden keine zusätzlichen personenbezogenen Daten erfasst oder gespeichert.

Mehr von Avoxa