Dünyanın her bir köşesine yayılan COVID-19 salgını sırasında, pandemiyle ilgili bilgi veren basın bültenleri ve sosyal medya paylaşımların çoğunun bir ortak noktası vardı: Johns Hopkins Üniversitesi Koronavirüs Araştırma Merkezi’nin Gösterge Paneli.
Araştırmacılar tarafından, halkın salgının nabzını tutabilmesi için geliştirilen; kullanıcı dostu bu araç sayesinde, COVID-19 ile ilgili en önemli verilerin 60 saniyelik günlük özetleri, Ocak’tan bu yana her sabah güncellenip yayınlanıyor. Johns Hopkins Üniversitesi‘nde inşaat ve sistem mühendisliği profesörü olan Lauren Gardner ve ekibi tarafından geliştirilen ve geçtiğimiz yılın en önemli oyuncularından biri olan bu Gösterge Paneli, tabii ki SXSW 2021’de de yerini aldı.
Johns Hopkins “veri dedektiflerinin” COVID-19 Gösterge Paneli’ni nasıl oluşturduklarını anlattıkları bu oturumda, Lauren Gardner’a yanı sıra, Johns Hopkins Üniversitesi Koronavirüs Araştırma Merkezi’nde ABD veri toplama ve analizi yöneten Beth Blauer, Johns Hopkins Uygulamalı Fizik Laboratuvarı’nda Büyük Ölçekli Analitik Sistemler Grubu’nu yöneten Aaron Kartz ve laboratuvarda kıdemli veri bilimci olarak çalışan Tamara Goyea vardı.
Kodla yazılmış bir bilgi serüveni
Gardner 2020 Ocak’tan bu yana devam eden bu çabanın, Gösterge Paneli’nin doğuşundan başlayarak bugüne uzanan kapsamlı bir tarihçesini verdi. Bulaşıcı hastalıklar zaten odaklandığı bir konuydu, ve Çin’de gizemli bir salgının ilk izleri görülmeye başladığında, o ve ekibi zaten verileri manuel olarak toplaya başlamışlardı bile.
Salgının daha yeni olduğu, Çin’de bile sadece birkaç yüz vakanın rapor edildiği bu dönemde, veri akışı genel olarak sosyal medya mecralarından, tek seferlik haber makaleleri sayesinde sağlanıyordu. Laboratuvarlarında bir gün ekibiyle kahve içerken, bu verilerin toplanması ve herkese açık ve erişilebilir hale getirilmesi gerektiğine karar verdiler. Ayrıca, verileri coğrafi bilgi sistemleri (CBS) kullanarak görselleştirmek ve etkileşimli olmasını sağlamak, halkın konuda bilgilenmesine katkıda bulunacaktı. ABD’de ilk koronavirüs vakasının bildirilmesinden sonraki gün, yani 22 Ocak’ta, ellerindeki verileri Twitter’dan halka duyurdular.
We are tracking the 2019-nCoV spread in real-time. Cases and locations can be viewed here; data available for download. #nCoV2019 @JHUSystems https://t.co/qfVymyUf7v pic.twitter.com/SS9zUwrQxT
— Lauren Gardner (@TexasDownUnder) January 22, 2020
En değer verdikleri şeyin şeffaflık olduğunu belirten Gardner, bu ilkeyle, halktan her bireyin politikacıların ve araştırmacıların ulaşabildiği bilgileri öğrenebilmesini hedeflediklerini söyledi. Haritanın halktan çok ilgi görmesinin sebebi olarak da sezgisel, kolayca erişilebilir, ve etkileşime açık olmasını gösterdi.
Ancak pandeminin beklenmedik bir hızla büyümesi ve vakaların artması, Johns Hopkins araştırmacıları için birçok uykusuz gece anlamına geliyordu. O dönem bu şekilde başka bir haritanın olmaması, dünyanın dört bir yanından kuruluşların Johns Hopkins’in haritasını kullanmasına sebep oldu.
Bu muazzam talep sonucu, daha ilk haftanın sonunda yaklaşık 10 milyon ziyaretçisi vardı haritanın. Pandeminin ABD’de zirveye ulaştığı Nisan ayında ise bu sayı günde 4 milyara çıkmıştı!
Johns Hopkins’in haritası hızlı bir şekilde epidemiyologlar, seçilmiş yetkililer, ve halk sağlığı liderleri için vazgeçilmez bir kaynak haline geldi. Ancak bu talebi karşılamak için, araştırmacıların veri kalitesi belirlemekten işlemeye kadar uzanan birçok zorluğu aşmaları gerekiyordu.
Bu talep nasıl karşılandı?
Bunun için kapsamlı bir altyapıya ihtiyaç vardı. Veriyi sağlamak için kullanılması gereken kaynakların seçilmesi ve bu veri toplama sürecinin nasıl otomatikleşeceğiyle ilgili araştırma yapılması gerekiyordu. Ayrıca, bu verilerin temizlenmesi ve işlenmesi de gerekiyordu. Gardner bu noktada Uygulamalı Fizik Laboratuvarı’ndaki meslektaşlarının devreye girdiğini söyledi.
Kartz ve Goyea, bu verilerin üst düzey bir sistemle düzenlenmesinin perde arkasını anlattılar. Onların görevi Gösterge Paneli’ne güç veren karmaşık veri toplama ve mühendislik süreçlerini oluşturmak ve otomatikleştirmekti. Goyea en temel haliyle, süreci şöyle açıkladı: “Saatte bir, herkese açık veri kümesinde kullanım için var olan, yaklaşık 40.000 çakışan veri noktası topluyoruz ve bunların hepsi 4.000 veya daha fazlasını üretiyorlar. Böylece farklı kaynaklardan aldığımız verilerle, soyut bir boru hattı olarak inşa ediyoruz.”
Salgının sürekli değişen, kesinliği olmayan verilerini çekip çevirebilecek bu Gösterge Paneli için aylar boyu süren, birçok takımın katıldığı inanılmaz yoğun bir çalışma gerekti. “Sabah 2:00 veya 3:00’da telefonlarımız çalıp ve bir şeylerin ters gittiğini bize bildiriyordu. İşin başına oturup, Slack’i açıyorduk, ve bitmeyen görüşmeler boyunca ters giden şeyleri düzeltmek için kodlamaya başlıyorduk. Geçmişe bakıldığında, ekip çalışmasının ve misyona bağlılığın güzel bir örneği olduğunu görebiliyorum,” dedi Kartz.
Blauer ise bu toplanan verilerin hikayeleştirilip, halka ulaştırılması hakkında konuştu. “Topluluklarımızda neler olup bittiğini hem küresel hem de yerel olarak, anlaşılması kolay bir şekilde göstermeye başladık, ancak bunu uzmanların kontrolü altında yaptık,” dedi. Araştırmacılar disiplinler arası uzmanlardan oluşan bir ekibi bir araya getirdiler ve verilerle birlikte, salgınla mücadelede izlenilmesi gereken stratejilerle ilgili bakış açısı da sundular.
Konuşmanın sonlarına doğru, Gardner hala üstesinden gelinmesi gereken zorluklar olduğunu vurguladı. Bunların ders çıkarılması gereken noktalar olduğunu söyleyen Gardner, aşılan zorlukların bir sonraki pandemiye daha iyi hazırlanmamıza yardımcı olacağını umduğunu söyledi.
Araştırmacılar data analizi ve vakaların takibi için; okuyan, izleyen, veya meraklı herkesi sitelerine davet ediyorlar.
Görsel: SXSW 2021, Johns Hopkins University