birgün

11° PARÇALI BULUTLU

BİLİM 28.02.2021 11:11

Veri karanlığında yolumuzu aydınlatan üç ışık

Nasıl Covid herkese el yıkamasını öğrettiyse, verilerin başka bir hayatı olan grafiğe bakmayı ve okumayı da öğretiyor. Öğretiyor ama grafik bakışın aslında bir kültür olduğunu unutmamak gerek.

Veri karanlığında yolumuzu aydınlatan üç ışık

Ümit Kartoğlu - Özlem Kayım Yıldız

Kaliteli veri, COVID-19 savaşında doğru kararların alınabilmesi için olmazsa olmazların başında geliyor. Nasıl birçoğumuz kişisel davranışlarımız konusunda risk değerlendirmesi yapıp karar veriyorsak, ülke çapında da özellikle Sağlık Bakanlığı ve hükûmet benzer bir biçimde değerlendirme yapıp karar vermek durumunda. İşin can alıcı noktası yöneticilerin aldığı kararların yaşam-ölüm gibi sonuçları olması. Yalnız işin uzmanları değil, birçok kişi örneğin il il vaka sayılarının açıklanması için sürekli çağrı yaparken, COVID-19 pandemisi ile birlikte kurulan Bilim Kurulu’yla bile bu sayıların paylaşılmadığını kurul üyelerindenduymuştuk. Pandeminin kontrolü ve yönetimi ile ilgili kurulan bilim kurulu üyesisiniz, yetkililer tarafından sokaktaki vatandaşın bildiğinden fazla bir şey size söylenmiyor ve sizden öneri üretmeniz bekleniyor. Bizce sorun verinin toplanmamış olmasıya da olmaması değil, nedenini bir türlü anlamadığımız ‘paylaşmama’ ya da ‘bu kadarı size yeter ’ paylaşımları. Ya da paylaşımı kesilen haftalık raporlarla ilgili hiçbir açıklama yapılmaması.

Bilmece gibi paylaşılan veri kuyusunda Türkiye’de üç bilim insanı bu işe ışık olmaya karar verdiler. Zeki Berk, Fatih Tank ve Güçlü Yaman. Verilere farklı bir yaşam verip, ürettikleri görsellerle onları daha anlaşılır kıldılar. Aslında yaptıkları görseller bir buzdağının su üstündeki kısmı gibi… Bu grafik ürünün altında verilerin bulunması, organizeedilmesi, farklı kaynaklardan üç açılı değerlendirilmesi, değişkenlerle ilgili bir taban oluşturulması, verilerin nasıl toplandığının anlaşılması, olası yan tutmaların neler olabileceğinin belirlenmesi, değişkenlerin birbirini nasıl etkilediğinin anlaşılması, veri kalitesinin analizi, hatalı yapılabilecek yorumların tartışılması ve birçok veri sunum tekniğinin içinden en iyisini seçmek gibibir sürü yoğun emek gerektiren işler var.

Üç ışık nerden yükseldi?

Zeki Berk, Boğaziçi Üniversitesi Endüstri Mühendisliği Bölümü’nden mezun olduktan sonra, Türkiye’nin ilk yazılım şirketlerinden biri Link Bilgisayar’ın kurucu ortağı oluyor. Bugün işzekâsı, raporlama alanlarında danışmanlık hizmeti veriyor. Fatih Tank, Ankara Üniversitesi İstatistik Bölümü’nden mezun olduktan sonra, aynı üniversitede aktüerya ve risk analizi üzerine uzmanlaşıyor. Bugün aynı üniversitede Uygulamalı Bilimler Fakültesi, Aktüerya Bilimleri Bölümü’nde profesör. Güçlü Yaman ise Almanya’da Medya Bilişim Mühendisliği öğreniminden sonra yazılımcı olarak hayata atılıyor. Aynı zamanda senarist ve yönetmen.

Peki, onları oldukça kısıtlı bir veri paylaşımı ortamında bunları analiz etme, görselleştirme ve bir anlam yükleme gayretini ne tetiklemişti? Zeki Berk, salgının başladığı günden beri Sağlık Bakanlığı’nın açıkladığı verilerin çeşitliliği ve kalitesinin birçok Avrupa ülkesinin gerisinde kaldığını, turkuaz tabloda da günlük yayınlanan birkaç rakamın dışında zamana bağlı gidişi gösterecek hiçbir unsur olmadığını söylüyor. Bu eksikliği gidermek amacıyla kolları sıvıyor Zeki Berk, önce yaptıklarını çevresindekilerle paylaşıyor, olumlu tepkiler üzerine Twitter hesabında sürekli ve çeşitli paylaşımlar yapmaya başlıyor.

Fatih Tank, finans alanındakilerin çok iyi bildiği bir momentum göstergesi olan stokastik indikatör benzeri salgın verilerini modellemeye sokarak tahminlerde bulunmaya başlıyor. Verilerin kafasında nasıl hayat bulduğunu şöyle anlatıyor: “Abartmıyorum, ilk başlarda gözlerimi kapatıp zihnimde bir eskiz çizip onu MATLAB ve R gibi bilimsel paket programlarda nasıl çizebilirim diye hayal ediyordum.” Güçlü Yaman ise resmî verilerin analizinden çok ölümler hakkında alternatif bir veri kaynağı oluşturmak kaygısıyla bu işe soyunduğunu söylüyor.

Zeki Berk ise veri görselleştirmeyi fotoğrafla hikâye anlatmaya benzetiyor: “Usta bir fotoğrafçı tanık olduğu bir olayın hikâyesini tek bir kare fotoğrafla anlatabilir. Çektiği fotoğraf, anlatmak istediği hikâyeyi ne derece iyi anlatabiliyorsa, fotoğraf da o derecede başarılı ve iyidir. İşte benim kafamda veriler bu şekilde hayat buluyor. Önce verilere bakıp olası hikâyeleri görmeye çalışıyorum. Bir hikâye yakalamışsam, yaptığım görsel üzerinde bu hikâyeyi en çarpıcı, en kolay anlaşılır şekle getirene kadar uğraşıyorum.” Aynı veri farklı kılıklara girerek grafiğe dönüşebiliyor. Berk, en basit verilerden bile çok sayıda değişik görsel çıkartmanın mümkün olduğunu, bunun öncelikle beklenti, gereksinimler, hayal gücü, teknik olanaklar, bilgi düzeyi ve deneyimlerle ilintili olduğunun altını çiziyor.

GüçlüYaman’ın yazıp yönettiği, yapımcılığını da üstlendiği belgesel ve kısa filmleri var: Dönüşü Olmayan Yolculuk, Sınav ve Koridor. Bu filmlerdeki gerçekliğin, Yaman’ın analiz ve grafik anlamda uğraştığı fazladan ölümlerle ilgilenmesinin bağlantılı olduğunu ve bunun rastlantısal olmadığı açık. Filmlerde de hep gerçek bir boyut var” diyor Güçlü Yaman, “Koridor zaten belgesel film. Dönüşü Olmayan Yolculuk da gerçek hikâyeden uyarlandı. Bir diğer bağlantı Koridor’la kurulabilir belki. Koridor Şengal’de 2014’te yaşanan felaketle ilgili bir film. Filmi çektiğim zaman o bölgeye gitmek çok riskli olmasına rağmen yaşanan olayın tarihselliğini düşünerek gitmiştim. Ölümlerle ilgili yaptığım çalışmada da salgının tarihsel bir olay olması etkili oldu. Üstelik ölüm verileri ülkemizdeki tek gerçek veri. Bir de filmde de veri analizindeki gibi anlatılan hikâyenin ciddi bir analizine ihtiyaç var.”

veri-karanliginda-yolumuzu-aydinlatan-uc-isik-846760-1.
Güçlü Yaman’ın fazla ölümlerle ilgili ilk grafiği

veri-karanliginda-yolumuzu-aydinlatan-uc-isik-846759-1.

Sınırlı veri ile analiz yapmak

Veriler ve görsel yansımaları yalnız karar vericiler için değil, sıradan vatandaşların da olayı kavramaları açısından önemli.Sınırlı veri ile analiz yapmak hiç de kolay değil. Özellikle salgının gidişatı konusunda en önemli ipuçlarından birini veren efektif reprodüksiyon katsayısı denen Rt’nin doğru hesaplanması konusunda en büyük katkılar Fatih Tank ile Prof. Hasan Güçlü ve Yük. Müh. Orkun Teke tarafından yapılıyor.

veri-karanliginda-yolumuzu-aydinlatan-uc-isik-846761-1.
Fatih Tank’tan günlük vaka sayısının güvenli bölgenin dışına çıkışının grafiği

Yaman da fazladan ölümlerle ilgili çalışmalarında Uşak’taki ölüm oranlarının neden bu kadar yüksek olduğunun bir dönem tartışıldığını ancak sadece ölüm verileriyle salgının sonuçlarını görebileceğimizi ama ayrıntılı nedenlerini anlayabilmek için daha fazla veriye gereksinmemiz olduğunu hatırlatıyor. Berk ise elimizde daha detaylı veri olsa, yapabileceği analizlerin daha çeşitli ve ayrıntılı olabileceğini belirtiyor.

30 Eylül 2020’de Sağlık Bakanı Koca, ‘Her vaka hasta değildir’ diyerek Sağlık Bakanlığı tarafından açıklanan günlük COVID-19 verilerinin hasta sayılarını gösterdiğini açıklamış, 29 Temmuz’dan itibaren günlük yeni vaka değil hasta sayılarını öğrendiğimiz anlaşılmıştı. 26 Kasım 2020’den itibaren ise Sağlık Bakanı Koca’nın deyimiyle ‘asemptomatik vakaları’ da içerecek biçimde tüm vakaların sayısı açıklanmaya başlanmıştı. 28 Temmuz 2020’de, yani turkuaz tabloda vaka sayısından hasta sayısına geçilmeden bir gün önce 963 yeni ‘vaka’ açıklanırken 29 Temmuz 2020’de 942 yeni ‘hasta’ açıklandı. Tekrar ‘vaka’ sayısının açıklanmaya başlanmasından bir gün önce yani 25 Kasım 2020’de 6.814 yeni ‘hasta’ açıklanırken 26 Kasım 2020’de 29.132 yeni ‘vaka’ açıklandı. Vaka sayısından hasta sayısına geçiş oldukça belirsiz bir biçimde olurken tekrar vaka sayısına geçişte sayılarda önemli değişiklikler oldu.

veri-karanliginda-yolumuzu-aydinlatan-uc-isik-846762-1.

Yaman, fazla ölümlerle ilgili başka bir hesaplama yaparken ölümlerle vaka sayıları arasında bir süre sonra bir dengesizlik ortaya çıktığını fark ettigini ve durumu daha yakından incelemeye karar verdiğini söylüyor. “Vakadan hasta sayılarına yumuşak bir geçişin yapılabilmesi için vaka sayılarının Haziran’dan itibaren manipüle edilmeye başlandığı sonucuna vardım. Resmi vaka sayılarıyla gerçek ölüm sayıları kıyaslandığında böyle bir tablo ortaya çıkıyor.” Berk, Türkiye’nin salgının başından itibaren aylarca vaka adı altında hasta sayılarını yayınlamasının altında yatan nedeni bilmediğini söylüyor. Vaka adı altında aslında vaka değerlerinden kat kat daha düşük olan bir sayının yayınlanmasının Türkiye’nin salgın yönetiminde diğer ülkelerden daha başarılı olduğu gibi bir algı yaratmaya yönelik olabileceğinin altını çiziyor. Halen Türkiye’nin salgının başlangıcından vakaları açıklandığı 25 Kasım tarihine kadar geçen dokuz aylık süre için günlük vaka sayısını bilmediğimizi, Türkiye verilerini diğer ülkelerle karşılaştırabilmek için günlük vaka verilerine gereksinim olduğunu aktarıyor.

veri-karanliginda-yolumuzu-aydinlatan-uc-isik-846763-1.

Sağlık Bakanlığı’nın yarattığı vaka-hasta kaosuyla ilgili ortaya çıkan boşluğu doldurmaya yönelik Zeki Berk’in yaptığı çalışma

Türkiye verilerine Benford analizi

Zeki Berk, Türkiye verilerine uyguladığı Benford analizi ile de biliniyor. Benford Yasası 1881 yılında ortaya atılmış bir matematik kuramı.

“Ben dünyada 84 ülkenin vaka (bizdeki hasta, vaka karışık) verilerine bu testi uyguladım. Bu analizi ilk kez yaptığım 20 Ağustos tarihinde ülkelerin neredeyse hepsinin vaka verileri Benford uyumlu çıktı. Sadece Türkiye, Rusya ve Belarus’un uyumsuz olduğunu tespit ettim. Bu analizlerde kullandığım verileri Ağustos ayında Prof. Dr. Gülşah Seydaoğlu (Çukurova Üniversitesi Biyoistatistik ve Tıbbi Bilişim Anabilim Dalı) ile paylaştım. Kendisi de yaptığı analizleri ve sonuçlarını Türk Tabipleri Birliği’nin hazırladığı Covid-19 Salgını 8. Ay Değerlendirme Raporu’nda yayınladı.

“Daha sonra bu analizleri yapmaya devam ettim. Ülkelerden daha fazla bilgi geldikçe Benford’un sonucu daha da güvenilir hale geldi. 23 Şubat 2021 itibari ile, vaka verileri Benford yasasına uyumsuz olan ülkelerin sayısı arttı. Vaka verilerinin Benford uyumu en kötü olandan başlamak üzere en uyumsuz olan on ülke Belarus, Katar, Suriye, Türkiye, Kolombiya, Venezüella, Paraguay, Rusya, Karadağ ve İran.”

Bildirilen COVID-19 ile ilişkili ölüm oranları yani vaka ölüm oranı ülkelerde önemli değişkenlikler gösteriyor.Berk, 23 Şubat 2021 itibariyle en az 5 bin ölümün tespit edildiği 50 ülkede vaka ölüm oranlarını analiz ettiğinde, bu ülkeler arasında en düşük ölüm oranının %0,74 ile İsrail’de, hemen sonra ise %1,06 ile Türkiye’de olduğunu saptamış. Dünya ortalaması %2,22, Avrupa ortalaması ise %2,93. Türkiye’de vaka ölüm oranının bu denli düşük olmasının genç nüfus ile ilişkili olup olmadığını belirlemek için söz konusu ülkelerin nüfuslarındaki 65 yaş üstü oranını değerlendirdiğinde, 22 ülkede 65 yaş üstündeki nüfusun oranının Türkiye’den daha düşük olduğunu saptamış.

Fazladan ölüm sayıları…

Pandeminin başından bu yana ülkelerdeki ölüm verilerini birbirleriyle karşılaştırmada çeşitli güçlükler olduğu tüm dünyada bilinen bir durum. Sorunu çözmek için COVID-19 ile ilişkili ölüm tanımındaki değişkenliklerden, ülkelerin nüfus yapısındaki farklılıklardan göreceli olarak az etkilenmesi beklenen fazladan ölüm sayılarının kullanılması öneriliyor.

veri-karanliginda-yolumuzu-aydinlatan-uc-isik-846764-1.

Dünyada COVID-19 ölüm oranları

Güçlü Yaman, ülke nüfusunun yarısından çoğunu oluşturan illerde 2020 süresince gerçekleşen ölümlerin verisini topladı, geçen yıllarla karşılaştırdı ve bu verilerin zaman içerisinde il il nasıl seyrettiğini kolay anlaşılabilir grafiklere dönüştürdü: “Fazla ölüm verileri Türkiye’de salgınla ilgili elimizdeki tek gerçek veri. Gerçek çünkü bakanlığın filtresinden geçmiyor. Ayrıca verileri topladığım kaynaklar salgından bağımsız, salgın öncesinde de olan yerler. Resmi salgın verilerinin aksine insanları isimleriyle görebiliyoruz. Buralardan elde edilen verilerle önceki yıllarda, normal zamanlarda yaşanan ölümleri salgın dönemindeki ölümlerle karşılaştırıyoruz. Salgın döneminde önceki yıllara göre fazladan ölenler, salgın kaynaklı ölümler olarak kabul ediliyor çünkü normal zamanlarla aralarındaki tek fark salgın. Türkiye nüfusunun %58’ini oluşturan 16 büyükşehir, 9 il merkezi ve 2 ilçeyle ilgili ölüm verilerine sahibiz. Bunların arasında İstanbul, Ankara, İzmir ve Bursa da var. Buralarda önceki 3 yılla kıyaslandığında Mart 2020’den bu yana 59 bin insan fazladan öldü. Temmuz öncesinde, ölümlerin yarısının İstanbul'da, sonrasında ise tüm ülkeye eşit dağıldığını kabul ederek %58'e ait bu sayıyı Türkiye'ye genellediğimizde Türkiye’de salgın ve salgın kaynaklı ölümlerin 100 bin civarında olduğu görülüyor.” TÜİK’in açıkladığı verilere göre Eylül 2020’de gerçekleşen ölümlerin önceki 5 yılın ortalamasına göre %9,4 azalmış göründüğünü, oysa bu dönemde Türkiye nüfusunun %56’sının yaşadığı illerde ölümlerin %38,6 arttığını söylüyor Yaman.

veri-karanliginda-yolumuzu-aydinlatan-uc-isik-846765-1.

11 Mart 2020 – 19 Ocak 2021 tarihleri arasında fazla ölümlerin resmi COVID-19 ölümleriyle karşılaştırılması

Pandemi süresince sağlık çalışanlarındaki ölümlerin resmi olarak bildirilen COVID-19 ölüm sayılarındaki dalgalanmalardan bağımsız bir biçimde artıp azaldığını gözlemliyoruz. Yaman, sağlık çalışanı ölümleriyle fazladan ölümlerdeki iniş ve çıkışların uyumlu olduğunu, fazladan ölümlerdeki artışın 1-2 haftalık gecikmeyle sağlık çalışanları ölümlerine yansıdığını ancak açıklanan resmi COVID-19 ölümleriyle gerçek zamanlı bir karşılaştırma yapıldığında anlamlı bir sonuç elde edilemediğini söylüyor. Bu durumu, resmi olarak açıklanan ölümlerle fazladan ölümler arasında 2-4 haftalık bir zaman farkı olmasıyla açıklıyor.

veri-karanliginda-yolumuzu-aydinlatan-uc-isik-846766-1.

Salgın dönemi fazla ölümler ve sağlık çalışanı ölümler

Sınırlı verilere ve emek hırsızlığına karşıüç emektar ışığa teşekkür…

Sınırlı verilerle mucize grafikler çizen bu üçlü bir yandan da yaptıkları işleri alıp televizyon kanallarında, sayfalarında kullanan, ama grafikten imzalarını, isimlerini çıkartan, üstüne üstlük sanki kendileri yapmış gibi bir de grafiğin üzerine filigran şeklinde kendi logolarını koyan internet haber siteleri ve televizyon programlarıyla uğraşıyorlar. Büyük emekle ortaya çıkarılan bu görseller için yapılan emek hırsızlığından başka bir şey değil.

Dünyada aşılamanın başlaması ile birlikte OurWorldinData gibi kuruluşlar ülkelerdeki aşılama hızını, aşılanan nüfusu, aşılananların tüm nüfusa oranı gibi verileri günlük görselleştirip yayınlıyorlar. Zeki Berk de 85 ülkede uygulanmakta olan 9 değişik aşıyı günlük olarak takip ediyor, veriler değiştikçe otomatik olarak güncelleme sağlayan altyapı kurmuş.

Nasıl COVID herkese el yıkamasını öğrettiyse, verilerin başka bir hayatı olan grafiğe bakmayı ve okumayı da öğretiyor. Öğretiyor ama grafik bakışın aslında bir kültür olduğunu unutmamak gerek. Antropolog Robert Chambers Hindistan’da katılımcı kırsal bir değerlendirme sırasında köylülere yıl boyunca ne kadar yağmur yağdığını sorduğunda, yaşlı bir kadının eline aldığı bir dal parçasıyla yere x ve y eksenlerini çizerek hasattan önce ve sonra düşen yağmuru bar grafik gibi çizişini hayretler içinde seyrettiğini anlatmıştı bir kongrede. Her şey yaratıcılığınızı ne kadar zorladı��ınızla ilgili… Hâlâ süren veri karanlığında yolumuzu aydınlatan bu üç ışığa teşekkür ediyoruz.

Neden BirGün?

Bağımsız bir gazete olarak amacımız, insanlara hakikati ulaştırarak ülkede gerçek bir demokrasi ve özgürlük ortamının yeşermesine katkı sunmak. Bu nedenle abonelikten elde ettiğimiz geliri, daha iyi bir gazeteciliği hayata geçirmek, okurlarımızın daha nitelikli ve güvenilir bir zemin üzerinden bilgiyle buluşmasını sağlamak için kullanıyoruz. Çünkü banka hesabını şişirmek zorunda olduğumuz bir patronumuz yok; iyi ki de yok.

Bundan sonra da yolumuza aynı sorumluluk bilinciyle devam edeceğiz.

Bu yolculukta bize katılmak ve bir gün habersiz kalmamak için
Bugün BirGün’e Abone Ol.

BirGün; seninle güçlü, seninle özgür!

BirGün’e Destek Ol