Veri Bilimi: Hepsini birleştirecek tek bir yüzük
26.11.2017 10:44 BİRGÜN PAZAR
Veri bilimi, Türkiye’nin kolayca varlık gösterebileceği bir alan. İlk yatırım maliyeti son derece düşük. Sonrası sadece eğitim vermek, ki halihazırda yetişmiş yurtiçinde ve dışında pek çok insanımız var

İlker Birbil - Sabancı Üniversitesi BolBilim.com

Bir ay kadar önce ABD’nin Ulusal Bilimler Akademisi detaylı bir rapor yayımladı1. Raporu hazırlayanlar arasında endüstriden uzmanlar, bilim insanları ve eğitim bilimciler var. Özetle rapor, veri biliminin yeni bir disiplin olarak hızla büyüdüğünü ve bu alanda eğitimli insan gücüne olan ihtiyacın her yıl katlanarak arttığını teslim ediyor. Ardından veri bilimi eğitiminin üniversite müfredatında nasıl yer alması gerektiğini tartışıyor. Birkaç seneye kalmadan pek çok üniversitede doğrudan veri bilimi bölümleri açılacağını öngörmek hiç zor değil.

Türkiye’de ise -birkaç üniversitenin yüksek lisans programları hariç- pek bir hareket yok. Şimdilik. Ancak veri okur-yazarlığı farklı mecralarda gittikçe daha fazla konuşuluyor. Bizim üniversiteler de bu gelişmeye kayıtsız kalamazlar. Öte yandan sadece mevcut üniversite yönetimleri ile gideceğimiz noktadan da endişeliyim açıkçası.

Bir öneri, farklı alanlardan insanların katıldığı bir platformda, veri bilimi konusunu masaya yatırmak olabilir. Böyle bir platformun bahsi açıldığında top anında mühendis ve doğa bilimcilere atılıyor. Atılmasın. Çünkü veri bilimi sadece onların işi değil. Bu da bizi bu yazının ana konusuna getiriyor. Amacım, veri biliminde hepinize yer olduğuna sizi inandırmak.

Edebiyat
2013 yılında “Guguk Kuşu” adında bir roman yayımlandı. Henüz ilk eseri olmasına rağmen kitabın yazarı Robert Galbraith pek çok eleştirmenden övgü topladı. Ancak hızla sıçrama yapan bu yeni yazarı kimse tanımıyordu. Bir gün The Sunday Times of London gazetesine isimsiz bir ihbar yapıldı. Arayan kişi Galbraith diye bir yazar olmadığını, bu ismi kullananın aslında ünlü bir yazar olduğunu iddia ediyordu. İhbarı ciddiye alan gazete, Duquesne Üniversitesi’nden Prof. Patrick Juola’ya ulaştı. Veri analizi, özellikle de metin işleme konularında uzman olan Juola, “Guguk Kuşu” romanını inceleyip birkaç yazarın eserleri ile karşılaştırdı. Evet, söz konusu kitap, ihbarda bahsedilen ünlü yazarın olabilirdi. Bu sonucun duyurulmasından kısa bir süre sonra Harry Potter serisinin yazarı J.K. Rowling bir açıklama yaparak, “Guguk Kuşu” romanını Robert Galbraith ismiyle kendisinin yayımladığını itiraf etti2. Detektiflik hikâyesi gibi değil mi?

veri-bilimi-hepsini-birlestirecek-tek-bir-yuzuk-391430-1.
(Medya patronları ve diğer yatırımcıların ilişkilerini gösteren Mülksüzleştirme ağı.)

Bu hikâye hep aklımdaydı. Hatta bir ara ben ve iki arkadaşım benzer bir işe soyunup, Türkçe romanları inceledik. Bir yazarın asıl imzasının kullandığı belli başlı kelimeler olduğunu gördük. Öyle ki, rastgele seçilmiş tek bir paragrafa bakarak, paragrafın hangi yazara ait olduğunu kolayca bulabiliyorduk3. Bu konudaki BirGün yazımı okuyan edebiyatçı bir arkadaşım, Divan edebiyatındaki laedri beyitlerden bahsetti. Yani yazarı bilinmeyen şiirler. Alın size tam da bizim kültürümüzün içinden bir inceleme konusu. Bu şairlerin izini sürmek kim bilir ne kadar heyecanlı olur. Edebiyat var, veri bilimi var, esrar perdesi var... Tadından yenmez.

Sivil toplum
Bakın işte bu konuda biraz daha hareketliyiz. Henüz geniş kapsamlı bir veri haberciliğinden bahsetmek güç. Fakat birkaç arkadaş öyle işlere imza atıyorlar ki, sosyal medya üzerinden yayımladıkları haberler ile günlük gazeteleri solluyorlar. Örneğin Mülksüzleştirme Ağları’nın etkileşimli görselleri sayesinde dosya yığınları altında kalmış karmaşık ilişkileri öğreniyoruz. Yaptıkları iş pek çok disipline aynı anda dokunuyor: gazetecilik, siyaset bilimi, bilgisayar mühendisliği.

İnternet kaygan zemin tabii. Okuduğumuz haberleri, yayımlanan demeçleri ya da gördüğümüz resimleri artık doğrulatmak istiyoruz. Sadece son dönemde, bu doğrulatma işi için çıkmış birkaç tane platform var. Bu işi hakkıyla yapanlar her dediklerine inanılmasını beklemiyorlar. İnanmayın da zaten. Veri orada. Kendiniz kurcalayın. Karşılaştırma, çapraz sorgulama yapın. Bir bakmışsınız siz de doğrulamanın bir parçası olmuşsunuz. Bundan âlâ sivil toplum hareketi olur mu?

Sanat ve diğerleri
Gişede iyi iş yapan filmlerin ortak yanları neler? Zaman içinde filmlerin evrimi nasıl oldu? İzlediğimiz sahnelerin uzunluğu ne olursa seyirci sıkılmaz? Bir sahnede gördüğümüz renkler bizi nasıl etkiliyor? Cornell Üniversitesi, Psikoloji Bölümü’nden Prof. James E. Cutting tam da bu sorulara cevap veriyor. Binlerce filmden gelen veriyi inceleyip hazırladığı çalışmalar o kadar ilgi çekti ki, sinema endüstrisiyle birlikte çalışmaya başladı. Böyle giderse hocaya yakında Oscar verecekler.

İnternet trafiğinin çok büyük kısmını dinlediğimiz müzik oluşturuyor. Sadece Spotify servisinin neredeyse 150 milyon aktif kullanıcısı var. Bu kadar büyük bir veri kümesine bakarak, ülkelerin ruh halleri bile kestirilebilir herhalde. Yıllar içinde dinlenen müzik türlerindeki değişimin incelenmesini hiç saymıyorum. O zaten çocuk oyuncağı. Onun yerine bizden genç bir araştırmacıyla tanıştırayım sizi: Serhat Şentürk. ODTÜ’de elektronik, Hacettepe Konservatuarı’nda klasik gitar eğitimi almış. Doktora tezinde Osmanlı-Türk müziğindeki farklı makamları incelemiş. Şahane. Serde ineklik olduğu için aklım gidiyor böyle çalışmaları görünce...
veri-bilimi-hepsini-birlestirecek-tek-bir-yuzuk-391431-1.
(Inception filminin her karesindeki renkler zamana göre soldan sağa doğru sıralanınca gece ve gündüz, rüya içinde rüya ayrışıyor.)

Veri bilimi derya gibi bir konu. Gördüğünüz gibi doğa bilimleri, mühendislik alanları dışında da pek çok uygulama var. Çok azını yazabildim. Mesela hukuktan hiç bahsedemedim. Oysa bir süredir teknoloji yardımıyla davaların incelenmesi konuşuluyor. Ya da başlı başına bir yazı konusu olacak tıp uygulamalarını anlatmadım. En kritik konunun ise yanından bile geçemedim: Veri kullanma etiği ve mahremiyet. Bunun daha arkeolojisi, spor analitiği, sosyolojisi, eğitim bilimleri hatta gastronomisi var. Var oğlu var. Onlar da başka yazılara artık.

Veri bilimi, Türkiye’nin kolayca varlık gösterebileceği bir alan. İlk yatırım maliyeti son derece düşük. Sonrası sadece eğitim vermek, ki halihazırda yetişmiş yurtiçinde ve dışında pek çok insanımız var. Onun için bir daha yazmak istiyorum: Özellikle genç arkadaşların paydaşı olduğu, herkesi bir araya getirecek bir platformu hiç vakit geçirmeden konuşmalıyız. Ben dünden hazırım.

Bu yazıyı yazmama Küresel İncelemeler ve Sınıfsal Stratejiler (KİSS) Araştırma Grubu seminer serisinde verdiğim konuşma vesile oldu. Orada yaptığım sunumu yeni açtığımız www.veridefteri.com sayfasında bulabilirsiniz.

1 “Envisioning the Data Science Discipline: The Undergraduate Perspective: Interim Report,” National Academies of Sciences, Engineering, and Medicine, The National Academies Press, Washington DC, 2017.
2 “JK Rowling unmasked as author of bestselling crime novel,” A. Mostrous, The Times, 15 Temmuz 2013.
3 “Filan Ahmet, zira Elif, gene Yaşar,” İ. Birbil, BirGün Pazar, 20 Mayıs 2017.