Durum böyle. Yazarını bulmak için koskoca romana gerek kalmadı. İçinden belli başlı kelimeleri cımbızla çekmek yetti. Benzer şekilde birini izlemek için de o kadar fazla veriye ihtiyaç yok aslında. Birkaç iz yeter de artar bile

Filan Ahmet,  zira Elif, gene Yaşar

İlker Birbil
Sabancı Üniversitesi ve BolBilim.com

Paranoyaklık yapmak istemiyorum ama koca koca bilişim şirketleri benimle ilgili dünya kadar veri biriktiriyor. Hele Google sanki ciğerimi biliyor. Yazışmalarımı, resimlerimi, ajandamı zaten orada saklıyorum. Açtığım haritalardan nereye gittiğim belli. Düşünmeyeyim diyorum ama her an izlenebileceğini bilmek de insana pek iyi gelmiyor doğrusu.

Geçen gün çok sevdiğim bir grup arkadaşımla yemeğe çıktık. Ben yine dijital mahremiyet minvalinde korku senaryolarıyla masaya dehşet salıyorum. Birisi “Abi sakin, o kadar çok veri var ki hepsini işlemelerine imkân yok,” deyiverdi. Önce ikna olur gibi olduğumu itiraf etmeliyim. Sonra “Ama...” diyerek muhabbete tekrar limon sıktım. “Veri çok ama tamamına ihtiyaç yok ki. Ufak bir kısmı bile çok şeyi ele veriyor olmasın?” Sonra da hazır dikkatler üzerimdeyken yakında yaptığımız bir çalışmayı anlatmaya başladım.

Metin analizi

Çalışmaya ilham veren soru şu: Diyelim ki bir sahafın rafları arasında, bir kitabın birkaç sayfasını bulduk. Kitabın cildi kayıp. Yazarı belli değil. Fakat yazı şahane. Kitabı kimin yazdığını bulabilir miyiz?

İlk tepkim “İnsan insana, yazar da yazara benzer; hayatta bulamayız,” oldu. Ördek gibi atlamışım meğer. Yanıldığım ortaya çıktı. Ona geleceğim. Neyse, hemen kollarımızı sıvadık. Elimizde bir grup yazarın romanları elektronik kitap olarak vardı. Toplamda 100’ün üzerinde kitabı iki gruba ayırdık. İki gruba da her yazarın en az bir eserini koyduk. İlk gruptaki eserleri didik didik edip, yazarların stillerini öğrenmeye çalıştık. Ardından ikinci gruptaki kitapların beş-on sayfalık parçalarını alıp, her parçanın hangi yazara ait olduğunu tahmin etmeye çalıştık. Yani ikinci gruptaki bir parça, sahaf rafında bulunan isimsiz sayfaların rolünü oynadı. Teknik tarafını da hızla özetlemeliyim. Neticede benim gibi bir dört gözün yazısını, başka dört gözler de okuyorlar. Metin analizi araçları ile düzenleme, yapay öğrenme yöntemleri ile de sınıflandırma yaptık.

Yanıldım diyordum ya. Hem de nasıl! Şu anda beş-on sayfalık yazıya bakarak yazarının kim olduğunu yüzde 90 üzeri bir isabetle kestirebiliyoruz. Yazarların stillerini öğrenirken hece sayısından tutun da kelime yapısına kadar farklı özellikleri karşılaştırdık. Ama hiçbiri “işlevsel kelime seçimi” kadar iyi sonuç vermedi. İşlevsel kelimeleri, cümleleri birleştiren bağlaçlar, anlama katkı eden zarflar ve sıfatlar diye düşünebilirsiniz. Tek yapmamız gereken bu işlevsel kelimeleri saymak ve ne kadar sık kullanıldıklarına bakmak oldu. Meğer her yazarın imzası sayılabilecek işlevsel kelimeleri varmış.

İşlevsel kelimeler

Bu yazı için dokuz yazarın birer romanını seçtim. Yazıya eşlik eden şekiller, her romandaki işlevsel kelime bulutlarını gösteriyor. Bir şekildeki kelimenin büyüklüğü, o kelimenin yer aldığı romanda ne kadar sık geçtiğini ifade ediyor. Yani şekildeki bir işlevsel kelime etrafındakilerden daha büyükse, diğerlerinden daha sık kullanılıyor anlamına geliyor. Pek çok romanda “fakat” ve “gene” kelimeleri hemen dikkatinizi çekmiştir sanırım.

Yaşar Kemal, Oğuz Atay ve Orhan Pamuk bol bol “gene” kullanmışlar. Yaşar Kemal’de “gene” yalnız değil. Bir yanda “boyuna,” öte yanda da “helal” var. Zaten “helal” en çok Yaşar Kemal’e yakışmıyor mu? Orhan Pamuk soruların adamı. Baksanıza “niye” sorusu Cevdet Bey ve Oğulları’nda gani gani kullanılmış. Peki ya Oğuz Atay’a ne demeli? O da “gene” kullanmış ama yanına bir de “dandini” eklemiş. Sırf bu kelimeyi kullandı diye sevilir Oğuz Atay. Hoş o her şekilde sevilir.

Dildeki değişim de önemli tabii. Aşağı yukarı dönemdaş sayılabileceklere bakalım. Belli ki Halide Edib Adıvar, Sabahattin Ali ve Reşat Nuri Güntekin “evvel” kelimesini pek seviyorlar. Halide Edib mücadele kadını. Belki de o nedenle “bilhassa”, “mutlak” gibi güçlü kelimeler onda. Reşat Nuri ise öğretmen. Onu “evvel” dışında ayıran kelimeler “hakikaten” ve “ziyade” olabilir. Sabahattin Ali’nin romanında kocaman bir “fevkalade” göze çarpıyor. Onun “fevkalade” seçimi beni şaşırtmıyor. Sabahattin Ali’de çocukça bir heyecan hep var gibi gelir bana.

Torunlarının torunu yaşındaki Elif Şafak da “evvel” hayranı. Ama gel gör ki “zira” kelimesini o kadar çok kullanmış ki, onu bu kelimeyle yakalamak kolaylaşıyor. Ahmet Ümit ise “filan” seviyor. İki çağdaş Şafak ve Ümit’i, sadece bu iki kelime ayırıyor: zira Elif, filan Ahmet.

Durum böyle. Yazarını bulmak için koskoca romana gerek kalmadı. İçinden belli başlı kelimeleri cımbızla çekmek yetti. Benzer şekilde birini izlemek için de o kadar fazla veriye ihtiyaç yok aslında. Birkaç iz yeter de artar bile.

Dönüp yazıya bir daha baktım da her şeyi ben yaptım gibi yazmışım. Oysa alakası yok. Birlikte çalıştığımız arkadaşlarım Oktay H. Güngör ve Gürsu Gülcü bütün işin yükünü üstlendiler. Bana sadece yazmayı bıraktılar. Onların emekleri yanında benimki kelime cambazlığı kalır. Eksik olmasınlar.

Bu yazıyı, ünlü yazarların mektuplarını Türkçeye çeviren Nuriye Gülmen’i düşünerek yazdım. Semih Özakça ile birlikte bir an önce haklarını geri almaları ve sağlıklarına kavuşmaları en büyük temennim.