Çin: 2, ABD: 0 mı?
Önceki hafta, DeepSeek adlı Temmuz 2023 yılında kurulan bir şirket tarafından geliştirilen büyük dil modelleri hem teknoloji dünyasında hem de ekonomi alanında büyük bir etki yarattı.

Tolga Mırmırık - @mirmirik
2025 Ocak ayının 20’sinde kullanıma sunulan “DeepSeek” isimli yeni bir yapay zekâ aracı, geçtiğimiz Aralık ayının sonunda duyurulmuştu. Hemen her gün yeni bir araç, yeni bir yapay zekâ aracının çıktığı son iki yıl için çok da önemli bir gelişme gibi görülmeyebilir ilk bakışta. Ancak bu araç, yeni bir devrimin başlangıcını işaret ediyor.
YAPAY ZEKÂ SAVAŞLARI
Haziran 2023’te yine bu sayfada yazdığım “Nükleer silah mı yaman YZ mi?” başlıklı yazıda (https://www.birgun.net/haber/nukleer-silah-mi-yaman-yz-mi-442665) Meksika İkilemi’nden bahsetmiştim. Ülkelerin bir zamanlar girdikleri nükleer silahlanma yarışı gibi yapay zekâ yarışına girdiğinden, yapay zekâ geliştirme konusunda belirli bir eşiği geçen ülkenin bu konuda avantajlı duruma geleceğinden ve dizginleri elinde tutacağından bahsetmiştim. Çok uzun bir dönem Meta, Google, Apple, OpenAI ve Microsoft gibi ABD teknoloji devlerinin neredeyse tekelinde olan yapay zekâ sistemleri, Ocak ayı sonunda Çin’den gelen bir haber ile ciddi bir darbe almış gibi görünüyor.
Önceki hafta, DeepSeek adlı Temmuz 2023 yılında kurulan bir şirket tarafından geliştirilen büyük dil modelleri hem teknoloji dünyasında hem de ekonomi alanında büyük bir etki yarattı. Büyük dil modellerinde en büyük gider kalemi, modelin “eğitim zamanı” olarak geçmekte. Bu süreci en kaba tabiri ile milyonlarca belge, kitap, fotoğraf, video ve ses dosyasının taranması, sınıflandırılması, ilişkilendirilmesi ve parametreler haline getirilmesi olarak düşünebiliriz. Bu işlemlerin yapılabilmesi için binlerce (belki de yüzbinlerce) özel grafik çiplerinin kullanılması (GPU), bunların elektrik ile soğutma giderlerinin karşılanması, büyük veri merkezlerinde verilerin saklanması ve testlerinin yapılması gerekmekte. Microsoft, OpenAI, Google ya da Meta gibi şirketler kendi dil modelleri için neredeyse 100 Milyar USD’ye yakın yatırım yapmakta eğitim süreçlerinde.
DeepSeek’in büyük başarılarından biri, iddialarına göre eğitim masrafının sadece 6 Milyon USD tutmuş olması. Milyar dolarlar yanında hiçbir şey. Ayrıca, modelin işletimi ve eğitimi için kullanılan özel çipler de eski nesil ve oldukça az sayıda. Donanım olarak daha düşük kapasiteli bilgisayarların kullanılmasının da bütçeye pozitif etkide bulunduğu görülmekte. Bu düşük bütçeye ve kısıtlamalara rağmen performansının OpenAI’ın son sürümü kadar iyi olduğu da değişik karşılaştırmalar ile ortaya konulmuş durumda. Özel çiplerin eski sürüm olmasının sebebi ise ABD’nin Çin’e uyguladığı özel ambargo. Yeni nesil çiplerin Çin’de kullanılmasına izin vermemekte ABD. Bu kararın nasıl geri teptiği ise ABD borsasındaki teknoloji firmalarının önceki haftaki kayıplarına bakarak görülebilir. Bu özel çiplerin (GPU) en büyük üreticisi nVidia, sadece bu yeni haberle %17’lik bir kayıp yaşayarak yaklaşık 600 milyar dolara yakın değerden oldu. Dönüp dolaşıp ulus devletler arası yapay zekâ savaşı konusuna burada da rastlıyoruz. Çin’den iyi bir hamle!
Devrim niteliği denilecek teknolojik gelişme ise dil modelinin işletilmesindeki algoritmadaki değişiklikler. Geleneksel yapay zekâ, bir soru karşısında tüm model üzerinde işlem yapıp cevap dönmekte. Milyarlarca parametreden oluşan büyük dil modeli (basitleştirmek için yazı, fotoğraf, video vs. gibi düşünelim) üzerinde bunu yapmak da ciddi bir iş yükü doğurmakta, GPU zamanı ve buna bağlı olarak elektrik tüketimine yol açmakta. DeepSeek bu problemi aşmanın ustaca bir yolunu bulmuş durumda. Her sorgu için modellerinin yalnızca en alakalı kısımlarını etkinleştirmenin yolunu bulmuş durumdalar ve bu da paradan ve hesaplama gücünden tasarruf sağlamakta. 600 milyar parametre yerine sadece 30 milyar parametre üzerinden cevaba ulaşabilmek YZ konusundaki devrim konusu.
Çin’li şirketin ABD’li teknoloji devlerine attığı diğer gol ise, tüm uygulamalarının ve modellerinin “açık kaynak kod” olarak dağıtılması oldu. Herhangi bir firma ya da kişi ücretsiz olarak bu uygulamayı alıp kullanabilir ve kullanılan lisanslama modelinden (MIT) dolayı ticari yazılımlar da yapabilirsiniz. Yani sizin herhangi bir servis kullanmanıza, bir web sitesine erişmenize gerek kalmadan, bu üretilen modelleri bilgisayarınıza indirebilir, gerekli ayarları yaptıktan sonra güven içinde kendi uygulamalarınız ya da işiniz için kullanabilirsiniz.
KARANLIK TARAF
İşin içine Çin girince sansür, takip edilme, fişlenme, bilgilerinizin ele geçirilmesi gibi konular hemen akla geliyor. İnsanlığın yeni çağ ön yargılarından birisi. Açık kaynak kodlu olmasından dolayı bilgisayarınıza indirip kendi kullanımınıza özel olacak bir yapıda bu risk yok denilecek kadar az. Ne de olsa kaynak kod herkese açık ve herkes tüm kodu inceleyebilmekte.
Yaptığım denemelerde özellikle matematik ve fizik problemlerini adım adım çözmesi ve neyi neden yaptığını mantıklı olarak açıklaması çok iyi olsa da düz yazılarda daha yol kat etmesi gerekiyor gibi. Yepyeni bir destekçimiz oldu bu sefer Asya’dan. Görünen o ki modeli örnek alan onlarca yeni uygulamaya gebe önümüzdeki aylar.