Özgün Adı: The body is the missing link for truly intelligent machines
Ben Medlock, kullanıcılarının tuş kullanımına uyum sağlamak için öngörme teknolojisi (predictive technology) kullanan bir mobil uygulama olan SwiftKey’in eş kurucusudur. Önde gelen uluslararası dergilerdeki yazılarının yanı sıra doğal dil işleme araştırmalarında öncü konferanslar düzenleyen Kompütasyonel Dilbilim Topluluğu’nda (Association for Computational Linguistics — ACL) akademik yayınları da bulunmaktadır. Londra’da yaşamaktadır.
Zihni, daha ilkel bilişsel yapıların üstündeki bir katman olarak düşünmek bize çekici gelmektedir. Ne de olsa kendimizi bilinçli varlıklar olarak deneyimleriz ve bu deneyimimiz, kalbimizin ritmini ya da midemizin gurultusunu deneyimlemekten çok farklı bir histir. Belki beynin işlemleri ayrılabilir ve bölümlendirilebilir olsaydı, en üst katmana benzer bir şey inşa edebilir ve organik yaşamı temsil eden bedeni es geçip insansı (human-like) yapay zekaya (YZ) ulaşabilirdik.
Microsoft tarafından satın alınan öngörücü-dil (predictive-language) yazılım şirketinin eş kurucusu olarak bu görüşün neden çekici geldiğini anlayabiliyorum. Hedefimiz insanların dili anlama ve kullanma sürecini yazılımımızda aynı şekilde gerçekleştirebilmek. Bu konuda önemli ilerlemeler kaydettik. Özellikle 2012–2014 yılları arasında fizikçi Stephen Hawking için tasarladığımız yüksek kalitedeki yeni iletişim sistemi benim için çok gurur vericiydi. Fakat bu ümit verici gelişmelere rağmen, çoğu zaman insansı YZ’ye ulaşmaktan çok uzakta olduğumuzu görüyorum. Neden mi? Çünkü katmanlı biliş modeli yanlış bir model ve çoğu YZ araştırmacısı yapbozun en önemli parçasını gözden kaçırıyor: bedeni (embodiment).
1950’lerde modern YZ yanlış bir başlangıç yaptı. Bilgisayar bilimciler bilinci sembol temelli mantıksal sistemler inşa ederek taklit etmeye karar verdiler. Bu yöntem, sonrasında çevrenin kendisine yönelik olarak da kullanılabilecek sanal çevre modelleri oluşturmak için, gerçek dünya varlıklarıyla dijital kodları ilişkilendirmeyi içerir. Örneğin, sembolik mantık (symbolic logic) kullanıp “Kedi>bir>hayvandır.” gibi matematiksel bir formülle belli bir bilgiyi kodlayabilir ve makinenin kedinin bir hayvan olduğunu “öğrenmesini” sağlayabilirsiniz. Böyle bir formül ortalama bir kedinin at büyüklüğünde olup olmadığı ya da bir fareyi kovalayıp kovalamayacağı gibi önermeleri sistemin işlemesini ve test etmesini sağlayan daha karmaşık ifadelere dönüştürülebilir.
Bu yöntem ilk yıllarında basit tasarımlı ortamlarda, yani SHRDLU’da başarı yakaladı. Bir bilgisayar bilimci olan Terry Winograd’ın 1968–1970 yılları arasında MIT’de inşa ettiği sanal bir dünya olan SHRDLU’da kullanıcılar, koni ve küre gibi şekillerdeki basit yapıları hareket ettirmek için bilgisayarla konuşuyorlardı. Fakat ince bir işleyişe (fine-tuned) sahip olan sembolleri, muğlak tanımlar ve sonsuz farklı şekilde yorumlanabilirlikle karşılaştığında işe yaramaz hale geldiğinden, sembolik mantık gerçek dünya problemlerinin karşısında oldukça yetersiz kaldı.
Hesaplama (computing) gücünün artmasıyla birlikte ilerleyen on yıllarda araştırmacılar, büyük miktardaki verilerden örüntü çıkarabilmek için istatistik kullanmaya geçtiler. Bu yöntemler genelde “makine öğrenmesi” olarak bilinir. Makine öğrenmesi, yüksek düzeydeki bilgiyi (knowledge) ve mantıksal çıkarımı kodlamak yerine algoritmaların ilişkileri verilen görevleri tekrarlayarak (örneğin fotoğraflardaki görsel nesneleri sınıflandırarak ya da kaydedilmiş bir sesi yazıya dökerek) ayırt ettiği aşağıdan-yukarıya (bottom-up) bir yaklaşım kullanır. Böyle bir sistem milyonlarca kedi fotoğrafına bakarak kedi fotoğraflarını ayırt edebilir ya da birçok metin içinde bu ifadelerin nasıl geçtiğine bakarak kedi ve fare arasında bir ilişki kurabilir.
Makine öğrenmesi yakın zamanda çok önemli ve kullanışlı uygulamalar üretti. Ses ve görüntü tanıma ile dudak okumada bizi geçen, satranç, Jeopardy! ve Go oyunlarında bizi yenen sistemler inşa ettik. Resim yapmayı, pop müzik bestelemeyi ve kendi yazılım programlarını yazmayı öğrenen makineler yaptık. Bir bakıma bu bireysel öğrenme (self-teaching) algoritmaları, organik beyinlerin bilinçaltı işlemlemesini (processing) taklit eder. Makine öğrenmesi algoritmaları, basit “özelliklerle” (örneğin tek tek harflerle ya da piksellerle) başlar ve bunları gerçek dünya verilerinin özünde bulunan belirsizlik ve çok anlamlılığı göz önüne alarak daha karmaşık “kategoriler” oluşturacak şekilde birleştirir. Tıpkı gözden elektrik sinyallerini alıp tanınabilir örüntü ve nesnelere dönüştüren görsel korteks gibi.
Fakat algoritmalar bizim gibi düşünebilmekten henüz çok uzaktalar. Buna neden olan en büyük farklılık evrimleşmiş biyolojimiz ve bu biyolojinin bilgiyi nasıl işlediğidir. İnsanlar trilyonlarca ökaryot hücreden oluşur ve ilk ökaryot hücresine 2.5 milyar yıllık bir fosilde rastlanmıştır. Bir insan hücresi, modern bir jumbo jetin parçalarıyla aynı sayıda bileşene sahip olağanüstü bir bütünleşik (networked) makinedir; doğayla iç içe (embedded) geçirdiği uzun soluklu karşılaşmalarla meydana gelmiştir. John McPhee’nin Basin and Range (Düzlükler ve Tepeler) kitabında söylediği gibi, karmaşık organizmaların evrimi dünya tarihinde çok küçük bir yer kaplar; buna rağmen bu organizmaların tarihiyle karşılaştırıldığında insanlık tarihi hiçbir şeydir.
Geleneksel evrim görüşüne göre hücresel karmaşıklığımız erken ökaryotlardan genetik mutasyon ve seçilim ile evrimleşmiştir. Fakat 2005 yılında Şikago Üniversitesi’nden biyolog James Shapiro konuya yönelik yeni ve radikal bir açıklama sundu. Shapiro’ya göre ökaryot hücreler parçası oldukları[1] (host) organizmayı çevreye adapte etmek için çevresel uyaranlara göre kendi DNA’sını düzenleyerek (manipulate) “zekice” hareket eder. Yakın zamandaki mikrobiyolojik bulgular bu fikri destekliyor. Örneğin, memelilerin bağışıklık sistemi hastalıkla savaşacak etkili antibiyotikler üretmesi için DNA dizilerini kopyalamaya eğilimlidir. Bununla birlikte biliyoruz ki insan genomunun en az yüzde 43’ü doğal bir “genetik mühendislik” işlemi ile bir yerden başka yere taşınabilecek DNA’dan oluşmuştur.
Zeki, kendini organize eden (self-organizing) hücrelerden beyinsel bir zekaya atlamış olacağız ama, bizi asıl ilgilendiren kısım burası. Bu geçişle altını çizmek istediğim şey ise şu: Henüz bilinçli, düşünen varlıklar olmadan önce bile hücrelerimiz çevreden veri topluyor ve bizi güçlü, kendine-yetebilen öznelere dönüştürmek için çalışıyordu. Bu durumda bizi zeki yapan şey dünyayı olduğu gibi temsil eden sembolleri kullanmak değil. Aksine, dünyayı sadece bize sunulan şekliyle –bir organizma olarak evrimsel ve bedensel (evolved and embodied) ihtiyaçlarımızda var olduğu şekliyle– bilebiliriz. Antonio Damasio, Descartes’ Error (Descartes’ın Yanılgısı, Varlık Yayınları) isimli kitabında “Doğa, rasyonelliği sadece biyolojik sistem aparatının en üst katmanına yerleştirmemiştir; rasyonellik, bu sistemden doğar ve ona içkindir.” demiştir. Diğer bir deyişle, bütün bir bedenimizle düşünürüz, sadece beynimizle değil.
Ne ile karşılaşacağını bilmediği bir dünyada bedeniyle eyleme geçme mecburiyetinin, insan zekasının esnekliğinin ve gücünün temelini oluşturduğunu düşünüyorum. Fakat çok az YZ araştırmacısı bu içgörülerin sonuçlarını gerçek anlamda benimsiyor. Çoğu YZ algoritmasının temel motivasyonu büyük miktarda eğitme verilerinden (training data) örüntü çıkarmaktır –ki bu da, örneğin kedi tanımada yüksek bir doğruluk derecesi hedefliyorsanız milyonlarca, hatta milyarlarca kedi fotoğrafına ihtiyacınız var demektir. İnsanlar ise bunun aksine –bir organizma olarak ihtiyaçlarımız sayesinde– içinde bulunduğu çevredeki bedenin olağanüstü zenginlikte modellerini kendinde taşır. Görece daha az sayıda gözlemlenen örneklerden deneyimlerimiz ve beklentilerimize dayanarak sonuca dair çıkarımda bulunuruz. Örneğin bir insan herhangi bir kedi hakkında düşünmeye başladığında onun nasıl hareket ettiğini görebilir, miyavlama sesini duyabilir, her an tırmalamak üzere olduğunu hissedebilir. İnsan, “kedi” fikrini ve böyle bir yaratıkla etkileşiminde ona yardımcı olabilecek diğer kavramları anlaması için halihazırda zengin bir duyusal bilgi birikimine sahiptir.
Yani insan yeni bir problemle karşılaştığında işin çoğu zaten halledilmiş oluyor. Biz olayları anlamaya henüz başladığımızda –hücresel düzeyden üst düzeylere– bedenimiz ve beynimiz çok çeşitli zorluklara karşı neredeyse hemen kullanabileceğimiz dünya modellerini çoktan hazırlamış oluyor. Fakat bir YZ algoritması için süreç en başından başlar. Daha önce makine öğrenmesiyle öğrenilmiş bilgiyi yeni çözümler için kullanmaya odaklı “tümevarımsal transfer” (inductive transfer) olarak bilinen aktif ve önemli bir araştırma düzeni var, ama bu düzenin bizim kendi beden modellerimizin zenginliğini yakalayıp yakalayamayacağı bir tartışma konusu.
2014’te SwiftKey’in kendisi için yaptığı yeni iletişim sisteminin tanıtım gününde Hawking, BBC’ye bir röportaj vermiş ve bu röportajında zeki makinelerin insan türünün sonunu getirebileceği konusunda bir uyarıda bulunmuştu. Kötü niyetli YZ riskini ciddiye alma konusunda Hawking ile aynı fikirdeyim. Fakat insan zekasına yaklaşan bir zeka inşa etmekten henüz çok uzakta olduğumuzu düşünüyorum ve eğer algoritmalara çevreyle uzun süreli, bedenselliği de göz önüne alan bir ilişkiyi nasıl sağlayacağımız üzerine dikkatlice düşünmezsek, bu hedefe ulaşma umudumuz da pek parlak görünmüyor.
[1] Normalde “host” kelimesi viral, paraziter vb. hastalıklarda “konakçı” şeklinde kullanılıyor. Ancak burada yazarın bahsettiği şey devamında anlaşıldığı üzere bir hücrenin ait olduğu organizmayı çevreye uyumlu hale getirmesi; bu nedenle konakçı olarak çevirmedik. (E.N.)