Özgün adı: “Bayes’s Theorem: What’s the Big Deal?” ve “Are Brains Bayesian?”
Önsöz
Bayes Teoremi 20. Yüzyılın ikinci yarısından itibaren giderek artan bir popülerliğe sahip. Üstelik bu popülerliği yalnızca bir bilim dalında değil, pek çok alanda giderek artıyor ve bilişsel bilim de pek ala bu alanlardan bir tanesi, öyle ki Bayesyen Beyin Hipotezi’nin, bilişsel bilim için bir “Her Şeyin Teorisi” olduğunu dahi iddia edenler mevcut. Durum buyken, Bayes Teoremi’nin ne olduğu ve bilişsel bilimdeki konumu üzerine bir metin yayınlamak istedik. Popüler ve/ya akademik düzeyde pek çok metin olmakla birlikte, burada çevirdiklerimiz John Horgan’ın “Bayes Teoremi: Neden Revaçta” ve “Beyinler Bayesyen Midir?” yazıları oldu. Yani iki farklı yazıyı, hem konu hem de birbirlerine atıfları dolayısıyla bir arada yayınlamaktayız. Bu yazıları seçmemizin birincil sebebi ise, aslında Bayesyen Beyin Hipotezinin, yani Bayes Teoremi’nden ilham alınarak gelişmekte olan, nörobilim, psikoloji, yapay zeka gbi farklı bilişsel bilim altdallarında pek çok kişilerce çalışılan araştırma programının yarattığı iyimser, bu çalışma programının oldukça ümitvar olduğunu düşünenlerin aksine, John Horgan’ın oldukça şüpheci bir yaklaşımının olması. John Horgan, bilimlerin sahte bilimlere evrilmesini engellemek ve onu formda tutmak için, olabildiğince keskin şekilde eleştirmek ve bardağın boş tarafından bakmak gerektiğini düşünenlerden.
Horgan, yazıda daha detaylı şekilde ele alacağı üzere, Bayesyen yaklaşımların ‘yanlışlanamaz’ olabileceğini ve bu yüzden bilimsel dahi olmayabileceği tehlikesine çok yakın durduklarını ve buna dikkat edilmesi gerektiğini belirtiyor. Fakat Horgan’ın yönelttiği ikinci şüphe, aslında Bayesyen Beyin Hipotezi’nden daha büyük ve bilim felsefesi alanında da uzun zamandır tartışılan bir soruya işaret ediyor: beynimizi ya da başka herhangi bir organizmayı şu veya bu şekilde modelleyebiliyor olmamız, onun o ‘kurallara’ uyarak çalıştığını gösterir mi?
Ve bu soru daha bu hafta COVID-19 dolayısıyla internet üzerinden düzenlenen neuromatch konferansında Paul Cisek ve Blake Richards arasındaki tartışmayla da doğrudan ilintili. Bu biliminsanlarının konuyla ilgili makalelerini “İleri Okuma Önerilimize” bulabilirsiniz.
Son olarak çeviri hakkında bir iki kelam edecek olursak; iki yazı da oldukça popüler düzeyde ele alındıkları için, derinlemesine bir soruşturma barındırmıyorlar. Bunun yanı sıra, çevirmenimiz bir bireyin nitelendiği durumlarda “Bayesçi”, cansız bir objenin nitelendiği durumlarda ise “Bayesyen” demeyi uygun gördü. Terimlerdeki ikiliğin sebebi bu, uyarmış olalım.
Keyifli okumalar,
CogIST
Bayes Teoremi: Neden Revaçta?
Bilgi üretmekte güçlü bir yöntem olarak lanse edilen Bayes Teoremi, aynı zamanda batıl inançlar ve sahtebilime de katkı sağlayabilir.
Bayes Teoremi’ni ilk kez ne zaman duydum hatırlamıyorum; fakat bu konu ancak son yıllarda, birkaç tahtası kırık öğrencim bu Teorem’den “hayatı yönlendirmekte kullanılan, adeta bir büyülü rehbermişçesine” bahsedince ilgimi çekti.
Öğrencilerimin coşkusu kadar Wikipedia ve başka yerlerdeki açıklamalar aklımı karıştırmıştı; ya çok basite indirgenmiş ya da aşırı karmaşıklardı. Bunun üzerine Bayes’in geçici bir heves olduğuna kanaat getirdim ve daha fazla araştırma ihtiyacı duymadım — ancak bu Bayes ateşi, günümüzde görmezden gelinemeyecek bir hâl aldı.
The New York Times’ın söylediğine göre Bayesyen istatistiği “fizikten kanser araştırmalarına, ekolojiden psikolojiye her alanda fırtınalar estiriyor. Fizikçiler, kuantum mekaniğini Bayesçi yöntemle yorumladılar; sicim ve çokluevren teorilerini ise Bayesçi biçimde savunuyorlar. Filozoflar için bilimin tümü Bayesyen bir süreç olarak görülebilir; onlara göre Bayes, bilim ve sahtebilimi Karl Popper’ın yanlışlanabilirliğinden daha büyük bir kesinlikle ayırabilir.
Google’ın sürücüsüz arabalarının tasarımcıları da dahil yapay zeka araştırmacıları, makinelerinin örüntü tanıma [pattern recognition] ve karar verme [decision making] yetilerinde Bayesyen yazılımlara yer veriyor. Bayes Teoremi’nin tarihine dair popüler bir eser yazmış olan Sharon Bertsch McGrayne’e göre, Bayesyen programlar, “e-maillerin spamlerini ayırmak, ulusal güvenlik ve tıbbi riskleri saptamak, DNA çözümlenmesi ve başka pek çok şeyi” yapmaktalar. Fizikçi John Mather, Edge.org adresli web sitesinde, Bayesyen makinelerin insanları işe yaramaz hale getirecek denli zeki olabileceklerini şiddetle vurgulamaktadır.
Bilişsel bilimcilerin zannı, beynimizin algılama, akıl yürütme ve karar alma süreçlerinde Bayesyen algoritmalar içerdiği yönündedir. New York Üniversitesi’nde Kasım ayında yapılan “Is the Brain Bayesian?” (“Beyin Bayesyen mıdır?”) adlı konferansta bilim insanları ve filozoflar bu konuyu açımladılar. (Bu toplantıdan Bloggingheads.tv ve “Are Brains Bayesian?” -”Beyinler Bayesyen mıdır?”- adlı müteakip gönderide söz ettim.)
Bayes Teoremi’ni körlemesine benimseyenler, daha çok kişinin beynimizin yaptığı varsayılan “bilinçsiz Bayesyen işlemlerinin” [unconscious Bayesian processing] aksine “bilinçli Bayesyen mantığı” [conscious Bayesian reasoning] benimsemesi halinde dünyanın daha iyi bir yer olacağı konusunda ısrarcı. Yapay zeka teorisyeni Eliezer Yudkowsky (kendisiyle tekillik [Singularity] konusunu Bloggingheads.tv’de ele almıştım) Bayes Teoremi’nin Sezgisel Açıklaması’nda [An Intuitive Explanation of Bayes’ Theorem] Bayesçilerin tarikatlara has coşkusunu şöyle tasdik ediyor:
“Neden bir matematiksel konsept öğrencilerde bu acayip hevesi uyandırıyor? Bilimleri hızla arşınlayan, deneysel metodu dahi özel bir durum olarak kapsadığı bahsedilegelen şu Bayesyen Devrim nedir? Bayes tutkunlarının bildiği giz nedir? Gördükleri ışık nedir? Yakında öğreneceksiniz. Yakında, bizden biri olacaksınız.” Yudkowsky şaka yapıyor… mu?
Tüm bu galeyanı göz önünde bulundurarak, ilk ve son kez Bayes’in derinlerine inmeye karar verdim. İnternetteki sayısız açıklamanın ardından yardımı olanlar bilhassa şunlardı: Yudkowsky’nin denemesi, Wikipedia girdisi ve filozof Curtis Brown ile bilgisayar bilimci Oscar Bonilla ve Kalid Azad’ın daha kısa yazıları. Bu yazımda, ilk olarak kendim için, Bayes’in ne hakkında olduğunu açıklamaya çalışacağım. Her zamanki gibi, iyi okurların hataları göstereceğine güveniyorum.
Mucidinin, yani 18. yüzyılda yaşayan Presbiteryan vaiz Thomas Bayes’in adını taşıyan Bayes Teoremi, eldeki en uygun kanıtlara (gözlemler, veriler, bilgiler) dayandırılarak kanıların (hipotezler, savlar, önermeler) geçerliliğini hesaplama yöntemidir. En basit haliyle şöyle tanımlanabilir: İlk kanı + yeni kanıt = yeni ve geliştirilmiş kanı.
Biraz daha açarsak: “Bir kanının yeni bir kanıtla doğru çıkma olasılığı” = “Bu kanının o kanıttan bağımsız olarak doğru olma olasılığı” X “Kanının doğru olduğu varsayıldığında kanıtın doğru olma olasılığı” / “Kanıdan bağımsız olarak kanıtın doğru olma ihtimali” Cepte mi?
Basit matematik formülü şu biçimi alıyor: P(K|T) = [P(K) X P(T|K)] / P(T) Burada “P” olasılığı, “K” kanıyı, “T” ise kanıtı temsil ediyor. P(K) kanının doğruluk olasılığını ve P(T) ise kanıtın doğruluk olasılığını gösteriyor. P(K|T)’nin anlamı kanıtın doğruluğunda kanının doğruluğu olasılığını, P(T|K) ise kanının doğruluğunda kanıtın doğruluğu olasılığını temsil etmekte.
Bu formülü tanıtırken genellikle tıbbi testler üstünden gidilir. Diyelim ki size, yaşıtlarınızda yüzde bir sıklıkla görüldüğü varsayılan bir kanser için test yapılıyor. Eğer bu test yüzde yüz güvenilirse, pozitif sonucun ne anlama geldiğini anlamak için Bayes Teoremi’ne ihtiyacınız yoktur, ama sırf nasıl çalıştığını görmek için teoremi kullanacağız.
P(K|T)’yi çözmek için, Bayes denkleminin sağ tarafına veri giriyoruz. P(K), yani test yapılmasından önce kanserli olma olasılığınız yüzde bir, veya 0.01. P(T), yani testin pozitif sonuçlanması olasılığı da aynı şekilde. Pay ve paydada yer alarak birbirlerini götürdükleri için, geriye kalan denklem şu oluyor: P(K|T) = P(T|K) = 1. Eğer test pozitif ise kesinlikle kansersiniz; bunun aksi de geçerli.
Gerçek dünyada testler neredeyse hiçbir zaman bu denli güvenilir değildir. Bu yüzden testiniz yüzde doksan dokuz güvenilir olsun. Bu demektir ki, kanserli insanların %99’u pozitif ve sağlıklı insanların %99’u ise negatif sonuç alacak. Hâlâ oldukça olağanüstü bir test. Eğer testiniz pozitifse, kanserli olma ihtimaliniz nedir?
Bayes’in Teoremi gücünü burada ortaya koyuyor. Çoğu insan yanıtın %99 olduğunu ya da buna yakın olduğunu varsayıyor. Sonuçta bu testin güvenilirlik oranı, değil mi? Oysaki doğru yanıt, Bayes Teoremi’nin sunduğu üzere sadece %50.
Verileri Bayes denkleminin sağ tarafına yerleştirip nedenini bulalım. P(K) hâlâ 0.01. P(T|K), yani kanseriniz varsa testte pozitif sonuç çıkma ihtimaliniz artık 0.99. P(K) X P(T|K), 0.01 x 0.99 ya da 0.0099 yapıyor. Bu, kanserli olmanız halinde testin doğru pozitif vermesi ihtimali.
Peki paydaya, yani P(T)’ye ne oldu? İşler burada çetrefillileşiyor. P(T) testin kanserli olsanız da olmasanız da pozitif çıkma ihtimali, diğer bir deyişle doğru pozitifleri içerdiği kadar yanlışlarını da içeriyor.
Yanlış pozitifin olasılığını hesaplamak için; yanlış pozitiflerin oranını (0.01) kanser olmayan insanların yüzdesine (0.99) çarpıyoruz ve sonuç 0.0099 çıkıyor. Evet, şu muhteşem testiniz doğru pozitif verdiği oranda yanlış pozitif verme ihtimaline de sahip.
Hadi hesaplamayı tamamlayalım. P(T) ulaşmak için, yanlış ve doğru pozitifleri eklediğimizde yapan 0.0198’i, 0.0099’a bölüyoruz ve cevap 0.5 oluyor. Başta söz edildiği üzere, P(K|T) yani testiniz pozitif çıktığında kanserli olma ihtimaliniz yüzde elli.
Tekrar test edildiğinizde bu belirsizliği ciddi oranda azaltabilirsiniz. Çünkü kansere sahip olma ihtimaliniz olan P(K) artık yüzde bir değil, yüzde elli. Eğer ikinci testiniz de pozitif çıkarsa, Bayes Teoremi kanserli olma ihtimalinizin yüzde 99, yani 0.99 olduğunu söylemektedir. Bu örneğin gösterdiği üzere, Bayes Teoremi’ni tekrarlamak, aşırı kesin bilgiler sağlayabilir.
Fakat eğer testin güvenilirliği yüzde doksansa, ki bu oran hâlâ oldukça iyi sayılır, gerçekten kanserli olma ihtimaliniz test iki kez pozitif çıktığında dahi hâlâ %50’den düşük. (Bu blog gönderisindeki işlevsel hesap makinesiyle matematiğimi kontrol edin.)
Doktorlar da dahil çoğu insan bu oranları anlamakta zorlanmaktadır; bu da bizim kanser ve diğer bozuklukların tanı ve tedavisindeki aşırılıkları açıklamamıza yardımcı oluyor. Bu örnek Bayesçileri haklı çıkarıyor: Dünya, gerçekten de daha fazla insan -ya da en azından sağlık hizmetleri sağlayıcıları ve müşterilerinin daha çoğu- Bayesyen mantığı benimsese daha iyi bir yer olurdu.
Diğer yandan, Bayes Teoremi sadece sağduyunun kod haline getirilmesidir. Yudkowsky’nin yazmış olduğu anlatı metninin-öğretici metin?- [tutorial] sonunda belirttiği üzere: “Bu noktaya kadar Bayes Teoremi, yeni ve heyecanlandırıcı bir şeyden ziyade, su götürmez bir açıklığa sahip, hatta totolojiktir. Eğer durum buysa, bu tanıtım hedefine bütünüyle ulaşmıştır.”
Kanser testindeki durumu düşünün: Bayes Teoremi’ne göre eğer testiniz pozitif sonuç verdiyse kanser olma ihtimaliniz, gerçek pozitif test olasılığının tüm pozitif test sonuçlarına -doğru da yanlış da olsa- oranıdır. Kısacası, yanlış pozitiflere dikkat edin.
Benim bu prensibe dair daha genel sunduğum önermem ise şöyle: Kanının doğruluğu; kanıtı yalnızca o kanıdan kaynaklanabildiği düzeyde olasıdır. Kanıt için ne kadar çok alternatif açıklama bulunuyorsa, kanı da o kadar daha az olası demektir. Bana kalırsa, Bayes Teoremini’n özü budur.
“Alternatif açıklamalar” kapsamına pek çok şey girebilir. Kanıtınız bozuk bir enstrümanla çarpıtılmış, hatalı, yanlış analiz edilmiş, onay yanlılığı sahibi, hatta uydurma dahi olabilir. Kanıtınız oldukça etkin, ancak sizin kanınız dışında başka kanılar yahut hipotezlerce açıklanıyor olabilir.
Diğer bir deyişle Bayes Teoremi hakkında büyülü hiçbir şey yoktur. Aslına bakıldığında kanınızın ancak ve ancak kanıtınız kadar geçerli olduğu gerçeğine işaret etmektedir. Eğer kanıtınız iyiyse Bayes Teoremi iyi sonuçlar verebilir. Eğer kanıtınız zayıfsa, Bayes Teoremi pek kullanışlı olmayacaktır. Çöp girer, çöp çıkar.
Bayes Teoremi’nin yanlış kullanımı potansiyeli, P(K) yani kanınızın başlangıçtaki olasılığının beklenen, “öncül”[prior] olarak da bilinen değeri ile başlar. Yukarıdaki kanser testi örneğinde, bize kanser prevalansı olarak oldukça kesin bir öncül, yani yüzde bir (0.01) verilmişti. Gerçek dünyada uzmanlar kanserin nasıl teşhis edildiği ve sayıldığı konusunda anlaşmazlık içindeler. Öncülünüz muhtemelen bir sayıdan ziyade bir olasılıklar aralığı içinde yer alacaktır.
Çoğu durumda öncül, yalnızca tahminin eseridir; bu da öznel faktörlerin hesaplamalarınıza sızmasına yol açar. Kanserin aksine sicimlerin, çokluevrenlerin, enflasyonun yahut Tanrının olmadığını düşünüyor olabilirsiniz. Bu şüpheli kanınıza, şüpheli kanıtlar atfedebilirsiniz. Bu yolla Bayes Teoremi mantığa sağladığı katkıyı sahtebilim ve batıl inançlara da sağlayabilir.
Bayes Teoremi’nde gömülü bir ahlaki mesaj vardır: Eğer kanıtınız için alternatif açıklamalar arama konusunda titiz değilseniz, kanıtınız sadece sahip olduğunuz kanıyı haklı çıkaracaktır. Bilim insanları genellikle bu hükme kulak vermekte başarısızdır; bu da neden pek çok bilimsel iddianın hatalı çıktığının açıklanmasına yardım etmektedir. Bayesçiler, metotlarının bilim insanlarının onay yanlılığının üstesinden gelmesinde ve daha güvenilir sonuçlar ortaya çıkarmalarında yardımcı olabileceğini söylüyor, ancak şüpheliyim.
Yukarıda belirttiğim üzere, bazı sicim ve çokluevren hayranları Bayesian analizleri benimsemiş durumda. Neden? Çünkü bu kimseler sicim ve çokluevren teorilerinin yanlışlanabilir olmayışları nedeniyle bilimdışı olduklarını duymaktan bıktı ve Bayes Teoremi, onların teorilerini daha hoşlarına gidecek bir konuma taşıyor. Şu durumda Bayes Teoremi onay yanlılığına karşı hareket etmekten ziyade, ona imkan sağlıyor.
Bilim yazarı Faye Falm’in The New York Times’ta söylediği gibi, Bayesyen istatistikler “bizi kötü bilimden kurtaramaz”. Bayes Teoremi, herhangi bir amaca hizmet edecek bir araçtır. Bayes istatistiğinin ileri gelenlerinden, Harvard’dan Donald Rubin, tütün şirketlerine, tütün ürünlerinin tüketiminden kaynaklanan zararlar nedeniyle açılan davalarda danışmanlık hizmeti vermiştir.
Bununla beraber, Bayes Teoremi’nden oldukça etkilendim. Aklıma bakış açınıza göre totolojik olarak basit ya da ürkütücü boyutta derin gelebilen bir diğer fikri, engin içgörüler sağladığı bollukta saçmalıklara da ilham veren evrim teorisini getiriyor.
Belki beynim Bayesyen çalıştığı içindir, ancak Bayes’e yapılan göndermeleri her yerde görmeye başladım. Yakın zamanda Edgar Allen Poe’nun Tüm Eserleri’ni Kindle’ımda eritmeye çalışırken, Nantucketli Arthur Gordon Pym’in Öyküsü’nde şu cümleye denk geldim: “Çıkarımlarımızı, en küçük veride dahi lehte ya da aleyhte bir önyargı olmaksızın mı yapıyoruz?”
Bayes trenine koşmadan önce Poe’nun bu ikazını aklınızın bir köşesine yazın.
*Arkadaşlarım Greg, Gary ve Chris bu yazıyı ben yayınlamadan önce gözden geçirdiler, bu yüzden hatalardan onlar sorumlular.
Postscript: Columbia’daki bir Bayesyen istatistisyen olan ve Donald Rubin bahsinde blogunu linklediğim Andrew Gelman, bana şu yorumu gönderdi: “Sosyal ve çevre bilimi ve politika üstüne çalışıyorum, teorik fizik değil; bu nedenle Bayes’in sicim ve çokluevren teorilerinde o ya da bu şekilde kullanılmasına dair bir pek yorum yapamam! Aslında bir hipotezin doğru olduğu yönünde bir çerçeve çizen sonuçları pek sevmem. Bu, ‘hipotezin’ veya olasılıkların iyi belirlendiği, örneğin yazı kontrolü (Bkz. http://andrewgelman.com/2014/01/22/spell-checking-example/) gibi basit hallerde çalışıyor. Ama bilimsel bir hipotezin doğru ya da yanlış olduğu ihtimalinin düşünülmesini makul bulmuyorum (Bkz. http://andrewgelman.com/2014/01/22/spell-checking-example/). Kısacası, Bayesyen metotların bir model içinde çıkarım yapmak için çok iyi bir yol olduğunu, ancak bir modelin ya da hipotezin doğru olup olmadığını saptamak için genel anlamda iyi bir yol olmadığını düşünüyorum (Doğrusu, ‘bir model ya da hipotezin doğruluğu ihtimalinin” genel olarak -az sayıdaki bilinen önemli örnekleri olsa da onları hariç tutarak- anlamsız olduğunu düşünüyorum). Aynı zamanda şu paragrafınızı da fark ettim: ‘Çoğu durumda öncül, yalnızca tahminin eseridir; bu da öznel faktörlerin hesaplamalarınıza sızmasına yol açar. Kanserin aksine sicimlerin, çokluevrenlerin, enflasyonun yahut tanrının olmadığını düşünüyor olabilirsiniz. Bu şüpheli kanınıza, şüpheli kanıtlar atfedebilirsiniz. Bu yolla Bayes Teoremi mantığa sağladığı katkıyı sahtebilim ve batıl inançlara da sağlayabilir.’ Bu alıntının bir şekilde modellemenin tüm parçalarının öznel tahminlerin eseri olduğu yanılgısına çıktığını düşünüyorum. Veya, diğer bir deyişle, bir istatistik modelinin tümü anlaşılmaya ve değerlendirilmeye ihtiyaç duymaktadır. Öncül kısmı şaibeliyken veri modelinin doğru varsayıldığı tutumuna itiraz ediyorum. Bu konuda yazdığım yazı: http://andrewgelman.com/2015/01/27/perhaps-merely-accident-history-skeptics-subjectivists-alike-strain-gnat-prior-distribution-swallowing-camel-likelihood/.”
Beyinler Bayesyen Midir?
Bayes Teoremi’nden hareketle kurulan algoritmaların insan bilişini taklit edebilmesi, beynimizin benzer algoritmalar kullandığı anlamına gelmiyor.
Şu an, beyniniz bu sembolleri bir İngiliz rahibinin 250’yi aşkın yıl önce oluşturduğu bir formülle, yani Bayes Teoremi’nin yardımıyla çözümlüyor — veya bazı bilim insanları böyle olduğu zannında.
“Bayes Teoremi: Olayı Ne?” [Bayes’ Theorem: What’s the Big Deal?”] yazım teoremin güçlü yönlerini ve sınırlarını ortaya çıkarıyor. Presbiteryan vaizi Thomas Bayes’in, şans oyunlarındaki kazanma şansını hesaplamasında yardımcı olması için icat ettiği teorem, hipotezlerin güvenilirliklerini yeni bilgiler ışığında güncellemeyi sağlıyor.
Formül, özellikle yapay zeka olmak üzere kendine çok geniş çaplı bir kullanım sahası açtı. Bu başarıdan ilham alan bazı bilim insanları, beynimizin Bayesyen algoritmalar kullandığı kanısına vardılar. Eğer bu algoritmalar bir bilgisayarın algı, tanıma, mantık yürütme ve karar almasına yardımcı olabiliyorsa, belki beyinlerimizin de bu görevleri yerine getirmesinde payları vardı; ne de olsa beyinler de garip, yumuşak bilgisayarlardır.
Benimki de dahil pek çok beynin Bayes Teoremi’ni kavramakta zorlandığı düşünülünce, Bayesyen-beyin tezi şaşırtıcı görülebilir — ve gerçekten de bu durummuhalif fikirlere yol açtı. Bu tartışmanın içyüzünü kavrama arayışıyla, geçtiğimiz ay beynim ve ben New York Üniversitesi’nde iki günlük bir toplantıya katıldık: “Beyin Bayesyen Midir?”
Toplantı, New York Üniversitesi Zihin, Beyin ve Bilinç Merkezi [New York University Center for Mind, Brain and Consciousness] filozofları Ned Block ve David Chalmers tarafından organize edildi. Merkez’in meşgul zamanlarıydı. Kasım ayında, kritize ettiğim bir entegre bilgi teorisi çalıştayına (integrated information theory workshop) sponsorluk etmişlerdi. Entegre bilgi teorisyenleri bilinci, zihninnasıl hissettirdiğini açıklamaya çalışıyorken, Bayesçiler ise zihnin ne yaptığına odaklanırlar . NYÜ’nün vurucu Bayes duyurusu şöyleydi:
Bayesçi teoriler, son yıllarında, bilişsel bilimlerde oldukça büyük bir ilgi yakalamayı başardı. Bu teorilere göre, zihin hipotezlere belli olasılıklar atıyor ve bunları standart olasılıksal çıkarsama[inference] kurallarına göre güncelliyor. Bayesçi teoriler algı, öğrenme, bellek, mantık, dil, karar alma ve pek çok başka alana uygulandı. Ayrıca, Bayesçi yaklaşımlar nörobilimde de artan bir popülariteye sahip; birkaç potansiyel nörobiyolojik mekanizma öne sürüldü. Aynı zamanda, Bayesçi teoriler, yanıtları tartışmalı olan pek çok temel soruyu doğurdu: Beyin aslında gerçekten Bayesçi kurallar kullanıyor mu? Yoksa davranışın yaklaşık tasvirlerinden mi ibaretler? Bayesçi teoriler bilişteki irrasyonaliteyi ne düzeyde karşılayabiliyor? Mantıksız tektip bir zihin görüşü (uniform view of the mind) mü gerektiriyorlar? Bayesçi teoriler, tanıdıkları aşırı serbestlik nedeniyle saçmalık sınırlarında mı? Algı, biliş, mantıksallık ve bilinç arasındaki ilişkiye dair çıkarımları nelerdir?
Konferansta çözülmekten ziyade ortaya atılmış, güzel sorular. Bu gönderide, Bayesyen-beyin hipotezinin artı ve eksileri hakkında muhteşem girişler yapan, toplantının ilk iki konuşmacısının pozisyonlarını sırasıyla özetleyeceğim. Sonrasında bir galip seçeceğim.
Bayesyen-Beynin Artıları
Her şeyi başlatan insan zihninin performansını, “tersine mühendislik [reverse engineering]” ile bilgisayarda replike etmeye çalışan MIT’’nin beyin ve bilişsel bilim programından Joshua Tenenbaum’du. Websitesinde (Bayesyen-beyin ve ilgili konulara dair makalelere bağlanan) açıkladığı üzere, “Makine-öğrenmesi algoritmalarını insan öğrenimi kapasitesine daha yakın hale getirmek daha güçlü yapay zeka sistemlerine ve aynı zamanda insan bilişini anlamak adına daha kuvvetli teorik paradigmalara yol açacaktır.”
NYÜ toplantısında Tenenbaum, bize bebekliğimizde dahi ne kadar zeki olduğumuzu hatırlattı. Kutucuklardan oluşan bir kule gördüğümüzde, dengeli mi yoksa yıkılacak gibi mi olduğunu hemen anlıyoruz. Yüzleri hızlıca tanıyor, mimikleri sayesinde insanların ne hissettiklerini tahmin ediyoruz. Olaydan olaya, belli gerçeklerden genellemelere ulaşıyoruz; bunlar da yeni gerçeklerle olayları anlamamızda bize yardımcı oluyor.
Tenenbaum’un iddiasına göre, Bayesyen programlar bu ve sayısız diğer bilişsel kabiliyette diğer yapay zeka yaklaşımlarından daha iyi ustalaşabilir. Bayesyen programlar, özellikle “bu kadar çok, bu kadar azdan nasıl elde edilirin” bir yansımasını yaratmakta etkili; ki bu da bizim kıt, muğlak verilerden bilgi edinme şeklimiz.
NYÜ toplantısından kısa bir süre sonra, The New York Times, Tenenbaum ve iki meslektaşının “insan kabiliyetlerine rakip olan” bir Bayesyen program araştırmasını övdü. Program, Yunan ve Sanskrit alfabeleri de dahil farklı alfabelerden el yazımı karakterleri tanıyor. Aynı zamanda, ”görsel bir Turing testini” de içeren özgün karakterler de yaratıyor. İnsanlardan oluşan jüri, insanların ve Bayesyen programın çizdiği karakterleri ayırt etmekte zorluk çekiyor.
Tenenbaum ve birlikte çalıştığı meslektaşları Science’ta, modellerinin bizim “aksiyon”, “hayal”, “açıklama” ve “yaratıcı genelleme” kapasitemizi “yakaladığını” öne sürüyor. Program, büyük veri kümelerini inceledikten sonra bilgi edinen tipik Bayesçi-olmayan yaklaşımların ötesinde bir performansa sahip. (Bu araştırmanın detayları için, şu basın duyurusuna bakın.)
Times teknoloji muhabiri John Markoff’la olan bir röportajında, Tenenbaum araştırmanın insan bilişiyle ilgisini şöyle vurguluyor: “Makine-öğrenmesindeki tüm gelişmeyle, çokça veri ve daha hızlı bilgisayarlarla yapabilecekleriniz çok etkileyici. Ancak çocuklara baktığınızda, azıcık veriden öğrenebildikleri şeyler müthiş. Bazısı öncül bilgilerden geliyor ve bazısı da beynimize içkin.”
Bayesyen-Beynin Eksileri
NYÜ’de Bayesyen programları yüceltirken Tenenbaum, gururlu bir ebeveyn edasıyla konuştu. Kürsüyü, ancak konferans sunucusu Chalmers’ın ısrarcı zaman aşımı uyarılarından sonra terk etti. Tenenbaum hevesini biraz dizginledi. Bayesçi paradigmanın biliş modellemesindeki üstünlüğü konusunda ısrarcılığını sürdürse de, bunun muhtemelen “yetersiz” olduğu ve diğer yaklaşımlarla tamamlanmasının gerekeceğini de kabul etti.
Ancak Tenenbaum’un ardından çıkan Jeffrey Bowers’a göre, Bayesyen modeller yetersiz oldukları gibi gereksiz de olabilirler. Heyecanını saklayamayan Tenenbaum’un aksine, Bowers kötü haber vermekten nefret edermişçesine hafif kederli bir görünüme sahipti.
Önceki gönderimde, Bayes Teoremi’nin bana hem önemli içgörülere hem de saçmalıklara yol açması bakımından evrim teorisini hatırlattığından söz etmiştim. Bristol Üniversitesi’ndeki bir psikolog olan Bowers da aynı analojiyi yaptı.
Sunumu, biyolog Stephen Jay Gould’un bazı evrimsel biyolojik özelliklere dair izahatlerden dayanaksız, ad hoc stili diye yakınışını andıran, Bowers’in bir ortakla 2012’de yazdığı “Psikoloji ve nörobilimdeki oldu-bitti öyküler” (Bayesian just-so stories in psychology and neuroscience) makalesinin bir yeniden ele alınışıydı. Gould, bu türden açıklamaları “oldu bitti öyküleriyle,” leoparın beneklerini ve devenin hörgücünü nasıl aldığına dair öykülerle kıyaslıyordu.[1])
Aynı şekilde Bowers, Bayesyen modellerin, öncül varsayımlar ve girdilerde ufak düzenlemelerle adeta herhangi bir bilişsel görevin yansımasını yaratabileceği fikrine karşı koydu. Bayesyen modeller o kadar esnekti ki, evrimsel psikolojinin insan özelliklerine getirdiği açıklamalarda yaşandığı üzere, yanlışlanabilirlik ilkesi onlara erişemiyordu.
Bowers’in belirttiğine göre Bayesyen ve Darwinci teorilerin kıyası, Darwinci teorilere yapılan -en hafif tabirle- adaletsiz bir davranıştı. Tüm hatalarına rağmen, evrimsel psikoloji irrasyonalitemizi makul bir şekilde açıklıyor: Belki de bu mantıksızlığımız; istemli arzularımızla bencil genlerimizin çoğalma dürtüsü arasındaki çatışmadan, ya da Homo sapiensin doğduğu çevreyle modern çevrenin arasındaki uyuşmazlıklardan köken alıyordur.
Bowers Darwinci bir perspektifin aynı zamanda beynin, bilişsel görevlerini yerine getirmek için oldukça etkin, hatta en uygun yöntemlerle çalıştığı yönündeki Bayesçi iddiayla ters düştüğünü söyledi. Beyinlerimizi geçmişin biyolojik özelliklerinden toplayan doğal seleksiyon, onları en uygunu değil “yeterince iyiyi” elde edecek şekilde tasarladı.
Bowers, nöral ağlar gibi diğer bilgi-işlem modellerinin Bayesyen modellerin sonuçlarını tekrarlayabildiğini ekledi. Nörobilim ise, Bayesçilerin iddiasının aksine, nöronların bilgiyi Bayesyen şekilde işlediği fikrini destekleyecek neredeyse hiçbir şey sunmadı.[2]
Bowers, konuşmasını ironik bir darbeyle bitirdi. Bayesyen-beyin hipotezinin bir Bayesçi analizinin, hipotezin ne kadar zayıf olduğunu ve Bayesçilerin onay yanlılığına ne denli müsait olduğunu ortaya çıkardığını öne sürdü.
Önceki gönderimde bahsettiğim üzere, Bayes teoremi, hipotezinizin kanıtınız hakkındaki tüm alternatif açıklamaları titizlikle değerlendirmediğiniz müddetçe güvenilir olmadığına işaret ediyor. Bowers NYÜ’deki seyircilere, Bayesyen-beyin hayranlarının sıkça bu önkoşula uymakta başarısız olduğunu söyledi.
Poe Ne Düşünürdü?
Öyleyse Bayesyen-beyin tartışmasını kim kazanıyor? Bu kadar öngörülebilir olmaktan nefret ediyorum, fakat selamımı kuşkucu Bowers’e sunmalıyım. Geçtiğimiz onlarca yıldaki beyin ve zihin araştırmaları birikimim, beni sözümona kırılma noktalarına karşı güçlü bir önyargıyla donattı. (Bkz. İleri Okumalar)
Dahası, Bayesyen-beyin tezi şaibeli bir mantık yürütmeye indirgenebilir: Beyinlerimiz belli görevlerde üstün. Bayesyen programlar benzer görevlerde üstün. Öyleyse beyinde çalışan Bayesyen programlar var.
Bu mantığın bariz sınırları var. Peregrine şahinleri de F15 jetleri de uçmakta çok iyiler. Kimse buradan yola çıkıp peregrine şahinlerinin jet itkisiyle çalışması gerektiğini iddia etmiyor, çünkü herhangi bir salak bir peregrine şahini ve bir jet itkisinin birbiriyle oldukça alakasız olduğunu görebilir. Eğer beyinlerimizle Bayesyen makinelerin arasındaki analoji kendiliğinden bariz nitelikte bir ahmaklık değilse, bunun tüm sebebi hâlâ bilişimizin mekanizmalarının büyük oranda bizden saklı olmasıdır.
Önceki gönderimi Bayes-stili çıkarımlara karşı, yakın zamanda tekrardan okuduğum Edgar Allen Poe’dan bir uyarıyla bitirmiştim. Bu gönderiyi araştırırken, bir diğer münasip Poe-izm’e rastladım.
Bu seferki, Bayesyen-beyin savunucularının seçimlerimizde ve hedeflerimizin peşinde büyük oranda rasyonel olduğumuz kilit varsayımına gönderme yapıyor. Poe, zihin teorisyenlerinin zanlarını sıklıkla zihinlerin ne yaptığı değil, ne yapması gerektiği üzerine kurmasından yakınıyor. “Tanrı” yerine “doğal seleksiyon” koyun ve Poe’nun nutuğu artık NYÜ konferansına yerinde bir katkı sağlayacaktır:
“Anlayan ve gözlemleyen değil de entelektüel ya da mantıksal[3] kişi, kendini tasarımlar düşlemeye — tanrıya gayeler dikte etmeye odakladı. Böylelikle keyfince idrak etti Jehovah’ın niyetlerini; bu niyetler dışında sayısız zihin sistemi inşa etti… Şayet zihinleri sınıflandırmak zorundaysak; insanın genelde yahut arada yaptıklarını ve yapageldiklerini temel alarak sınıflandırmak, O’nun insanı uğruna yarattığı amaçtan anladığımızı esas alarak sınıflandırmaktan daha bilgece, daha güvenli olurdu.”
Hiç şüphe yok ki Poe hayranları, bu pasajın aklın nasıl da mantıksız olabildiğini gözler önüne seren “Küçük Sapık Şeytan” (The Imp of the Perverse) adlı kısa hikayeden alıntı olduğunu fark edecektir. Eğer bir küçük şeytan (imp) sizi Bayesyen-beyin-trenine atlamanız için kışkırtırsa, Poe’nun rahatsızlık verici öyküsünü (tekrar) okuyun.
[1] Just-So Stories for Little Children, Rudyard Kipling’in yazdığı ve çizimlerini de kendisinin yaptığı, esasında kızına uyku öncesi anlattığı öykülerle başlayan bir kitap. Hayvanların öne çıkan özelliklerini nasıl kazandıklarından bahsediyor. Evrimsel biyologlar, bunu terimleştirerek, Kipling’in kurguda Lamarckçı şekilde yaptığını, gerçekte bazı biliminsanı ve düşünürlerin Darwinci açıklamarla gerçek yaşamda sürdürdüklerini söylerler. Genelde ‘açıklayıcı olmayan ama açıklayıcı görünen’ evrimsel argümanlar için söylenir. (Ç.N.)
[2] Bu konuda John Horgan biraz haksızlık ediyor. Pek tabii ki bulgular çok taze olduğu için tartışılmaya devam ediliyor ama “hiç kanıt sunmadı” demek aşırı olur. Birkaç çalışma için ileri okumalara bakabilirsiniz. (E.N.)
[3] Logical kelimesini mantıklı yerine mantıksal diye çevirmemizin sebebi, bir insanın mantıklı olduğu durumda ‘reasonable’ olarak adlandırılması, fakat logical kelimesinin argümanlara ve önermelere ithafen genelde kullanılması. (E.N.)
İleri Okuma Önerileri
Bayes Teoremi’ni formel olarak da kavramak istiyorum diyenler için, Ben Lambert’in “A Student’s Guide to Bayesian Statistics”ini önerebiliriz, diğer ders kitaplarına nazaran daha rahat okunan ve çalışılabilen bir kitap. Bunun yanı sıra, Bayesyen yaklaşımların bilişsel bilimlerdeki genel durumunu öğrenmek ve buradaki tartışmaları çok teknik olmayan (matematiksel açıdan teknik olmasa da, psikolojik ve nörobilimsel arkaplan gerektirdiğini belirtelim) ama yine de derin şekilde incelemek isteyenler için, Andy Clark’ın 2013 tarihli “Whatever next? Predictive brains, situated agents and the future of cognitive science” makalesini önerebiliriz.
Ayrıca önsözde bahsettiğimiz tartışmayı neuromatch’e kayıt olarak izleyebilirsiniz, makaleler ise; Paul Cisek, “Resynthesizing behaviour through genetic refinement” ve Blake ve diğerleri, “A deep learning framework for neuroscience”. Bu iki makalenin de doğrudan doğruya Bayesyen Beyin ile alakalı olmadığını belirtelim. Bunlar, daha ziyade “beyni modelleyebiliyor olmamız, beynin modellediğimiz şekilde çalıştığı anlamına gelir mi?” sorusuna ilişkin iki karşıt görüşü ifade eden çalışmalar.
Son olarak, John Horgan’ın biraz haksızlık ettiğini, Bayesyen Beyin için kanıt olmadığını iddia etmenin abartı olacağını söylemiştik. Birkaç çalışma daha önerecek olursak; Hosoya ve diğ., 2005, “Dynamic predictive coding by the retina.”, Hohwy ve diğ., 2008, “Predictive coding explains binocular rivalry: An epistemological review”, ve son olarak, Rao ve Ballard, “Predictive coding in the visual cortex: a functional interpretation of some extra-classical receptive-field effects” .