Özgün Adı: Is predictive coding theory articulated enough to be testable?
Naoki Kogo, Radboud University’nin Biyofizik ve Bilişsel Nörobilim bölümlerinde Görsel Nörobilim grubunda araştırmacıdır. Christopher Trengove ise doktorasını Bilgisayar Biliminden yapmış ve şuanda Perceptual Dynamics Laboratory’de araştırmacı olarak çalışmaktadır.
Öngörmeli Kodlama Test Edilebilir Bir Teori Mi?
Deneysel Psikoloji, Beyin ve Biliş Laboratuvarı, Leuven Üniversitesi (KU Leuven), Leuven, Belçika
Anahtar kelimeler: öngörmeli kodlama, görme korteksi, geribildirim, fizyolojik, üretici model, bayesçi modeller, nöroanatomi, hata sinyalleri
Öngörmeli kodlama teorisine göre [1, 2, 3] korteksteki hiyerarşik düzenin amacı duyusal girdinin tahminlerini ve temsillerini çeşitli düzeylerde karşılaştırmaktır. Bunu yapmasının sebebi ise nöral aktivitenin dinamiklerinin hatayı -yani her düzeydeki girdinin temsili ile ondan daha yüksek bir düzeydeki temsilden kaynaklanan tahminle arasındaki fark- en aza indirgeyecek şekilde tasarlanmış olmasıdır. Bir başka deyişle, tüm bu hiyerarşideki nöral aktivite, duyusal girdinin tahminiyle temsili arasındaki farkın en az olacağı bir duruma yerleşir (to settle). Bu bakış açısı inanılmaz bir yaygınlık kazandı ve çeşitli türdeki deneysel veriyi açıklamak için bu teorik çerçeveyi kullanan araştırmalar o zamandan beri oldukça ilerledi [4, 5].
Öngörmeli kodlama teorisi, nöroişlemlemesel mekanizmayı tanımlamaya çalışan bir mekanistik teoridir. Bu yüzden, sadece teorik çerçevenin terminolojisini kullanarak fenomenolojik veriyi tanımlamak yeterli değildir. Teori, deneysel verinin nöroişlemleme mekanizmaları tarafından açıklanmasına izin vermeli ve öne sürülen mekanizmalar da nörofizyolojik düzeyde test edilebilir olmalıdır. Bunu yapmak içinse mekanizmanın detayları, özellikle hataların nasıl hesaplandığı ve en aza indirgendiği, nöronal açıdan ifade edilmelidir. Bu çerçevede aynı zamanda her düzeydeki hata sinyallerinin nöral aktiviteyi iki şekilde etkilediğini göz önünde bulundurmak gereklidir. İlki yüksek düzeylere yaptıkları, daha yüksek düzeylerdeki temsillerin nöral aktivitesini etkileyen bir ileribildirimdir. Bunun sonucunda oluşan tahminler ise ardından daha düşük düzeye geribildirilir. İkincisi ise aynı anda hata sinyallerinin aynı düzeydeki nöronların cevap özelliklerini etkilemesi ve duyusal girdinin temsilinin düzenlenmesidir. Tahminin güncellenmesi ve daha düşük düzeydeki temsilde yapılan değişiklikler, bu ikisinin birbirleriyle eşleşmesini artırmak amacıyladır. Bu çift yönlü ‘uzlaştırma’ (reconciliation) sayesinde hata sinyalleri en aza indirgenir. Fakat hem yüksek düzeydeki tahminlerin hem de düşük düzeydeki temsillerin eş zamanlı değişmesi olasılığı, ve aynı yerel devrede hata nöronlarının ve duyusal temsil nöronlarının karışık bir düzende olması, “çoklu seçenek” problemine yol açmaktadır. Bu problem özellikle fMRI, EEG ve nöron birimi (unit) kayıtları yoluyla bu teoriyi test eden deneysel verilerde gözlenir. Örneğin, kayıt aldığımız bir birimin (nöronun) hata nöronu veya girdiyi temsil eden bir nöron olduğunu nasıl belirleriz? Rao ve Ballard’ın modelinde (1999) çizginin devamlılığı tahmin edilirken çizgi parçasının ani bitişini sinyalleyen sonlandırıcı hücrelerin hata nöronları olarak işlev gördüğüne dikkat edelim. Aksine, Kapadia vd. (1995) bulgularına göre, alıcı alanın (receptive field) dışında bir yere aynı doğrultuda olan çizgi parçaları gösterildiğinde bir çizgi parçası için oluşturulan nöral cevap artıyor. Önceki durumda artan nöral sinyalin sebebi girdinin ve tahminin birbirleriyle eşleşmemesiyken sonraki durumda ise bu artış girdiyle tahminin eşleşmesiyle açıklanmaktadır. Bu açıklamalardaki görünür tutarsızlık ne şekilde çözümlenebilir? Bir de Kanizsa’nın yanılsamalı yüzeyini düşünelim (Kanizsa, 1955). Görme korteksinin (hiyerarşide) daha düşük düzeylerinde bulunan nöronların yanılsama içeren kontürlerin olduğu lokasyonlarda aktive olduğu gözlemlenmiştir (von der Heydt vd., 1984). Bunlar hata nöronları mı yoksa temsil nöronları mı? Bir başka deyişle, bu nöronlar hata sinyalini oluşturan, girdi ve tahmin arasındaki uyuşmazlık sonucu mu aktive oluyorlar, yoksa temsil sinyalinin tahminle uyumlu olması üzere modifiye edilmesi sonucu mu? Bu durum aynı zamanda, fMRI’dan alınan kayıtlar gibi, bir nöron popülasyonunun aktivitesinin kayıtlarında da geçerlidir. fMRI sinyalinde artış, artan hata sinyali sebebiyle midir yoksa girdinin temsilindeki değişiklikler sebebiyle midir? Düşük düzeydeki temsil ve tahmin arasındaki uyuşmazlığı giderme süreci, hata nöronlarının susturulmasına (baskılanması) mı yol açar? Eğer açıyorsa bunlar verilerde gözlenebilir mi? Bu son soru özellikle önemlidir çünkü düşük düzeydeki nöral sinyalin azalışının hatanın en aza indirgenmesi ile açıklanabileceği olduğu önerilmiştir [7, 8, 9, 10, 11, 12]Test edilebilirlik ile ilgili bu problemleri aşabilmek için, teori (öngörmeli kodlama) yeteri kadar nörofizyolojik detaylarla gündeme getirilmelidir, özellikle de hata işlemlemesi ve hatanın en aza indirgenmesi bağlamında.
Öngörmeli kodlama teorisi, hem neokorteksin ayrık alanlarının içinde hem , alanlar arasında katmanın konumuna ve kaynak ve hedef nöronlarının çeşidine özgü ileribildirim ve geribildirim projeksiyonlarında gözlenen sistematik bağlantı örüntüsünden ilham almaktadır [13]. Bu anatomik örüntülere göre nöroişlemleme süreçlerinin temelleri karakteristik bir nöral devreye dayanmaktadır. Bu nöral devre, alanlar içi ve alanlar arası bağlantılar içermekte ve hiyerarşik bir biçimde modüle olarak yinelenmektedir. Rao ve Ballard’ın (1999) öne sürdüğü yinelemeli (iterated) devre bloğu, spesifik bir biçimde oluşturulan ve hesaplamanın ana modülü olarak çalışan temel bir nöral devre olan “kanonik mikrodevre”ye bir örnektir. Test edilebilirlik yolunda bir sonraki adım ise öne sürülen nöral hesaplamanın nasıl gerçekleştiğini daha gerçekçi kortikal nöronlar ve devreler yoluyla belirlemektir. Bastos vd. (2012) bu meseleye şu şekilde baktılar: Öncelikle, öngörmeli kodlamanın dinamiklerini yürüten (to implement) bir dizi denklemler sundular ve ardından da eşitlikteki terimleri farklı katmanlarda nöral alt tiplerle eşleştirdiler. Ancak, öngörmeli kodlamayı gerçekleyen nöroişlemleme mekanizmaları halen tartışılmaktadır [14, 15, 16, 17, 18, 5, 19, 20]. Bu makalemizde ise Bastos’un modelinin ardında yatan mantığı inceleyerek öngörmeli kodlamaya dair çeşitli kritik sorular yöneltiyoruz: Nöronal anlamda hata sinyalleri nedir ve nasıl hesaplanırlar? Bu sorunun, öngörmeli kodlama teorisinin asıl meselesi olduğunu düşünmekteyiz.
Bastos ve diğerlerinin hareket noktası üretici modeldir: yinelenen ve merkezden ayrılan (centrifugal) bir “sebepler” (v) ve “sonuçlar” (x) dizisi. Üst düzeydeki sebep (i+1) bir alt düzeydeki durumu ortaya çıkarır (i), bu da bir alt düzeyin (i-1) üst düzeyi haline gelir. Ardından, modüller arasındaki çift yönlü etkileşimi öne sürerek bir geribildirim sistemi yarattılar. Hiyerarşinin her düzeyinde durum ve sebebin koşullu beklentileri ile bunların hataları hesaplanır, hata sinyalleri üst düzeylere gönderilir ve beklenti sinyalleri ise alt düzeylere gönderilir. Hem sebepler hem de durumlar için beklentiler ve hatalar sırasıyla µ ve ξ olarak belirtilir (Denklem 1). Böylelikle, her düzeyde dört ana değişken bulunur: µv, µx, ξv, ve ξx (Bu değişkenlerin her biri, her düzeydeki girdi temsilinin boyutluluğuna bağlı olarak çok boyutludur).
Denklem 1’deki ardışık süreçleri inceleyerek ve önceden bildikleri nöral tipleri ve bunların neokorteksteki bağlantılarını kullanarak, denklemler ve nöral mimari arasındaki “gözle görülür tekabüliyete” işaret ettiler. Buradan hareketle, Denklem 1’deki süreçler ve ayrı nöron alt-tiplerinin µv, µx, ξv, ve ξx terimleri olarak görev yaptığı bir nöral mikrodevre arasında bir eşleşme olduğunu öne sürdüler (original makaledeki Figür 5). Devrenin işleyişi aşağıdaki gibidir:
- i+1 düzeyindeki hata sinyali g(i+1), katman 5/6’daki µv(i + 1) ve µx(i + 1)’nin bir fonksiyonu olarak üretilip bir alt düzeye gönderilir (i).
- Alt düzeyde, hata sinyali ξv(i + 1), katman ⅔’te g(i+1) ile µv(i) kıyaslanarak hesaplanır.
- Hata sinyali ξv, ileribildirim bağlantılarıyla üst düzeydeki katman 4’e gönderilir (ve o katmandaki uyarıcı (excitatory) nöronlar tarafından yeniden temsil edilir).
- Katman 4’te bulunan durumun hata sinyali, ξx(i), aynı düzeydeki sebep ve durumun beklentilerine göre güncellenir.
- Hata sinyalleri sebep ve durumun beklentilerini güncellemeye (µv ve µx) katman 2/3’teki uyarıcı nöronları düzenleyerek yardım eder.
- Sebep ve durumun beklentileri (µv ve µx), katman ⅚’da, daha alt düzeye gönderilmek amacıyla üretilen tahmin sinyali g’yi üretmek için, yeniden temsil edilirler.
Öne sürülen çerçevede, hata daha alt düzeydeki temsil ile tahmin arasındaki farktır. Yani,
Hata = “temsil” — “tahmin”
Bu, yüzeysel katmanda (adım 2), g(i+1)’i µv(i)’den çıkartarak oluşturulan hata hesaplamasına denk gelir. Bu formülasyon görünüşe göre bazı problemlere sebep olmaktadır.
Figür 1
Figür 1 | (A) Bastos vd. (2012) katman 6’daki nöronların alt düzeye geribildirim sinyali gönderen sebebin beklentisini, µv, ve durumun beklentisini, µx, temsil ettiklerini öne sürdü. Onların diyagramında, bu çıktı sinyali g (kırmızı)’nin bir fonksiyonu olarak ifade edilmektedir. (B) Bu sinyal bir alt düzeye ulaştığında ise, geribildirim sinyali, işaret değişimine dair hiçbir açıklama getirilmeden, -g (kırmızı) olarak ifade edildiğini öne sürmüşlerdir. Hatayı hesaplamak için alt düzeydeki temsil sinyalinden, µv, ile onun tahmin faktörünü, g, çıkarmak gerekir (ξv = µv — g) ve böylelikle g’nin negatif sinyali gerekli olmaktadır. Ancak µv ve µx nöronları Bastos vd.’nin öne sürdüğü gibi pyramidal (uyarıcı) hücreler ise bu çıkarma işlemi gerçekleştirilemez. © Hata, “temsil — geribildirim,” hem pozitif hem de negatif değerler yaratabilir. Fakat Bastos vd.’nin öne sürdükleri devredeki hatayı temsil eden nöron, hata değeri negatif olduğundan aksiyon potansiyeli üretemez. Böylelikle, nöron, tahmin faktörü g’nin temsil sinyali µv’den büyük olduğu durumlarda bir hata sinyali üretemez. Pozitif ve negatif hata sinyalleriyle başa çıkabilmek için “biri pozitif diğeri de negatif hata sinyallerini üreten iki ayrı çeşit nöron popülasyonu” (Rao ve Ballard, 1999) gerekli olabilir. Örneğin, burada gösterilen baskılayıcı nöron, η(i)µ, “negatif” hatayı ξn(=g−µ(i)) hesaplayabilmek amacıyla ileribildirim temsil sinyalinin, µ(i), işaretini ters çevirir. Diğer baskılayıcı nöron, The other inhibitory neuron, η(i + 1)g, ise “pozitif” hatanın ξp (=µ(i) − g)’de bir nöral sinyal olarak ifade edilebilmesi için g’nin işaretini ters çevirir.
Bastos vd.’nin modelinde, geribildirim sinyali, g, daha yüksek düzeydeki katman ⅚ nöronlarından (µv ve µx) gönderilmektedir. Bunlar uyarıcı hücrelerdir. Eğer öyleyse bu sinyal daha alt düzeydeki yüzeysel katmana ulaştığında bu çıkarma işleminin nasıl yapılabileceği açık değildir. Geribildirim sinyalinin daha yüksek düzeydeki g olduğunu (Figure 1A, Bastos vd.’deki Figure 5’in sağ kısmı; altta) ve daha alt düzeyin üstteki katmanına ulaştığında -g (Figure 1B, Bastos vd.’deki Figure 5’in sağ kısmı; üstte) olmasında işaret değişimine dair hiçbir açıklamada bulunulmadığını da unutmayalım. Daha öncesinde L1’deki inhibitör nöronların işe dahil olduklarını önermelerine rağmen inhibitör nöronların ayrı çeşitlerinin bulunduğu yelpazede, bu çeşitlerin bir çoğu L2/3’e tek sinapstan oluşan güçlü bir baskılama sağlayabilir (Petilla Interneuron Nomenclature Group vd., 2008, sf. 699). L1’deki inhibitör nöronların g’nin işaretini değiştirme görevini üstlenmesinin nedenine dair hiçbir açık sebep bulunmamaktadır. Dahası, inhibitör nöronlar tarafından gerçekleştirilen bu işaret değişiminin asıl görevini açıklamamışlardır. Aynı zamanda şunu da belirtmişlerdir: “Geribildirim bağlantıları hiyerarşide daha altta yer alan alanların çalışmasını hem teşvik edebilir hem de baskılayabilir” (sf. 699). Bu ikili etki bu devre tarafından nasıl sergilenebilir ki? Öngörmeli kodlamanın bazı formülasyonlarında işlevsel açıdan, hata sinyalinin daha alt düzeylerdense daha üst düzeylerde hesaplandığı, taraflı rekabet çerçevesine (biased competition framework) denk olduğu da gösteriliyor (Spratling, 2008). Böylelikle, değişkenler ile nöron alt-tiplerinin farklı eşleştirilmesi yoluyla, biyolojik olarak mantıksız olan “çıkarma işlemi için yukarıdan-aşağı baskılama”dan kaçınmak mümkün olabilir.
Ardından, hata sinyalinin nasıl temsil edildiğini düşünelim. Daha alt düzeyin beslendiği tahmin sinyalinin temsil sinyalinden daha güçlü olduğunu varsayalım. Hatanın tanımı onlara göre “temsil eksi tahmin” olduğu için, hata değeri negatif olur. Ancak bahsettiğimiz modelde hata nöronu, ξv, piramidal bir hücre olduğu için Figür 5’teki ξv(i + 1) daima uyarıcıdır. Başka bir deyişle, bu devre daha yüksek düzeylere gönderilen bir “negatif sinyal” üretemez. Bu problemin üstesinden gelmenin iki yolu var. İlki, ξv(i + 1)’de taban seviyesinde (baseline) bir aktivite bulunduğunu ve negativite sinyalinin taban seviyesinden daha düşük bir sinyal olarak ifade edildiğini varsaymaktır. Eğer durum buysa, hatanın en aza indirgendiği durumda hata nöronları taban düzeyinde aktivite gösterir, tamamen sessiz olmazlar. Taban düzeyinde aktivite olması şu anlama gelir: hata nöronunun enerji tüketiminin, hata en aza indirgendiği durumda en düşük miktarda olması gerekmez. Bu, hata nöronlarının aktivitesinin en aza indirgendiği (ya da bu nöronların sessizleştirildiği) görüşe kıyasla oldukça farklıdır; halbuki bu en aza indirgenme görüşü, öngörmeli kodlama teorisinin ana bir bileşenidir. Örneğin, Friston (2005)’te şöyle belirtilir: “Yüksek düzeydeki tahminler, tahmin hatasını açıklayabilir ve hata birimlerine susmalarını söyleyebilir” (s. 829). Kok vd. (2012)’de ise şu şekilde belirtilmiştir: “Yüksek düzeydeki tahminler tahmin hatasını açıklayabilir ve hata nöronlarını sessizleştirebilir (s. 265). Negativite sinyalini iletmenin ikinci yolu ise şudur (ve bu yöntem hata nöronlarının aktivitesinin en aza indirgenmesi konseptine bağlı kalmaktadır): Pozitif ve negatif hatalarla baş edebilmek için daha açık şekilde hata hesaplaması gerçekleştiren bir nöral devre (Figür 1C). Burada aynı zamanda Rao ve Ballard (1999)’ın pozitif ve negatif hataların bu şekilde hesaplanmasının mümkün olduğundan bahsettiğini (sayfa 85) de göz ardı etmemek gerekir. Eğer durum buysa Bastos vd. tarafından öne sürülen nöral devre, gerçek bir biyolojik sistemde hata hesaplamasının nasıl gerçekleştirildiğini açıkça temsil etmemektedir. Buna alternatif olarak, hatanın en aza indirgenmesinin, negatif hata sinyallerinden kaçınmak için bir bölme işlemi şekilde gerçekleştirilebileceği öne sürülmüştür (Koch ve Poggio, 1999). Ancak, bu seçenek de denge durumunun temel düzeydeki aktiviteler tarafından temsil edilmesini gerektirir ki bu da yukarıda tartışılan probleme yol açar.
Korteksteki alan içi mikro devreler ve onların alanlar arası çift yönlü bağlantıları, hiyerarşik bir biçimde döngüsel olan, kanonik bir sinyal işlemlemesini öneren sistematik ve tekrarlı bir örüntü halindedir. Bu devrelerin bilgiyi tam olarak nasıl işledikleri ise oldukça önem taşıyan bir sorudur. Öngörmeli kodlama, günümüzde bilişsel fonksiyonlar ve davranış için oldukça etkileyici ve korteksin sinyal işleme mimarisini açıklayabilecek mümkün teorik çerçevelerden biridir. Teorideki matematiksel formüllerin nörofizyolojik ve nöroanatomik parametrelere çevrilmesi, elektrofizyoloji ve psikofizik içeren deneylerin ince bir şekilde dizayn edilmesi konusunda büyük bir etki yaratabilir. Bastos vd.’nin sunduğu nöroişlemlemeli modelin analizi şunu öne sürmektedir: Hata sinyallerinin ne şekilde hesaplandığı, teorinin test edilebilmesindeki ana meselelerden biridir ve teorik formalizm ile somut nöral mekanizmalar arasında hala bir boşluk bulunmaktadır.