Turing Testi – Graham Oppy ve David Dowe (Stanford Encyclopedia of Philosophy)

“Turing Testi” ifadesi, en doğru şekliyle, makinelerin düşünüp düşünemeyeceği sorusunu ele almanın bir yolu olarak Turing (1950) tarafından yapılan bir öneriye atıfta bulunmak için kullanılır. Turing’e göre, makinelerin düşünüp düşünemeyeceği sorusu, tartışmayı hak etmeyecek kadar “anlamsız”dır (442). Bununla birlikte, daha kesin ve daha bağlantılı olarak dijital bir bilgisayarın Turing’in tanımladığı belirli bir oyunda (“Taklit Oyunu”) iyi performans gösterip gösteremeyeceğini sorarsak, o zaman – en azından Turing’in gözünde – tartışılmayı hak edecek bir sorumuz olmuş olur. Bununla birlikte, ileride göreceğimiz gibi, Turing’in kendisi, Taklit Oyunu’nda “iyi sonuç verebilecek” dijital bilgisayarlara sahip olmanın çok uzun sürmeyeceğini düşünmüştür.

“Turing Testi” ifadesi bazen, daha genel bir anlamda, zihne sahip olduğu varsayılan varlıklarda zihin, düşünce veya zekânın varlığına yönelik bazı davranışsal testlere atıfta bulunmak için kullanılır. Bundan dolayı bazen Turing Testi’nin, Descartes’ın Metot Üzerine Söylemi’nde önceden yapılandırıldığı ileri sürülmektedir. (Copeland (2000:527), 1668 Cartesian de Cordemoy yazılarında bu metnin bir ön görüsünü görmüştür. Abramson (2011a), Turing’in 1950’deki makalesini yazarken Descartes’ın dil testinin farkında olduğuna dair arşivsel kanıtlar sunar. Gunderson (1964) ise Turing’in çalışmasının izlerinin Descartes’ın çalışmasında rastlandığını belirten kişilerden biridir.) Descartes Söylem’inde şöyle der:

Vücudumuza benzeyen ve tüm pratik amaçlar için geçerli olan eylemlerimizi bize oldukça yakın bir şekilde taklit eden makineler olsaydı, yine de onların gerçek insan olmadıklarını anlamak için hâlâ iki kesin yola sahip olurduk. Birinci olarak, kelimeleri asla insanların yaptığı gibi, yani düşüncelerimizi başkalarına bildirmek için yaptığımız gibi kullanamazlar ve işaretleri bir araya getirip anlamlı bir şey oluşturamazlardı. Evet, sözler söyleyecek ve hatta organlarında bir değişikliğe neden olan bedensel eylemlere karşılık gelen sözler söyleyecek şekilde kurgulanmış bir makineyi kesinlikle tasarlayabilirdik. … Fakat böyle bir makinenin, en aptal insanların bile yapabileceği gibi, varlığına yönelik söylenen her şeye uygun bir şekilde anlamlı bir cevap vermek için farklı sözcük düzenlemeleri üretmesi düşünülemezdi. İkinci olarak, bazı makineler bazı şeyleri bizim yapabildiğimiz kadar iyi yapsalar, hatta belki bizden daha bile iyisini yapabilseler de geriye kalan şeylerde kaçınılmaz olarak başarısız olurlardı. Bu da makinelerin anlayarak değil, sadece organları sayesinde hareket ettiklerini gösterirdi. Akıl, her türlü durumda kullanılabilen evrensel bir araçken organların belirli eylemlere ihtiyaçları vardır. Bundan dolayı, bütün pratik amaçlar açısından bir makinenin, aklımızın bizi eyleme geçirdiği şekilde, yaşamın bütün olasılıklarında eyleme geçmesini sağlamaya yetecek kadar çeşitli organlara sahip olması imkânsızdır. (Bu paragrafın İngilizcesi Robert Stoothoff tarafından çevrilmiştir.)

Bu paragrafla ilgili her şey tamamen açık olmasa da görünüşe göre Descartes, “Makineler düşünebilir mi?” sorusuna olumsuz cevap veriyor ve hatta bu olumsuz cevap, hiçbir makinenin Turing Testi’ni geçemeyeceği sonucunda bir inanca bağlanabilir gibi görünüyor: Hiçbir makine, yetişkin insanların yaptığı gibi konuşup eylemlerde bulunamaz. Descartes açıkça bir şeyin makine olduğunu anlamamızı sağlayacak “çok kesin iki yolumuzun” olduğunu söylediğinden (ona göre, salt bir makinenin, kendi varlığına söylenen her şeye uygun şekilde anlamlı bir cevap verecek şekilde farklı sözcük düzenlemeleri üretebileceği düşünülemez ve bir makinenin, aklımızın bizi harekete geçirdiği şekilde yaşamın tüm olasılıklarında hareket etmesini sağlayacak kadar çeşitli organlara sahip olması pratik olarak imkânsızdır). “kendi varlığına yönelik söylenen her şeye uygun şekilde anlamlı bir cevap vermek için farklı sözcük düzenlemeleri üretebilen bir şey makine olamaz” iddiasına da katılmalıdır. Descartes’ın kabul etmeye razı olacağı tahmin edilen başka bir varsayımı, yani yalnızca düşünen şeylerin, onların varlığına yönelik söylenen her şeye uygun şekilde anlamlı bir cevap vermek için farklı sözcük düzenlemeleri üretebileceği varsayımını göz önüne alırsak şu sonuca ulaşabiliriz: Descartes, düşünen makine diye bir şeyin olamayacağına dair inancı için Turing Testi’nin iyi bir test olduğu görüşüne katılırdı. Bir şeyin gerçekten bir makine olduğu bilgisi göz önüne alındığında o şeyin, varlığına yönelik söylenen her şeye uygun şekilde anlamlı bir cevap vermek için farklı sözcük düzenlemeleri üretebileceğinin kanıtı, düşünen makinelerin olabileceğinin kanıtı olacaktır.

Turing Testi ifadesinin bir diğer kullanılışı ise zihnin var olduğu varsayılan varlıklarda zihnin, düşüncenin veya zekânın varlığına yönelik mantıksal olarak yeterli olduğu kabul edilen tamamıyla davranışsal koşulların belirli türlerine atıfta bulunmaktır. Örneğin, Ned Block’ un “Blockhead”[1] düşünce deneyinin, Turing Testi’ne karşı (varsayılan) çok güçlü bir itiraz olduğu sıklıkla söylenir. (Block 1981 bu bağlamdaki Turing Testi’nin doğrudan bir tartışmasını içerir.) Burada, bu görüşün bir savunucusunun kabul edeceği şey, bir varlığın Descartes ve (en azından varsayıldığı gibi) Turing’in kabul ettiği test türlerini (yani, tıpkı insanların yaptığı gibi kelimeleri kullanmak ve hatta uygulamakla ilgili olan testleri) geçmesinin mantıksal olarak mümkün olduğu fakat yine de bu varlığın zekâdan tamamen yoksun olduğu ya da bir zihne veya bunun gibi bir şeye sahip olmadığı fikridir.

Yazının ilerleyen kısımlarındaki tartışmalarda, şu ana kadar bahsedilen fikirler, tanıtıldıkları sırayla ele alınacaktır. İlk olarak, Turing’in makalesine (1950) ve içerdiği argümanlar hakkındaki tartışmalara yer verilmiştir. İkinci olarak, Turing Testi olarak adlandırılan çeşitli önermelerle ilgili mevcut değerlendirmelerin bir tartışması incelenecektir (Daha spesifik olarak, söz konusu önermelerin, Turing Testi olarak adlandırılmaya layık olup olmadıkları). Üçüncü olarak, Turing Testi’nin yapay zekâ araştırmaları için uygun bir hedef belirleyip belirlemediğine dair bazı tartışmalar da dâhil olmak üzere Turing Testi hakkında son zamanlarda yazılan bazı metinlerin kısa bir tartışmasına bakılacaktır. Ve son olarak da, Searle’in Çin Odası Argümanı ve özellikle de bu argümanın Turing Testi üzerindeki etkisi hakkında çok kısa bir tartışmaya değinilecektir.

İçindekiler

Turing (1950) ve Taklit Oyunu
Turing (1950) Ve Eleştirilere Cevaplar
- 2.1. Teolojik Eleştiri
- 2.2. Kafaları Kuma Gömme Eleştirisi
- 2.3. Matematiksel Eleştiri
- 2.4. Bilinçlilik Argümanı
- 2.5. Çeşitli Engellere Bağlı Argümanlar
- 2.6. Lady Lovelace Argümanı
- 2.7. Sinir Sistemindeki Süreklilik Argümanı
- 2.8. Davranışların Teklifsizliği Argümanı
- 2.9. Duyu Ötesi Algı Argümanı
Ortaya Çıkan Küçük Sorunlar
- 3.1. Taklit Oyunu’nu Yorumlama
- 3.2. Turing’in Tahminleri
- 3.3. Yararlı Bir Ayrım
- 3.4. Ek Not
Turing Testi’nin Mevcut Durumunun Değerlendirilmesi
- 4.1. Mantıksal Olarak Gerekli ve Yeterli Koşullar
- 4.2. Mantıksal Olarak Yeterli Koşullar
- 4.3. Ölçütler
- 4.4. Olasılıksal Destek
Alternatif Testler
- 5.1. Turing Testi Çok Zordur
- 5.2. Turing Testi Çok Kısıtlayıcıdır
- 5.3. Turing Testi Çok Kolaydır
  - 5.3.1. Daha Kapsamlı Turing Testi (The Total Turing Test)
  - 5.3.2. Lovelace Testi
  - 5.3.4. Çok Daha Kampsamlı Turing Testi (The Truly Total Turing Test)
- 5.4. Turing Testi Zararlı Olarak mı Değerlendirilmelidir?
Çin Odası
Zekâ Ölçümü Üzerine Kısa Bir Not

Kaynakça

1. Turing (1950) ve Taklit Oyunu

Turing (1950) şimdi değineceğimiz türden bir oyunu tanımlıyor. Bu oyunda bir insan, bir makine ve bir sorgulayıcı olduğunu varsayıyoruz. Sorguyu yapan kişi, diğer kişinin ve makinenin bulunduğu odadan ayrı bir odadadır. Oyunun amacı, sorguyu yapan kişinin bu diğer iki şeyden hangisinin insan hangisinin makine olduğunu belirlemesidir. Sorguyu yapan kişi, diğer kişiyi ve makineyi “X” ve “Y” olarak biliyor fakat en azından oyunun başında, diğer kişinin mi yoksa makinenin mi “X” olduğunu bilmiyor. Oyunun sonunda, ya “X insandır ve Y makinedir” ya da “X makinedir ve Y insandır” demesi gerekiyor. Sorgulayan kişinin, diğer kişiye ve makineye şu türden sorular sorulmasına izin veriliyor: “X bana X’in satranç oynayıp oynamadığını söyler misin lütfen?” Diğer kişiden ya da makineden hangisi X ise, kendisine yöneltilen soruları yanıtlamalıdır. Makinenin bu oyundaki amacı, sorgulayan kişiye hata yaptırarak makinenin diğer kişi olduğu sonucuna varmasına neden olmaya çalışmaktır. Diğer kişinin amacı ise, makineyi doğru bir şekilde belirlemesi için, sorgulayan kişiye yardımcı olmaya çalışmaktır. Turing (1950), oyunu hakkında şunu söylemiştir:

Yaklaşık elli yıl içerisinde, hemen hemen programlama kapasitesine sahip bilgisayarlar programlamanın ve bu bilgisayarların bu oyunu çok iyi oynamasının mümkün olacağına inanıyorum. Böyle bir oyunda ortalama bir sorgulayıcının, beş dakikalık bir sorgulamadan sonra doğru kimlik belirleme şansı yüzde 70’den fazla olmayacaktır. … 19. yüzyılın sonunda, kelimelerin kullanım şeklinin ve bilgili kişilerin genel kanısının o kadar çok değişeceğine inanıyorum ki birisi, herhangi bir çelişkiye sebep olacağını düşünmeden düşünen makinelerden bahsedebilecektir.

Turing’in Taklit Oyunu ile ilgili öngörüleri hakkında sorulabilecek en az iki tür soru vardır. Bu soru türlerinden ilki deneysel olanlardır. Örneğin, şimdi ya da yakın zamanda, ortalama bir sorgulayıcının beş dakikalık bir sorgulamadan sonra doğru kimlik belirleme şansının %70’den fazla olmayacağı kadar Taklit Oyununu iyi oynayan bir bilgisayar programlanacağı doğru mudur? İkinci soru türü ise kavramsal olanlardır. Örneğin, eğer ortalama bir sorgulayıcının beş dakikalık bir sorgulamadan sonra doğru kimlik belirleme şansının %70’den fazla olmadığı doğruysa makinenin belirli bir düzeyde düşünce, zekâ veya zihniyet gösterdiği sonucuna varmalı mıyız?

Turing, Taklit Oyunu’nun yirminci yüzyıldaki son durumunu görse büyük ihtimal hayal kırıklığına uğrardı. Bilgisayar programlarının Turing Testine tabi tutulduğu yıllık bir etkinlik olan Loebner Ödül Yarışmasının katılımcıları, Turing’in öngördüğü standardın yanına bile yaklaşamamıştır. Katılımcıların son on yıla ait transkriptlerine hızlı bir şekilde baktığımızda etkinliğe katılan programların hepsinin, sorgulamada pek de zekice olmayan bir dizi soruyla kolayca tespit edildiğini görüyoruz. Ayrıca, bu alanda bilgili olan önemli kişiler, beş dakikalık süre boyunca düzgün bir konuşma yürütebilecek bir bilgisayar programına sahip olmaktan hâlâ çok uzak olduğumuzdan dolayı Loebner Ödül Yarışmasının tam anlamıyla bir utanç kaynağı olduğunu iddia etmiştir(Bunun için örnek olarak Shieber 1994 bakabilirsiniz). Loebner Ödül Yarışmasına katılan programların yapılış stratejilerinin, Turing Testi’ni geçmeyi başarabilecek kapasiteye sahip bir şey üretme fikrini somutlaştırılmasından ziyade, yalnızca küçük bir ödül olan yılın en iyi yarışmacısı ödülünü kazanmak amacıyla tasarlandığı tüm taraflarca geniş çapta kabul edilmiştir.

Yirmi birinci yüzyılın ilk yirmi yılının sonunda bunların ne kadar değiştiği belirsizdir. Diğer yandan, dil geliştiricilerde ilginç gelişmeler olmuştur. Özellikle, OpenAI’nin yeni algoritması olan GPT-3 ü piyasaya sürmesi, coşkulu bir heyecan uyandırdı (Brown ve diğerleri 2020, Diğer internet kaynakları). GPT-3 kurgu, şiir, basın bültenleri, kod, müzik, şakalar, teknik kullanım kılavuzları ve haber makaleleri üretmede oldukça iyiydi. Belki de Chalmers’ın tahmin ettiği gibi (2020 ve diğer internet kaynakları), GPT-3 “yapay genel zekâya giden, insan aklının söz konusu olmadığı bir potansiyel yol öneriyordu”. Fakat GPT-3 de Turing Testi’ni geçmeye hiç yakın değildi: GPT-3 ne algılıyor ne de hareket ediyordu ve en iyi ihtimalle bir anlayış alanı olup olmadığı bile oldukça tartışmalıydı. Gelecek birkaç nesil doğal dil işleme (tahmin) modelleri içinde (örneğin, GPT-4 veya GPT-5 gibi bir şey), Turing Testi’ni geçebilecek bir şey üretecek şekilde algısal girdilere (inputs) ve davranışsal çıktılara (outputs) bağlanabilecek bir şeye sahip olup olmadığımız zamanla görülecektir.

Diğer bir yandan, örneğin Floridi’nin (2008) şikâyet ettiği gibi, ilerlemenin sinir bozucu derecede yavaş olduğu başka alanlar da vardır. 2014 yılında, bir bilgisayar programı olan Eugene Goostman’ın, Turing Testi 2014 yarışmasında jürilerin %33’ünü kandırmayı başardığı için, “Turing Testi’ni geçtiği” iddiaları ortaya atıldı. Fakat benzer sonuçların elde edildiği başka, bir defaya mahsus yarışmalar da oldu. Mesela 1991’de, gene bir bilgisayar programı olan PC Terapisti, jürilerin %50’sini kandırmayı başarmıştı. Ya da, 2011 yılında yapılan bir tanıtım gösterisinde, Cleverbot bundan daha da yüksek bir başarı oranına sahipti. Bu vakaların üçünde de denenme sayısı yeterli olmamakla birlikte sonuç güvenli bir şekilde tahmin edilebilir değildi: Ortalama bir sorgulayıcının, beş dakikalık bir sorgulamadan sonra ilgili programın kimliğini doğru belirleme şansının %70’den fazla olmadığına inanmak için güçlü gerekçeler bu üç vakanın hiçbirinde yoktu. Bundan daha önemli olan şeyse Turing’in önerdiği test ile yirminci yüzyılın sonlarında işlerin nasıl olacağına dair yaptığı özel tahmin arasında bir ayrım yapmamız gerektiğidir. Doğru kimlik belirleme şansının yüzdesi, bir dahaki testin gerçekleştiği zaman aralığı ve karşılıklı bir şekilde gerçekleşmesi gerekli olan konuşma alışverişlerinin sayısı, Turing’in yaptığı özel tahminde sabit parametreler olmalarına rağmen Turing Testinde ayarlanabilir parametrelerdi. Turing’in, yirminci yüzyılın sonunda işlerin nasıl olacağına dair yaptığı tahmin gerçeklikten çok uzak olsa bile önerdiği testin iyi bir test olması mümkündür. Fakat Turing Testin iyi bir test olduğu önerisini onaylamadan önce incelenmesi gereken çeşitli eleştiriler vardır.

Turing Testi sadece bizimle konuşmayı sürdürebilen şeylerde zekâyı onayladığı için bazı insanlar bu testin aşırı şovenist olduğunu iddia etmiştir. Neden konuşma sürdürme yeteneği olmayan ya da bir şekilde, bizim gibi yaratıklarla konuşmayı sürdüremeyen zeki şeyler var olmasın? (Bunun için örnek olarak French 1990 bakabilirsiniz.) Bu problemin arkasındaki önsezi belki de kabul edilebilirdir; zeki olan herhangi bir şeyin bizimle bir konuşmayı sürdürebilmesi gerektiği konusunda ısrar etmek aşırı derecede şovenisttir. (Diğer bir yandan, uygun niteliklere sahip çevirmenlerin varlığı göz önüne alındığında, farklı dilleri konuşan herhangi iki zeki varlığın bir tür konuşmayı sürdürmesi mümkün olmalıdır.) Fakat her halükarda şovenizm suçlaması konunun tamamen dışındadır. Çünkü Turing’in iddia ettiği şey sadece eğer bir şey bizimle bir konuşma sürdürebiliyorsa o şeyin sahip olduğumuz türden bir zekâya sahip olduğunu varsaymak için iyi gerekçelerimizin olduğudur. Yani Turing, sadece bizimle konuşmayı sürdürebilecek bir şeyin sahip olduğumuz türden bir zekâya sahip olabileceğini iddia etmemiştir.

Bazı insanlar ise, Turing Testi’nin yeterince zorlayıcı olmadığını düşünmüştür. Pek de zeki olmayan programların (örneğin ELIZA, ayrıntılar için Weizanbaum 1966 bakabilirsiniz) sıradan gözlemcilere oldukça uzun süreler boyunca bir zekâya sahipmiş gibi görünebildiğine dair sistematik olmayan kanıtlar vardır. Dahası, (Turing’in 2000 yılında olayların nasıl olacağına ilişkin tahmininde bahsettiği) beş dakika gibi kısa bir süre zarfında neredeyse tüm gözlemcilerin, kurnazca tasarlanmış ama pek de zeki olmayan programlar tarafından kandırılması mümkündür. Bununla birlikte, Turing Testi’ni geçmek için, testin gerçekleşmesi gereken durumlar dışında bilgisayar programının “sıradan gözlemcileri” kandırmasının yeterli olmadığını hatırlamak önemlidir. Bilgisayar programının yapması gereken şey, konuşmayı sürdüren iki katılımcıdan birinin makine olduğunu bilen birinin sorgulamasında, sorgulayan kişiyi kandırabilmektir. Dahası, bilgisayar programı bunu, tekrarlanan sayıda denemede yüksek oranda başarı ile yapabilmelidir. (Turing, testin ne kadar tekrarlanması gerektiği konusunda hiçbir şey söylemedi. Fakat beş dakikalık bir sorgulamadan sonra makinenin kimliğinin doğru belirleme şansının %70’den fazla olmadığına dair kesin kanıtlar elde etmek için oldukça fazla sayıda tekrar yapılması gerektiğini rahatlıkla varsayabiliriz.) Eğer bir bilgisayar programı bu oldukça zorlayıcı şeyi başarıyla geçebiliyorsa bu makinelerin da zekâsının olabileceğini düşünmek için, en azından ilk bakışta, bir nedenimiz olacağını iddia etmek makul olurdu. (Zekâya sahip makineler de dâhil olmak üzere, zekâya sahip bütün varlıkların bu testi geçmekte başarısız olabileceğini tekrar vurgulamakta fayda var. Örneğin ahlaki düşüncelerin bir sonucu olarak yalan söylemeyi veya numara yapmayı reddeden makinelerin olabileceği düşünülebilirdi. İnsan katılımcının, sorgulayan kişiye yardım etmek için elinden gelenin en iyisini yapması gerektiği için, “Makine misiniz?” sorusu, sorgulayan kişinin bu şekilde (patolojik?) sürekli doğruyu söyleyen makineleri insanlardan hızlıca ayırmasına sebep olurdu.)

Turing’in makalesinin (1950) bir diğer tartışmalı yönü ise, tartışmayı “dijital bilgisayarlar” konseptiyle sınırlandırmasıyla alakalıdır. Oysa bu kısıtlamanın gerçekte sadece Turing’in 2000 yılında olayların nasıl olacağına dair yaptığı tahmin için önemli olduğu ve testin ayrıntıları için önemli olmadığı açıktır. (Aslına bakılırsa, Turing’in önerdiği test iyi bir test ise o zaman hayvanlar, uzaylılar ve analog bilgisayarlar da dâhil olmak üzere her türden varlık için iyi bir test olması gerekirdi Yani, hayvanlar, uzaylılar, analog bilgisayarlar veya diğer herhangi bir şey Turing’in önerdiği testi geçerse, testi geçen dijital bilgisayarların zekâya sahip olduğunu düşünmek için nedenimiz olduğu kadar bu şeylerin de zekâya sahip olduğunu düşünmek için nedenimiz olacaktı.) Bunun yanı sıra, “düşünen makinelerin” dijital bilgisayarlar olması gerekip gerekmediği aslında oldukça tartışmalı bir sorudur. Ayrıca, Turing’in kendisinin, durumun böyle olması gerektiğini varsayıp varsaymadığı da tartışmalı bir sorudur. Özellikle, Turing’in (1950) ele aldığı itirazların yedincisinin, Turing’in ayrık durum makinelerinden farklı olduğunu açıkça kabul ettiği sürekli durum makinelerinin olasılığına değindiğini belirtmek önemlidir. Turing, biz sürekli durum makineleri olsak bile ayrık durum makinesinin bizi Taklit Oyunu’nun amaçları doğrultusunda yeterince iyi bir şekilde taklit edebileceğini iddia ederdi gibi görünüyor. Fakat yaptığı değerlendirmelerin, Turing Testi’ni geçen sürekli durum makineleri varsa testi geçen ayrık durum makinelerinin de gerçekte mümkün olabileceğini kanıtlamak için yeterli olduğu şüpheli görünüyor. Turing, “düşünen makineler” hakkındaki soruyu ilginç hâle getirmek için “makine” kavramına bazı sınırlar konulması gerektiğine işaret etmeye istekliydi:

Makinemizde her türlü mühendislik tekniğinin kullanılmasına izin vermeyi istememiz doğaldır. Aynı şekilde, bir mühendisin veya mühendis ekibinin çalışan fakat çalışma tarzı büyük ölçüde deneysel olan bir yöntemi uyguladıkları için yapıcıları tarafından tatmin edici bir şekilde tanımlanamayan bir makine inşa etme olasılığına da izin vermeyi isterdik. Ve son olarak, doğal yollarla doğan insanları, makinelerin kapsamı dışında tutmak isterdik fakat tanımları bu üç koşulu da kapsayacak şekilde şekillendirmek zordur. Örneğin birisi, mühendis ekibinin hepsinin aynı cinsiyetten olması gerektiği konusunda ısrar edebilirdi fakat bu gerçekten tatmin edici olmazdı. (örneğin) Bir insanın derisinin tek bir hücresinden eksiksiz bir birey yetiştirmek muhtemelen mümkündür. Bunu yapmak biyolojik tekniğin en yüksek övgüyü hak eden bir başarısı olurdu ama biz yine de bunu, bir “düşünen makine inşa etme” vakası olarak görme eğiliminde olmazdık (435/6).

Fakat elbette Turing’in kendisinin de fark ettiği gibi, ne dijital ne de biyoteknolojik olmayan büyük bir mümkün “makine” sınıfı vardır. Daha genel anlamda önemli olan nokta ise şudur: Turing, makine sınıfının ayrık durum makineleri sınıfından potansiyel olarak çok daha büyük olduğunu fark etse de uygun şekilde tasarlanmış ayrık durum makinelerinin Taklit Oyunu’nda başarılı olabileceğinden çok emindi. (Ve dahası 1950’deki makalesini yazdığı sırada, halkın gözünde çok büyük görünen “elektronik bilgisayarlar” gibi bazı ayrık durum makineleri vardı.)

2. Turing (1950) Ve Eleştirilere Cevaplar

Turing (1950) oldukça gayri resmi ve bazı yönlerden oldukça kendine özgü olmasına rağmen, Turing’in makinelerinin ve özellikle de dijital bilgisayarların “düşünebildiği” iddiasına karşı potansiyel eleştirileri değerlendirdiği tartışmayı dikkate alarak öğreneceğimiz çok şey vardır. Turing, değerlendirdiği eleştirileri şu başlıklar altında inceler: (1) Teolojik Eleştiri; (2) Kafaları Kuma Gömme Eleştirisi (The Heads in the Sand Objection); (3) Matematiksel Eleştiri; (4) Bilinçlilik Argümanı; (5) Çeşitli Engellere Bağlı Argümanlar; (6) Lady Lovelace Argümanı; (7) Sinir Sistemindeki Süreklilik Argümanı; (8) Davranışların Teklifsizliği Argümanı; (9) ve Duyu Ötesi Algı Argümanı. Bu eleştiriler, aşağıdaki ilgili alt bölümlerde ele alınacaktır. Burada tartışacağımız eleştirilere olan bazı karşı argümanları Turing’in kendisi de ileri sürmüştür.

2.1 Teolojik Eleştiri

Töz düalistleri, düşünmenin bir kişiyi oluşturmak için vücutla bir şekilde “birleşen”, maddi olmayan, ayrı olarak var olan bir tözün işlevi olduğuna inanırlar. Öyleyse bu argüman şu sonuca ulaşabilir: Bir vücuda sahip olmak, düşüncenin varlığını garanti almak için asla yeterli değildir. Dijital bilgisayarlar bütünüyle düşünemedikleri için, kendi başlarına diğer salt maddi bedenlerden farklı değillerdir. Dahası “teolojik” konseptinden de anlaşılabileceği gibi, “ruhun” bir bedenle uygun şekilde birleştiği yerde, bunun her zaman evrenin ilahi yaratıcısının işi olduğu da eklenebilir: Belirli bir beden türünün, düşünen bir ruhla doldurulmuş olup olmadığı tamamen Tanrı’ya bağlıdır. (İnsanoğlunun “Tanrı’nın suretinde yaratıldığı” önermesine kutsal kitaplarda iyi bilinen destekler vardır. Belki de “yalnızca Tanrı, Tanrı’nın suretinde şeyler yaratabilirdi” iddiasına teolojik destekler de vardır.)

Burada dikkat edilmesi gereken birkaç nokta var. İlk olarak, töz düalizmine yönelik birçok ciddi eleştiri mevcuttur. İkincisi, teizme yönelik de oldukça ciddi eleştiriler vardır. Üçüncü olarak, teizm ve töz düalizminin ikisinin de doğru olduğunu kabul etsek bile düşünen makinelerin bu görüşlerin birleşimi tarafından neden dışlanacağı hâlâ belirsizliğini korur. Tanrı’nın ruhları insan bedeniyle birleştirilebileceği düşünüldüğünde, Tanrı’nın ruhları dijital bilgisayarlarla (ya da kayalarla) birleştiremeyeceğini düşünmek için sebebin ne olduğunu anlamak zordur. Belki de bu görüşlerin birleşiminde, yapabileceğimiz programlar/makineler arasında, Tanrı’nın ruh verdiği tek bilgisayar türlerinin bazı dijital bilgisayarlar olduğunu düşünmemiz için özellikle iyi bir neden yoktur. Fakat aynı zamanda, Tanrı’nın sadece belirli dijital bilgisayar türlerine ruh vermeyi seçmesi olasılığını dışlamak için de özellikle iyi bir nedenin olmadığı oldukça açık görünüyor. Tanrı’nın, belirli dijital bilgisayar türlerine ruh verme fikrine karşı çıkmış olduğuna dair kanıt, temelde açık değildir.

2.2 Kafaları Kuma Gömme Eleştirisi

Düşünen makineler olsaydı bunun çeşitli sonuçları olurdu. İlk olarak, evrendeki her şeyden daha üstün olduğumuzu düşünmek için sahip olduğumuz en iyi nedenleri kaybederdik (çünkü el üstünde tuttuğumuz “aklımız” artık tek başımıza sahip olduğumuz bir şey olmayacaktır). İkinci olarak, makinelerin “yerimize geçebilme” olasılığı gerçek bir endişe hâline gelecekti: Düşünen makineler olsaydı büyük olasılıkla bizden çok daha iyi düşünebilen şeyler olurlardı. Üçüncü olarak, makinelerin “boyunduruğu altına girme” olasılığı da gerçek bir endişe hâline gelecekti: Düşünen makineler olsaydı evreni ele geçirmeyeceklerini, bizi köleleştirmeyeceklerini ya da yok etmeyeceklerini kim söyleyebilirdi?

Bu şekliyle burada sahip olduğumuz şey, makinelerin düşünebileceği iddiasına karşı bir argüman olmaktan ziyade, düşünen makineler olsaydı neler olabileceğine dair ortaya çıkan çeşitli korkuların ifadesidir. Düşünen makineler yapmanın gerçekten mümkün olduğuna ikna olmuş ve bu endişeleri ciddiye alan biri, düşünen makineler yapma projesinden vazgeçmek için bunların iyi nedenler olduğunu düşünebilirdi. Ancak, bu endişeleri ciddiye almak için gerçekten iyi nedenlerin olup olmadığını belirlemek, büyük bir görev olacaktır. Fakat bu yazıda bu sorunun peşinden gitmeyeceğiz.

2.3 Matematiksel Eleştiri

Bazı insanlar, matematiksel mantıkta 1930’larda Gödel’in eksiklik teoremi[2] ve Turing’in sonlanma problemi[3] sonuçlarıyla keşfedilen bazı temel sonuçların, dijital hesaplama ve akıllı düşünce hakkındaki sorular için önemli sonuçlar doğurduğunu varsaydılar. (Bu konuda örneğin, Lucas (1961) ve Penrose (1989) bakabilirsiniz; ayrıca, Polanyi’nin Turing ile bu konudaki tartışmalarından bahseden Hodges (1983: 414)’e de bakabilirsiniz.) Bu sonuçlar özünde, yeterince güçlü olan resmi bir sistem içinde ifade edilebilen fakat sistem içinde kanıtlanamayan bir gerçek ifadeler sınıfı olduğunu göstermektedir (Daha fazlası için, Stanford Encyclopedia of Philosophy’deki “Gödel’s Incomptleteness Theorems (Gödel’in eksiklik teoremi)” üzerine olan yazıya bakabilirsiniz). Böyle bir sistemin “Lucas-Penrose kısıtlamasına tabi olduğunu” çünkü sistem içinde ifade edilebilir bir gerçek ifadeler sınıfını kanıtlamaktan alıkoyulduğunu söylememiz makul olurdu.

Turing (1950: 444), matematiksel mantıktan elde edilen bu sonuçların Turing testi için çıkarımları olabileceğini gözlemlemiştir:

Herhangi bir dijital bilgisayarın yapamayacağı bazı şeyler vardır. Taklit Oyunu’nda olduğu gibi sorulara cevap vermek için programlanmışsa, dijital bilgisayara cevap verilmesi için ne kadar zaman verilirse verilsin ya yanlış cevap vereceği ya da cevap veremeyeceği bazı sorular olacaktır. (444)

Dolayısıyla Turing Testi bağlamında, “Lucas-Penrose kısıtlamasına tabi olmak”, bir “cevaplanamaz” soru sınıfının varlığını ifade eder. Bununla birlikte Turing, Turing Testi bağlamında bu “cevaplanamaz” soruların yalnızca, insanların bu soruları cevaplayabilmesi hâlinde bir endişe olduğunu belirtmiştir. Yani Turing’in bu “kısa” cevabı, insanların böyle bir kısıtlamadan kendilerinin muaf olduğunun bariz olmadığı şeklindedir. Turing, daha sonrasında, argümanın “oldukça kolay bir şekilde” reddedilebileceğini düşünmediğini eklemiştir.

Argümanı daha kesin hâle getirmek için aşağıdaki gibi formüle edebiliriz:

C, dijital bilgisayar olsun.
C, Lucas-Penrose kısıtlamasına tabi olduğundan, C için “cevaplanamaz” bir q sorusu vardır.
E olan bir varlık, Lucas-Penrose kısıtlamasına tabi değilse, o zaman E için “cevaplanamaz” soru yoktur.
İnsan zekâsı Lucas-Penrose kısıtlamasına tabi değildir.
Dolayısıyla, insan aklı için “cevaplanamaz” soru yoktur.
Dolayısıyla q sorusu, insan zekâsı ile “cevaplandırılabilirdi”.
Birisi q sorusunu sorarak, soruyu yanıtlayan şeyin bilgisayar mı yoksa insan mı olduğunu belirleyebilirdi.
Bu nedenle C, Turing Testinde başarısız olurdu.

Argüman yukarıdaki gibi ortaya konulduğunda öncül (3)’e itiraz edilmesi gerektiği netleşiyor. Bunu bir kenara koyarsak, Turing’in “kısa” cevabına karşı getirilebilecek bir yorum, (4)’deki iddianın herhangi bir kanıt olmaksızın yalnızca ileri sürüldüğü olurdu. Dolayısıyla bu “kısa” yorum bizi, insanların Lucas-Penrose kısıtlamasından muaf olup olmadığını incelemeye götürürdü.

İnsanlar Lucas-Penrose kısıtlamasına tabilerse, o zaman bu kısıtlama insanları dijital bilgisayarlardan ayırmak için herhangi bir temel sağlamazdı. Eğer insanlar Lucas-Penrose kısıtlamasından muaflarsa ve 3. öncülü doğru kabul edersek, dijital bilgisayarların Turing testinde başarısız olabileceği ve bu yüzden düşünemeyeceği sonucuna ulaşırdık.

Bununla birlikte, kısıtlamadan muaf olmanın düşünme kapasitesi için gerekli olup olmadığı konusunda bir soru işareti vardır. Buradan ulaşabilecek sonuç, Turing Testi’nin çok katı olduğu olabilirdi. Hipoteze göre Lucas-Penrose kısıtlamasından muaf olduğumuz için bazı bakımlardan, soru sorma ve cevaplama konusunda fazla iyiydik. Lucas-Penrose kısıtlamasına tabi olan bir düşünen varlık olduğunu varsayalım. Yukarıdakine benzer bir argümandan dolayı bu varlık, Turing Testi’nde başarısız olabilirdi. Dolayısıyla, düşünebilen bir varlık Turing Testinde başarısız olmuş olurdu.

Matematiksel mantıktan (Gödel, Turing vb.) elde edilen sonuçların önerdiği soruların oluşturulmasının son derece karmaşık olduğunu ve dijital bilgisayarın dili ve dâhili programlaması hakkında çok fazla ayrıntılı bilgi gerektirdiğini belirterek bu endişeye cevap verebiliriz (buradaki koşullar, Taklit Oyunu’ndaki sorgulayıcılar için sağlanmamıştır). En azından, dijital bilgisayarlar Lucas-Penrose kısıtlamasına tabi olması yönünden insanlardan ayrılsa bile Turing Testi’nin akıl ve zekânın varlığını kanıtlamak için oldukça yüksek kaliteli bir istatistiksel test olduğu görüşünü çürütmek için çok daha fazla argüman gereklidir. (Daha detaylı tartışma için Bowie 1982, Dietrich 1994, Feferman 1996, Abramson 2008 ve Stanford Encyclopedia of Philosophy’deki “Gödel’s Incomptleteness Theorems (Gödel’in eksiklik teoremi)’deki 6,3 bölümüne bakabilirsiniz.)

2.4 Bilinçlilik Argümanı

Turing, Profesör Jefferson’un 1949’daki Lister Oration’ını[4], bu alt başlıkta incelemek üzere ele aldığı türden bir eleştirinin kaynağı olarak şu şekilde aktarıyor:

Bir makine, hissedilen düşünceler ve duygular nedeniyle bir sone yazabiliyor veya bir konçerto[5] besteleyebiliyorsa ve bunu sembollerin rastgele bir şekilde bir araya gelmesiyle, yani onu tesadüfen yazmasıyla değil de aynı zamanda yazdığı şeyin ne anlama geldiğini bilerek yapabiliyorsa o zaman bu makinenin bir beyne sahip olduğu konusunda hemfikir olmaz mıydık? Hiçbir mekanizma, başarılarından zevk alamazdı (ve sadece yapay bir mekanizmayla bunu belli edemezdi), vanaları eridiği zaman acı hissetmezdi, övgülere maruz kalmasıyla sevgiyle dolmazdı, yaptığı hatalardan dolayı perişan olmazdı, seksin çekiciliğine kapılmazdı, istediğini elde edemediğinde sinirlenmez ya da depresyona girmezdi. (445/6)

Bu pasajda birlikte kullanılan ve açığa çıkarmanın faydalı olacağı birkaç farklı fikir vardır. Aynı zamanda Turing’in de ilk odaklandığı fikir, bir makinenin düşündüğünden emin olmanın tek yolunun bir makine olmak ve kendinin düşündüğünü hissetmek olduğudur. İkinci fikir şu olabilir: Zihnin varlığı belirli bir tür öz bilincin varlığını gerektirir(örneğin, sadece yazmak yeterli değildir aynı zamanda öznenin yazdığı şeyin ne anlama geldiğini de bilmesi gerekir). Üçüncü fikir ise zihne bu şekilde dar bir bakış açısıyla bakmanın, yani insan davranışının oluşumunda böylesine merkezi bir rol oynayan çeşitli duygulardan ve arzulardan ayrılmış, inanan bir zekânın olabileceğini varsaymanın bir hata olduğudur (“hiçbir mekanizma (…) hissedemezdi” örneğinde de görüldüğü gibi).

Ben merkezli (solipsizm) düşünce çizgisine karşı Turing, diğer insanların düşündüğünü varsaymak için nedenlerimiz olduğu kadar, makinelerin da düşündüğünü varsaymak için nedenlerimiz hakkında her birimiz anlaşmaya varırsa, kendisinin de tatmin olacağına dair etkili bir yanıt verir. (Burada önemli olan, Turing’in benmerkezciliğin güçlü bir seçenek olduğunu düşünmesinden ziyade, bu argümandan ulaşılacak sonucun, dijital bilgisayarların entelektüel olarak bizle eşit ya da bizden yüksek seviyede olamayacağı sonucu olmadığıdır.)

Diğer düşünce hatlarının aksine, Turing birinin bir makinenin zeki olduğuna dair sahip olabileceğini düşündüğü türden bir kanıtı göstermeyi amaçlayan küçük bir “sözlü sınav” hazırlamıştır. Eğer makineden doğru türden tepkiler alabiliyorsak, bu tepkileri doğal olarak zevk, keder, sevgi, mutsuzluk, öfke, depresyon gibi ifadelerin kanıtı olarak yorumlardık. Belki de bu türden bir makine yapmanın tek yolu (Turing bu şekilde olduğunu söylemese de), onu sensörler, duygu halleriyle vb. donatmak, yani aslında yapay bir insan yapmaktır. Fakat burada önemli olan şey şudur: Öz-bilinç, arzular, duygular vb. hakkındaki iddialar doğruysa, Turing bu iddiaları ağırbaşlılıkla kabul edebilirdi. Yani, Turing’in yeni iddiası dijital bilgi işlem “beyni” olan bir makinenin yetişkin insanların zevk alabileceği tüm zihinsel durumlara sahip olabileceği şeklinde olabilirdi.

2.5 Çeşitli Engellere Bağlı Argümanlar

Turing’e göre, bazı insanların makinelerin asla yapamayacağını iddia ettiği şeylerin listesi şu şekildedir: (1) nazik olmak, (2) becerikli olmak, (3) güzel olmak, (4) arkadaş canlısı olmak, (5) insiyatif sahibi olmak, (6) espri anlayışına sahip olmak, (7) doğruyu yanlıştan ayırabilmek, (8) hata yapmak, (9) âşık olmak, (10) çilek ve kremşantiden haz almak, (11) birini başka birine âşık etmek, (12) deneyimlerden öğrenmek, (13) kelimeleri doğru bir şekilde kullanmak, (14) kendi düşüncelerinin odak noktası olmak, (15) bir insan kadar davranış çeşitliliğine sahip olmak, (15) kendisi için gerçekten yeni olan bir şey yapmak.

Bu iddiaları doğrudan ele almadan önce sorulması gereken ilginç bir soru, evrenin başka bir yerinden gelen zeki yaratıkların zorunlu olarak bunları yapabileceklerini varsaymamız gerekip gerekmediğidir. Örneğin neden, çilek ve kremşantiden tat almayan (veya alamayan) bir varlıkta eksik bir şeylerin olması gerektiğini varsaymamız gerekiyor? Zeki bir varlığın bazı şeylerden zevk alma kapasitesine sahip olması gerektiğini varsaymak doğru olabilir, fakat zeki varlıkların sadece bizim yaptığımız şeylerden zevk alması gerektiği konusunda ısrar etmek aşırı derecede şovenist olurdu. (Benzer düşüncelerin, zeki bir varlığın illa bir insanı kendisine âşık edebilecek türden bir şey olması gerektiği iddiası için de uygulanabileceğinden şüphe yoktur. Evet, belki de zeki bir varlık sevebilecek ve sevilebilecek türden bir şey olmalıdır; ama biz insanlar hakkında bu kadar özel olan şey nedir?)

Aşırı derecede şovenist olduğunu düşündüğümüz bu iddiaları bir kenara bıraktıktan sonra, hiçbir dijital bilgi işlem makinesinin listedeki diğer şeyleri yapamayacağını varsaymak için ne gibi gerekçelerin olduğunu sormalıyız. Turing, çoğu gerekçenin çeşitli türlerdeki makinelerle geçmiş zamandaki tanışmalarımızda yattığını öne sürüyor: Şimdiye kadar karşılaştığımız makinelerin hiçbiri bunları yapamadı. Özellikle de günümüzde aşina olduğumuz dijital bilgisayarlar bunları yapamazdı. (Belki “hata yapmayı” bunun dışında bırakabiliriz çünkü dijital bilgisayarların bile fonksiyonları hata yapabilir.) Fakat en yeni dijital bilgisayarların bile depolama kapasitesi ve işlem hızındaki sınırlamaları göz önüne aldığımızda, bu tümevarımsal argümanın yararlığını değerlendirirken temkinli olmanın bariz nedenleri olduğuna ulaşırız.

Sormaya değer farklı bir soru, Turing’in listesinde bulunan türden şeyleri yapabilen makinelerin yapımında şimdiye kadar kaydedilen ilerlemeyle ilgilidir. En azından mevcut bilgisayarların listedeki bu şeylerin ne kadarını yapabileceğiyle ilgili tartışmaya yer vardır: Hata yapmak, kelimeleri doğru bir şekilde kullanmak, deneyimlerden öğrenmek, güzel olmak vb. Dahası, diğer alanlardaki son gelişmelerin bu iddia edilen engellerin üstesinden gelmede ne boyutta ilerlemeye sebep olması beklendiği konusunda da tartışmaya yer vardır. Örneğin, yapay sensörler üzerinde yaşanan son gelişmelerin, bir gün çilek ve kremşantinin tadını alabilecek makinelerin üretiminde katkısı olabilir. Tabi eğer amaçlanan itiraz, makinelerin her türlü haz duygusunu deneyimleyebileceği fikrine yönelikse, o zaman belirli türden yapay sensörler üzerinde yaşanan gelişmelerin bir anlamının olup olmadığı tartışmalıdır.

2.6 Lady Lovelace Argümanı

Düşünen makinelerin olabileceği iddiasına yapılan en popüler eleştirilerden biri, Lady Lovelace’in Babbage’ın Analitik Motoruyla ilgili incelemesinde yaptığı bir açıklamada öne sürülmüştür:

Analitik Motorun herhangi bir şey ortaya çıkarma iddiası yoktur. Sadece ona nasıl yapılacağını öğrettiğimiz şeyleri yapabilir (Hartree, sayfa 70’den alıntılanmıştır).

Temel fikir, makinelerin yalnızca onlara nasıl yapmaları gerektiğini öğrettiğimiz zaman bir şeyi yapabiliyor olmalarıdır (veya makinelerin asla gerçekten yeni olan bir şey ya da bizi şaşırtacak bir şey yapamayacağıdır). Turing’in de söylediği gibi, bu eleştirilere yanıt vermenin bir yolu, şu ana kadar hiç “gerçekten yeni” olan bir şey yapıp yapmadığımızı sormaktır. Örneğin evrenin deterministik (belirlenimci) olduğunu varsayalım, böylece yaptığımız her şey tamamen doğa yasaları ve evrenin sınır koşulları tarafından belirleniyor olurdu. Deterministik bir evrende “gerçekten yeni” olan hiçbir şeyin olmadığına dair bir anlam vardır. Tabi diğer yandan, evrenin deterministik olmasıyla içinde meydana gelen olayların bizi şaşırtması birbiriyle tamamen uyumludur. Dahası, Turing’in de söylemeye çalıştığı gibi, dijital bilgisayarların bile bizi şaşırtan şeyler yapmasının birçok yolu vardır. Bu önerinin yapısının (doğasının) tam olarak ne olduğunu netleştirmek için daha çok şey söylenmesi gerekiyor. (Evet, dijital bilgisayarların programları tarafından “kısıtlandığını” varsayabiliriz: Sahip oldukları programların izin vermediği hiçbir şeyi yapamazlar. Fakat insanlar da biyolojileri ve genetik mirasları tarafından dijital bilgisayarlarla aynı olduğu iddia edilebilecek şekilde “sınırlandırılmıştır”: Sahip oldukları biyoloji ve genetik mirasın izin vermediği hiçbir şeyi yapamazlar. Eğer bir program yeterince karmaşık ve onu çalıştıran işlemciler yeterince hızlıysa bu durumda geriye kalan “kısıtlama” türlerinin biyoloji ve genetik miras tarafından dayatılan türden kısıtlamalardan zorunlu olarak farklı olup olmayacağını söylemek kolay değildir.)

Bringsjord ve diğerleri (2001), Turing’in Lovelace Eleştirisine cevabının en iyi ihtimalle “gizemli” ve en kötü ihtimalle “yetersiz” olduğunu iddia etmiştir (sayfa 4). Bu kişilere göre Turing’in “bilgisayarlar bizi şaşırtıyor” iddiası yalnızca “sürpriz” kavramına çok yüzeysel bir yorum yapıldığında doğrudur. Çünkü bilgisayarların yapmalarını istemediğimiz şeyleri yaptıkları doğru olsa da (ki bunlar yeterince akıllı ve dikkatli olmadığımız için veya nadir görünen donanım hataları yüzünden ya da farklı bir sebepten kaynaklanır), bir bilgisayarın bir şeyi ortaya çıkardığını söylemeyi gerektirecek herhangi bir durum söz konusu değildir. Bu eleştirinin haklılığı hakkında ne düşünülürse düşünülsün bir şeyler ortaya çıkarmaktan bahsediyorsak şunu belirtmeliyiz: İnsanlar az ya da çok sohbet ettikleri her durumda “bir şeyler ortaya çıkarıyordur”. Yani, bulundukları koşullarda üretmeleri için uygun olan yeni doğal dil cümleleri üretiyorlardır. Öyleyse bir taraftan, Bringsjord ve diğerlerinin de iddia ettiği gibi Turing Testi, “ortaya çıkarmanın” (veya “yaratıcılığın” ya da her neyse) varlığı için mükemmel bir testtir. Diğer bir taraftan ise Bringsjord ve diğerlerinin tüm bunlar için iddia ettikleri gibi, bir dijital bilgi işlem cihazının bu anlamda “ortaya çıkarma” yeteneğine sahip olup olmadığı (yani bilgisayarların içinde buldukları koşullara uygun olan yeni cümleler üretebilip üretemeyeceği) açık bir soru olarak kalır. Bu nedenle, Turing’in Lovelace Eleştirisine cevabı güçlü olmamıştır ve bu noktada tatmin edici bir yanıt verecek kaynaklardan yoksun olduğunu düşünme eğiliminde değiliz.

2.7 Sinir Sistemindeki Süreklilik Argümanı

İnsan beyni ve sinir sistemi dijital bir bilgisayara pek benzemez. Özellikle de, beynin ayrı bir durum makinesi olduğu iddiasına şüpheyle yaklaşmak için nedenler vardır. Turing, bir nöronun harekete geçmesini tetikleyen bir sinirsel tepkinin boyutu hakkındaki bilgilerdeki küçük bir hatanın, ortaya çıkan tepki boyutunda büyük bir fark yaratabileceğini gözlemlemiştir. Böylece, beynin muhtemelen sürekli bir durum makinesi olduğu sonucuna varmıştır. Ve ardından da ayrı durum makineleri sürekli durum makineleri olmadığından dolayı hiçbir ayrık durum makinesinin bir zekâya sahip olamayacağını düşünmek için nedenlerin olabileceğini belirtmiştir.

Turing’in bu tür bir argümana cevabının, bir sürekli durum makinesinin, çok küçük hata seviyelerine sahip ayrık durum makineleri tarafından taklit edilebileceği olduğu görünüyor. Tıpkı diferansiyel çözümleyicilerin dijital bilgisayarlar tarafından oldukça küçük hata paylarıyla birlikte taklit edilebilmesi gibi, insanların konuşmaları da dijital bilgisayarlar tarafından Taklit Oyununu oynayan sıradan sorgulayan kişiler tarafından tespit edilemeyecek düzeyde hata paylarıyla birlikte taklit edilebilir. Bu yanıtın, Turing’in bu noktada vermesi gereken türden doğru bir yanıt olup olmadığı bariz değildir. Eğer biri gerçek düşüncenin (veya zekânın, zihnin ya da herhangi bir şeyin) yalnızca sürekli durumlu bir makinede bulunabileceğini düşünüyorsa ayrık durum makinelerinin Turing Testi’ni geçmesinin mümkün olması gerçeği (eğer bu bir gerçekse), sadece Turing Testi’nin iyi bir test olmadığını gösterirdi. Bu argümana daha iyi bir cevapsa gerçek düşüncenin ya da diğer şeylerin yalnızca sürekli durum makinelerinde bulunabileceğinden neden bu kadar emin olmamız gerektiğini sormaktır (eğer ayrık durum makineleri olmadığımızı varsaymak gerçekten de doğruysa tabii). Bu yüzden bu soruyu sormadan önce, düşünme yeteneğimiz açısından özünde ayrık durum makineleri olmadığımızı varsayacak kadar iyi bir nedenimizin olup olmadığını değerlendirmemiz iyi olacaktır. (Block’un (1981) işaret ettiği gibi, zekâ kavramımızda nicelleştirilmiş algılayıcı aygıtlara sahip zeki varlıkları ya da dijital çalışan parçalara sahip zeki varlıkları dışlayan hiçbir şey yokmuş gibi görünüyor.)

2.8 Davranışların Teklifsizliği Argümanı

Bu argüman, bir kişinin her olası koşulda ne yapması gerektiğini açıklayan hiçbir kurallar dizesi olmadığı fakat bir makinenin her olası koşulda ne yapacağını açıklayan kurallar dizesi olduğu varsayımına dayanmaktadır. Bu iki varsayımdan bir şekilde insanların makine olmadığı sonucuna varılması gerekiyordu. Turing’in belirttiği gibi, argümanın bu formülasyonunda “yapması gerektiği (ought)” ve “yapacağı (will)” arasında biraz fark vardır. Fakat uygun düzeltmeleri (ayarlamaları) yaptığımızda, insanlar ve dijital bilgisayarlar arasında bariz bir farkın ortaya çıktığı belli değildir.

Öncelikle, bir kişinin ve makinenin her olası koşulda ne “yapacağını” açıklayan kurallar dizesi olup olmadığı sorusuna odaklandığımızı varsayalım. Dünya deterministik ise hem insanlar hem de makineler için bu tür kurallar vardır (bu kuralların ne olduğunu yazmak mümkün olmasa bile). Dünya deterministik değilse ne insanlar ne de makineler için bu tür kurallar yoktur (çünkü hem insanlar hem de makineler davranışlarının oluşumunda deterministik olmayan süreçlere tabi olabilirler). Her iki durumda da insanlar ve makineler arasında olası her koşulda ne yapacaklarının açıklamasına dayanan konuyla ilişkin bir fark olduğunu varsaymak için herhangi bir neden görmek zordur. (Eleştirinin belki de bizi böyle bir fark olduğunu varsaymaya davet ettiği söylenebilir. Dünya deterministik olmasa bile makinelerin işlemcileri tamamen deterministik olduğu için insanların dijital makinelerden ayrıldığı söylenebilir. Fakat dünya deterministik değilse dijital makinelerin dünyanın deterministik olmayan özelliklerinin girdilerine erişmelerine izin vererek deterministik olmayan şekilde davranacakları bir şekilde programlanmamaları için hiçbir neden yoktur.)

Şimdi de bir kişinin ve makinenin her olası koşulda ne “yapması gerektiğini” açıklayan kurallar dizesi olup olmadığı sorusuna odaklandığımızı düşünelim. Normların kodlanabilip kodlanamadığı hakkında ne varsaydığımızdan bağımsız olarak (aynı zamanda hangi tür normların söz konusu olduğu sorusundan tamamen ayrı olarak) makinelerin, davranışları normlar ile açıklanabilecek türden şeyler olmadığı şeklindeki bir kabulden çıkarımda bulunmamız dışında bu kanı için hangi gerekçelere sahip olabileceğimizi söylemek zordur. (Ve bu durumda buradaki asıl argüman kaçırılmış olur; bu durumunun iddiası şudur: Bir kişinin her olası koşulda ne “yapması gerektiğini” açıklayan kurallar dizesi varken, bir makinenin her olası koşulda ne “yapması gerektiğini” açıklayan hiçbir kurallar dizesi yoktur!)

2.9 Duyu Ötesi Algı Argümanı

Turing’in makalesinin en tuhaf kısmı Duyu Ötesi Algıyla ilgili olan birkaç paragraftır. Belki alaylı bir şekilde ele alınması amaçlanmıştır fakat eğer öyleyse bu gerçek, Turing tarafından yeterince gösterilmemiştir. Belki de bunun yerine Turing, J.B. Ren’in görünüşte bilimsel olarak saygın sonuçlarından gerçekten de etkilenmiştir. Her neyse, Turing’in buradaki argümanını değerlendirmeye geri dönersek Turing, telepati için çok güçlü deneysel kanıtlar olduğunu düşünmüş gibi görünüyor (aynı zamanda, durugörüyü[6], prekognisyonu[7] ve telekineziyi de ciddiye almaya hazırdı). Dahası, oyundaki insan katılımcının telepatik olması durumunda sorgulayan kişinin makinenin kimliğini belirlemek için bu gerçeği kullanabileceğini düşünmüş gibi görünüyor: Turing, bu zorluğu önlemek için yarışmacıların “telepati işlemez bir odada” bulundurulmasını önermektedir. Telepati, durugörü, prekognisyon ve telekinezi için şu anda herhangi bir istatistiksel dayanak bulunmadığı gerçeğini bir kenara bırakırsak telepatinin doğasına ilişkin ne tür bir teorinin Turing’e çekici geldiği sormaya değerdir. Sonuçta, eğer insanlar telepatik olabiliyorsa dijital bilgisayarlar neden olmasın? Eğer telepati yapabilmek için gerekli olan kapasite, insan konuşmasını gerçekleştirebilen yeterince gelişmiş herhangi bir sistemin standart bir özelliğiyse dijital bilgisayarların bu bakımdan da insanlara eşit olamamasının prensipte hiçbir geçerli nedeni yoktur. (Belki de bu yanıt, Taklit Oyunu’ndaki başarılı bir makine katılımcısının sensör ya da vb. şeylerle donatılması gerektiğini varsayıyordur. Fakat daha önce de belirttiğim gibi, Turing’in bu varsayımı çok da dikkate alınan bir şey değildir. Makul bir analizci, dünyada neyin olup bittiğini takip etmelidir.)

Şu ana kadar bahsettiğimiz dokuz eleştiriyi tartıştıktan sonra Turing, “görüşlerimi olumlu nitelikte destekleyecek yeterince ikna edici bir argüman yoktur. Eğer olsaydı karşıt görüşlerdeki yanlışlıkları belirtmek için bu kadar zahmete girmezdim” demiştir (454). Turing’in öz değerlendirme yaparken biraz mütevazı davrandığı söylenebilir. Her şeyden önce (solipsizm hakkındaki kısa tartışmasının da netleştirdiği gibi), diğer insanlara zekâ (düşünce, zihin) atfetmek için hangi gerekçelere sahip olduğumuz sormaya değer bir sorudur. Niteliklerimizi davranışsal testlerde veya davranış kriterlerinde temellendirdiğimizi varsaymak mantıklıysa Turing Testi durumunda makinelere uygulanacak uygun test hakkındaki iddiası ve dijital bilgi işlem makinelerinin testi geçebileceğine yönelik deneysel varsayımı (bu ikinci varsayım tartışmalı olsa da) mantıklı görünüyor. İkinci olarak, zihin felsefesinde bu testten sonraki zamanlarda meydana gelen gelişmeler (ve özellikle de işlevselci zihin kuramlarının biçimlendirilmesi), düşünen makinelerin olasılığı hakkında spekülasyonlara yer vermek için daha güvenli bir teorik ortam sağladı. Eğer zihinsel durumlar fonksiyonel durumlarsa (ve zihinsel durumlar çeşit çeşit materyal türünde ortaya çıkabiliyorsa) o zaman zihinlerin, dijital hesaplama makinelerde ortaya çıkıp çıkamayacağının deneysel bir soru olduğunu düşünmek için bazı nedenlerimiz olur. Ancak elbette bu tür bir öneriye itiraz edilebilir; yazının geri kalan bölümlerinde bazı önemli felsefi eleştirileri inceleyeceğiz.

3. Ortaya Çıkan Küçük Sorunlar

Turing’in (1950) çeşitli bölümlerinin yorumlanmasıyla bağlantılı olarak ortaya çıkan ve şimdiye kadar tartışmayı ihmal ettiğimiz çok sayıda tartışmalı konu vardır. Bu yazının ilk iki bölümünde söylenenler, Turing’in ne söylemesi gerektiğine ilişkin yorumumuza denk geliyor (belki Turing’in açıklamalarının oldukça kolay bir şekilde geliştirilebildiği durumlarda, daha ilgili değerlendirmeler olarak kabul ettiğimiz şeylerle desteklenmiştir). Fakat Turing’in orijinal yorumlarının bazıları hâlâ tartışmaya açık olduğundan dolayı tartışmanın ana noktalarının nerede olduğuna dikkat çekmek muhtemelen önemli olaacktır.

3.1 Taklit Oyunu’nu Yorumlama

Turing (1950), katılımcıların bir erkek, bir kadın ve bir insan sorgulayıcı olduğu bir oyunu açıklayarak Taklit Oyunu’nu tanıtmaktadır. Sorgulayan kişi diğer iki kişiden ayrı bir odadadır ve diğer ikisinden hangisinin erkek hangisinin kadın olduğunu belirlemekle görevlendirilmiştir. Kadın ve erkekse sorgulayıcıyı kendilerinin kadın olduğuna ikna etmeye çalışmakla görevlidir. Turing, kadın için en iyi stratejinin tüm soruları doğru bir şekilde yanıtlamak olduğunu; erkek için de en iyi stratejinin elbette biraz yalan söylemeyi gerektirdiğini önermiştir. Bu oyundaki katılımcılar ayrıca birbirleriyle iletişim kurarken ses tonu, vb. şeylerden elde edilebilecek ipuçlarından kaçınmak için teleprinter kullanacaktır. Sonrasında Turing şöyle devam eder:

Bu oyundaki A kişisinin rolünü bir makine ile değiştirirsek ne olurdu? Sorgulayan kişi, oyun bir erkekle bir kadın arasında oynandığında yaptığı gibi kimliği doğru bir şekilde belirlerken sık sık yanlış kararlar verir miydi? (434).

Bu noktada Turing’in oyunun yeni şekliyle ilgili söylemeye çalıştığı şeyi, bilgisayarın bir kadın gibi davranması gerektiği ve oyundaki diğer katılımcının kadın olduğu bir oyun olduğu şeklinde yorumlamak mümkündür. (Örneğin, Genova (1994) ve Traiger (2000)a bakabilirsiniz.) Turing’in oyunun yeni şekliyle ilgili söylemeye çalıştığı şeyi ayrıca bilgisayarın bir kadın gibi davranması gerektiği ve oyundaki diğer katılımcının da kadın gibi davranması gereken bir erkek olduğu bir oyun şeklinde yorumlamak da mümkündür. Fakat Copeland (2000), Piccinini (2000) ve Moor’un (2001) ikna edici bir şekilde iddia ettikleri gibi, Turing’in makalesinin geri kalanından ve Turing’in bu makaleyi yazdığı zamanlarda yazdığı diğer makalelerdeki materyallerden Turing’in aslında yukarıda verdiğimiz standart yorumu, yani bilgisayarın bir insan gibi davranması gerektiği ve oyundaki diğer katılımcının cinsiyeti belirlenmemiş bir insan olduğu yorumunu, amaçladığına dair kuvvetli bir inancımız var. Ayrıca Moor’un (2001) öne sürdüğü gibi, bilgisayarın kadın gibi davranması gerektiği ve oyundaki diğer katılımcının da kadın gibi davranması gereken bir erkek olduğu durumda ortada daha iyi bir testin olduğunu düşünmek için hiçbir neden yoktur (Hatta tam tersine diğerinden kötü bir test olacağını düşünmek için iyi nedenler vardır). Belki de bilgisayarın bir kadın gibi davranması gerekmesi ve diğer katılımcının bir kadın olması testin etkililiğinde bir farka neden olmayacaktır (en azından, bilgisayarın bir muhasebeci gibi davranmasının gerektiği ve diğer katılımcının da bir muhasebeci olduğu durumun neden olacağı farktan daha fazlasına neden olmazdı). Fakat bu değerlendirme, Turing (1950) tartışmamızın başında verdiğimiz Taklit Oyunu’nun standart yorumunu destekleyen güçlü metinsel kanıtları gölgede bırakmak için yetersizdir.

3.2 Turing’in Tahminleri

Daha önce de belirttiğimiz gibi Turing (1950) şöyle bir iddiada bulunmuştur:

Yaklaşık elli yıl içerisinde, hemen hemen programlama kapasitesine sahip bilgisayarlar programlamanın ve bu bilgisayarların bu oyunu çok iyi oynamasının mümkün olacağına inanıyorum. Böyle bir oyunda ortalama bir sorgulayıcının, beş dakikalık bir sorgulamadan sonra doğru kimlik belirleme şansı yüzde 70’den fazla olmayacaktır. … 19. yüzyılın sonunda, kelimelerin kullanım şeklinin ve bilgili kişilerin genel kanısının o kadar çok değişeceğine inanıyorum ki birisi, herhangi bir çelişkiye sebep olacağını düşünmeden düşünen makinelerden bahsedebilecektir.

Çoğu analizci Turing’in bu iddiasının yanlış olduğunun gösterildiğini savunuyor: 2000 yılında, ortalama bir sorgulayıcı kişinin beş dakikalık bir sorgulamadan sonra doğru kimlik belirlemesi şansının yüzde 70’den fazla olmayacağı kadar Taklit Oyunu’nu iyi oynayan bir bilgisayar programlanmamıştır. Copeland’sa (2000) bu karşı iddianın ciddi şekilde yanlış olduğunu savunmuştur: “yaklaşık elli yıl” ifadesinin anlamı asla “tam olarak elli yıl” değildir ve yakın zamanda gerekli olan programlamayı yapabilmeye izin verir. Buna karşı, Turing (1950) konuyla bağlantılı olayların “yüzyılın sonunda” nasıl bir hâle geleceğine atıfta bulunmaya devam etmiştir, yani burada “yaklaşık olarak” nitelendirmesi biçiminde çok fazla şey göremiyoruz. Bununla birlikte, Copeland’ın (2000) işaret ettiği gibi, Turing’in daha dikkatli bir şekilde yaptığı başka tahminler de vardır (örneğin, bir makinenin testin gevşetilmemiş bir versiyonunu geçmesinin “en azından 100 yıl” süreceği gibi). Turing’in (1950) doğruluğu kanıtlanmış gibi görünen başka tahminleri de vardır. Örneğin, 2000 yılındaki bilgili görüşün birçok çevrede, herhangi bir çelişkiye sebep olacağını düşünmeden makinelerin düşünme ve öğrenme olasılığından bahsedebilecek ölçüde değiştiğini iddia etmek makuldur. Moor’un (2001) işaret ettiği gibi “makine zekâsı”, Turing bu konular hakkında ilk kez düşünmeye başladığında olduğu gibi birlikte düşünülemeyecek iki kavramın bir araya gelmesi değildir.

3.3 Yararlı Bir Ayrım

Turing Testi ile ilgili birçok tartışmada birlikte incelenen fakat birbirinden ayırmanın bazı durumlarda avantajlı olabileceği iki farklı teorik iddia vardır. Bu iddialardan birisi, Turing’in Taklit Oyunu’nda verilen genel şemanın zekânın varlığı için iyi bir test sağladığını savunur (Yeterince zorlu test koşulları altında kendini bir insan olarak gösterebilen bir şeyin zeki olduğunu varsaymak için çok iyi nedenlerimiz vardır). Diğer iddiaysa uygun bir şekilde programlanmış bir bilgisayarın ilk iddiada açıklanan türde bir testi geçebileceğini savunmaktadır. İlk iddiaya “Turing Testi İddiası” ve ikinci iddiaya da “Düşünen Makine İddiası” diyelim. Turing’de (1950) öne sürülen iddialara yapılan bazı eleştiriler Düşünen Makine İddiasına getirilebiliyorken Turing Testi İddiasına getirilemiyor. (Örneğin, Bölüm 6’da daha detaylı bir şekilde tartışacağımız Searle (1982) argümanı buna bir örnektir.) Fakat geri kalan eleştiriler Turing Testi İddiasına getirilen eleştirilerdir. Bölüm 6’ya gelene kadar Turing Testi İddiasıyla ilgili tartışmalarla odaklanacağız.

3.4 Ek Bir Not

Bu makalede, “zekâ” derken “en azından bir zekâdan” bahseden standart felsefi geleneği takip ediyoruz. “Turing Testi’ni geçmek” zekânın olduğu anlamına geliyorsa, “Turing Testi’ni geçmek” aynı zamanda en az bir zekânın var olduğu anlamına da gelir. Son zamanlarda yükselen “sürü zekâsı”, “kolektif zekâ” ve benzeri tartışmaları bu makalede inceleyemeyiz. Fakat her iki bileşenin de zekâsına sahip olan bir “kolektif zekâ” olduğunu söylemeye istekli olmadığımız durumlarda, konuşmayı gerçekleştirecek olan iki kişinin de “Turing Testi’ni geçebileceği” açıktır.

4. Turing Testi’nin Mevcut Durumunun Değerlendirilmesi

Turing Testi ifadesinin literatürdeki farklı yorumları arasında yaptığımız ilk ayrım göz önüne alındığında, Turing Testi’nin mevcut durumunun değerlendirilmesi sorusuna farklı bakış açılarına bölerek yaklaşmak muhtemelen en iyisidir. Turing (1950) tarafından önerilen testin tam olarak hangi test olduğuna dair doğru bir açıklamanın olduğu gayet doğrudur, fakat Turing Testi’nin mevcut durumu hakkında eksiksiz bir tartışma, Turing tarafından yanlış bir şekilde önerildiği varsayılan diğer testlerin mevcut durumuna da en azından biraz dikkat etmelidir.

İncelenmesi gereken birkaç ana fikir vardır. Bunlardan ilki, Turing Testi’nin zekânın atfedilmesi için mantıksal olarak gerekli ve yeterli koşulları sağladığı iddiasıdır. İkincisi, Turing Testi’nin zekânın tanımlanması için mantıksal olarak sadece yeterli koşul sağladığı iddiasıdır (yani mantıksal olarak gerekli koşulu sağlamıyor). Üçüncüsü, Turing Testi’nin zekânın tanımlanması için “ölçütler (çürütülebilir yeterli koşullar)” sağladığı iddiasıdır. Dördüncüsü ve belki de önceki iddialardan önemli ölçüde farklı olmayan son iddiaysa Turing Testi’nin zekânın tanımlanması için (az ya da çok güçlü) olasılıksal destek sağladığıdır. Bu iddiaların her birini sırayla inceleyeceğiz.

4.1 Mantıksal Olarak Gerekli ve Yeterli Koşullar

Turing Testi’nin zekânın tanımlanması için hem mantıksal olarak gerekli hem de yeterli koşulları sağladığını açıkça iddia eden kişilerin sayısının çok fazla olduğu şüphelidir (Block (1981) bu kişilerden biri olabilir belki). Fakat Turing Testi’ne karşı ileri sürülen bazı eleştiriler yalnızca Turing Testi’nin zekânın tanımlanması için mantıksal olarak hem gerekli hem de yeterli koşulları sağladığı varsayımı altında geçerlidir. Ve Turing Testi’ne karşı ileri sürülen eleştirilerin pek çoğu yalnızca, Turing Testi’nin zekânın atfedilmesi için gerekli ve yeterli koşulları sağladığı varsayımı altında geçerlidir (Buradaki söz konusu modalite, kesin bir şekilde mantıksal olandan daha zayıftır. Örneğin, alışılmış (nomic) ya da nedensel olandan).

Örneğin, Turing Testi’nin şovenist olduğunu iddia eden insanları ve özellikle de hatırı sayılır bir zekâya sahip olan ve yine de Turing Testi’ni geçemeyen bir şeyin olmasının mantıken kesinlikle mümkün olduğunu iddia eden insanları düşünelim. (Örneğin, zeki varlıklar Turing Testi’ni geçemeyebilirler çünkü bizle aynı yaşam tarzını paylaşmazlar. Ya da zeki varlıklar Turing Testi’ni geçemeyebilirler çünkü Taklit Oyunu’na katılmayı reddederler. Veya zeki varlıklar Turing Testi’ni geçemeyebilirler çünkü konuştukları dilleri yöneten pragmatik kurallar, insan dillerini yöneten pragmatik kurallardan çok farklıdır, vb.) Turing Testi zekânın tanımlanması için gerekli koşulları sağladığı sürece bunların hiçbiri Turing Testi’ne karşı bir eleştiri oluşturamaz.

French (1990), “Turing Testi’nin zekânın değil, kültürel odaklı zekânın garantisini sağladığını” göstermeyi amaçlayan oldukça yaratıcı argümanlar sunmuştur. Fakat elbette, kültürel odaklı zekâya sahip olan herhangi bir şeyin zekâsı da vardır. Bu yüzden French’in eleştirisi direkt olarak Turing Testi’nin zekânın tanımlanması için yeterli koşulları sağladığı fikrine yönelik olarak değerlendirilemez. Aksine, daha sonra göreceğimiz gibi, French, Turing Testi’nin hiçbir makinenin asla karşılayamayacağı yeterli koşulları sağladığını varsaymıştır. Yani, French’e göre Turing Testi’nin yanlış olan kısmı, zekânın tanımlanması için hiç ilginç olmayan yeterli koşulları oluşturmasıdır.

4.2 Mantıksal Olarak Yeterli Koşullar

Turing Testi’nin zekânın tanımlanması için mantıksal olarak yeterli koşulları sağlamayı amaçladığını düşünen birçok filozof vardır. Yani Turing Testi’nin, zekâya sahip olmayan bir şeyin bu testi geçmesinin mantıksal olarak imkânsız olduğu iddiasında olduğunu düşünen birçok filozof vardır. (Bu varsayım çoğu zaman, Turing Testi’ni geçmenin çok şey gerektirdiğine dair bir açıklamayla gerekçelendirilir. Örnek olarak, tüm yaşam boyunca insan davranışından ayırt edilemeyen davranışlar üretmek verilebilir.)

Turing Testi’ni veya herhangi bir tamamen davranışsal testi geçmenin zekânın tanımlanması için mantıksal olarak yeterli koşullar sağladığı iddiasına karşı iyi bilinen argümanlar vardır. Zekânın (aklın, düşüncenin) bu tür analizine yönelik getirilen standart eleştiri, davranışı “bilek gücü”yle üretilen bir varlığın zeki (bir zihne sahip ve düşüncelere sahip) sayılmaması gerektiğidir.

Örneğin, Ned Block’un “BlackHead”ini düşünelim. Blockhead, tıpkı bir insan gibi görünen fakat “yaşam oyununu dönüştüren bir ağaç” tarafından, yani canlının hayatının her aşamasında ayırt edilebilir her girdi için programlanmış bir yanıt içeren bir ağaç tarafından kontrol edilmektedir. Blockhead’in mantıksal olarak mümkün olduğunu ve belli bir zekâya (akla, düşünceye) sahip olmadığını kabul ediyorsak, Blockhead, Turing Testi’nin zekânın tanımlanması için mantıksal olarak yeterli bir koşul sağladığı iddiasına karşı bir örnek hâline gelir. Sonuçta Blockhead, hayatınız boyunca vereceğiniz yanıtlarla aynı yanıtları üreten bir dönüştüren ağaçla size verilen girdilerle aynı girdiler verilerek programlanabilirdi.

Turing Testi’nin zekânın tanımlanması için mantıksal olarak yeterli koşullar sunduğunu iddia eden birinin Block’un argümanına yanıt vermesinin belki de yalnızca iki yolu vardır. İlk olarak, Blockhead’in mantıksal olarak mümkün olduğu reddedilebilir. İkinci olarak, Blockhead’in zeki olduğunu (bir zihne sahip olduğu, düşündüğü) iddia edilebilir.

Blockhead’in mantıksal olarak mümkün olduğunu reddetmek için kavranabilirlik ve mantıksal olasılık arasındaki yaygın olarak kabul edilen bağlantının reddedilmesi gerekiyor gibi görünüyor. Blockhead’in düşünülebilir olduğu barizdir. Bu nedenle, mantıksal olasılık için kavranabilirlik (uygun bir şekilde sınırlandırılmış) yeterliyse Blockhead’in mantıksal olarak mümkün (olası) olduğunu kabul etmek için iyi bir nedenimiz var gibi görünüyor. Bu problemi detaylıca incelemek bizi konuyla ilgili şu anki endişelerimizden çok uzaklaştıracağından, mantıksal olasılık için kavranabilirliğin (uygun şekilde sınırlandırılmış) yeterli olup olmadığını tartışmalı bir soru olarak bırakıp kaldığımız yerden devam edelim (Bu problemle ilgili daha detaylı tartışma için Crooke (2002)’ye bakabilirsiniz).

Blockhead’in zekâya (akla, düşünceye) sahip olup olmadığı sorusu basit görünebilir fakat Block’un, Blockhead’in “bir ekmek kızartma makinesinin tüm zekâsına sahip olduğu” şeklindeki kendinden emin iddiasına rağmen, Blockhead’in zeki olduğunu neden reddetmemiz gerektiği açık değildir. Blockhead, özellikle verimli olan bir bilgi işlemcisi olmasa bile sonuçta bir bilgi işlemcisidir ve bunu, bilgiyi işlemesinin bir sonucu olarak üretilen davranışla birleştirirsek, Blockhead’e belirli bir zekâ düzeyinin tanımlanması için yeterli bir gerekçeye sahip olabiliriz. (Blockhead argümanıyla ilgili daha detaylı olan önemli tartışmalar için Block (1981), McDermott (2014) ve Pautz ve Stojlar (2019)’a bakabilirsiniz.)

4.3 Ölçütler

Wittgenstein, ünlü eseri olan “Felsefi Soruşturmalarda” şöyle söylemiştir:

“Bir ‘iç süreç’ dışa dönük ölçütlere ihtiyaç duyar” (580).

Wittgenstein’ın bu sözle tam olarak ne kastettiği belirsizdir fakat yorumlanabileceği yollardan biri şöyle olabilir: Bir varlığa bir “zihinsel durum” atfetmenin gerekçelendirilmesi için, o varlığın gözlemlenebilir davranışı hakkında, (belki) “zihinsel” kelime dağarcığında ifade edilemeyen o varlık hakkındaki diğer gerçek iddialarla birlikte, o varlığın söz konusu zihinsel duruma sahip olmasına sebep olan bazı doğru iddialar bulunmalıdır. Varlığın gözlemlenebilir davranışına ilişkin gerçek iddiaların, söz konusu zihinsel durumun varlığa atfedilmesinin gerekçelendirilmesinde hiçbir rolü yoksa varlığa bu tür bir zihinsel durum atfetmek için hiçbir gerekçe yoktur.

Bir varlığa zihinsel bir durum atfetmenin gerekçelendirilmesi için o varlığın tek başına gözlemlenebilir (yani, o varlık hakkında başka bir doğru iddia eklemeden) davranışıyla ilgili bazı doğru iddiaların olması gerektiği iddiası, varlığın söz konusu zihinsel duruma sahip olmasını gerektirir ve bu, felsefi davranışçılığın bir parçasıdır. Şu ana kadar tartıştığımız noktalardan, Wittgenstein’ın felsefi bir davranışçı olduğunu ya da Turing’in felsefi bir davranışçı olduğunu anlayabiliriz. Fakat bir önceki paragrafta verilen son açıklamaya dönersek Turing Testi’nin zekânın (zihnin, düşüncenin) tanımlanması için bir ölçüt olduğu iddiasından şu sonuca ulaşabiliriz: (zihinsel kelime dağarcığında ifade edilemeyen) başka doğru iddialar, bir varlığın Turing Testi’ni geçtiği iddiasıyla birleştiğinde söz konusu varlığın zekâya (zihne, düşünceye) sahip olduğunu anlayabiliriz.

(Fazladan olan doğru iddiaların zihinsel kelime dağarcığı açısından ifade edilemeyeceğine dair parantez içindeki nitelendirmenin, testi önemsizleştirme tehdidinden kaçınmak için başvurulan bir yol olduğuna dikkat edelim. Buradaki zorluk, bir varlığın bir zihne sahip olduğuna dair doğru iddianın bu diğer iddialara eklenmesi sonucunda bu iddialar dizesindeki diğer iddialar ne olursa olsunlar, her zaman o varlığın bir zihne sahip olmasına sebep olan bir dizi iddia üretmesidir.)

Turing Testi’nin zekânın tanımlanması için sadece bir ölçüt olduğu iddiasının, Turing Testi’nin zekânın tanımlanması için mantıksal olarak yeterli koşullar sağladığına dair mantıksal davranışçı iddiasından ne kadar farklı olduğunu görmek için Turing Testindeki programlardan birinin “el simülasyonu” olmasının alışılmış olarak (nomically) mümkün olup olmadığı sorusunu düşünmek yeterlidir. Birçok insan Blockhead’in normal (veya fiziksel) bir olasılık olduğunu reddetmek için iyi bir neden olduğunu varsaydı.

Örneğin, The Physics of Immortality’de (Ölümsüzlüğün Fiziği) Frank Tipler, bir Turing-Testi geçme programını “elle simüle etmenin” fiziksel olarak imkânsız olduğu iddiasını savunmak için aşağıdaki argümanı vermiştir:

İnsan beyninin 10 (üzeri 15) bit kadar kodlayabildiğine dair önceki tahminim doğruysa, o zaman ortalama bir kitap yaklaşık 10 (üzeri 6) bit kodlayabildiğine göre… insan beynini kodlamak için 100 milyondan fazla kitap gerekirdi. Bu kadar fazla kitabı bir araya getirmek için en az otuz beş katlı bir ana üniversite kütüphanesine ihtiyaç olurdu. Bilimsel alanda yapılan deneylerden, beynimizdeki herhangi bir belleğe yaklaşık 100 saniye içerisinde erişim sağlayabileceğimizi biliyoruz. Dolayısıyla, Turing Testi geçen bir programın el simülasyonu, bir insanın bu 100 milyon kitabın tamamını 100 saniyede raftan alabilmesini, hepsine göz atabilmesini ve ardından tekrardan rafa geri koymasını gerektirirdi. Her kitap yaklaşık olarak 0,5 kilogramsa ve kişi kitabı raftan alıp göz attıktan sonra geri koyma sürecinde ortalama olarak 1 metre hareket ediyorsa, sadece kitapları hareket ettirirken 100 saniye içerisinde tüketilen enerji 3 X 10 (üzeri 19) joule ve enerji tüketim oranı 3 X 11 (üzeri 11) megavattır. Bir insan enerjiyi normal olan 100 watt oranında kullandığından bunun için gereken güç 3X10 (üzeri 15) insanın bedensel gücüdür; yani, tüm dünyadaki mevcut nüfusun yaklaşık bir milyon katına denktir. Tipik bir büyük nükleer enerji santrali 1.000 megawatt’lık bir güç çıkışına sahiptir, bu nedenle insan programının el simülasyonu, 300 milyon büyük nükleer santralinkine eşit bir güç çıkışı gerektirir. Bunlardan da anlayacağımız gibi, bir kişinin Turing Testi geçen bir el simülasyonu programlaması olasılığı, Ay’a sıçraması olasılığından daha yüksek değildir. Hatta daha bile azdır. (40)

Tipler’in argümanının ayrıntılarının geliştirilebileceği yollar olsa da genel nokta açıkça doğru görünüyor: Bir insanın dönüştürücü ağaç için gerekli olan kombinasyonel patlama türü, fiziksel dünyanın işleyişini yöneten yasalar ve sınır koşulları tarafından dışlanırdı. Fakat eğer bu doğruysa Blockhead’in mantıksal olarak mümkün olduğu doğru olsa bile nominal ya da fiziksel bir olasılık olmadığı sonucuna ulaşırız Yani, Turing Testi’nin gerçekten de zekânın tanımlanması için nominal olarak yeterli koşulları sağladığını savunmak doğal olurdu. İçinde yaşadığımız evren hakkında hâlihazırda bildiğimiz her şey düşünüldüğünde (hiçbir şey olmasa bile en azından kendimizi bildiğimizi kabul edebiliriz burada), Turing Testi’ni geçmeyi başaran herhangi bir şeyin gerçekten de zeki olduğu (bir zihne ya da benzeri şeylere sahip olduğu) sonucuna varmakta tamamen gerekçelendirilmiş olurduk.

Önceki paragrafta verilen argümana karşı savunulabilecek bazı noktalar vardır. En azından, az önce verdiğimiz argümanda ciddi bir boşluk olduğunu belirtmekte fayda var. Zekânın “el simülasyonu” olasılığını ortadan kaldırsak bile bu, diğer türlerdeki tüm saf zekâ simülasyonlarının gerçekleşme olasılığını ortadan kaldırdığımız anlamına gelmezdi. Şimdiye kadar iddia edilen şeylerin hepsini göz önüne alırsak belki de saf zekâ simülasyonları üretmenin nominal olarak olası yolları vardır. Fakat eğer bu doğruysa Turing Testi’ni geçmek zekâ sahibi olmak için çok da önemli bir ölçüt değildir. İçinde yaşadığımız evren hakkında hâlihazırda bildiğimiz her şey düşünüldüğünde (hiçbir şey olmasa bile en azından kendimizi bildiğimizi kabul edebiliriz burada), Turing Testi’ni geçmeyi başaran herhangi bir şeyin gerçekten de zeki olduğu (bir zihne ya da benzeri şeylere sahip olduğu) sonucuna varmakta tamamen gerekçelendirilmiş olmazdık. (McDermott (2014), karşılıklı bir söyleşide 50 defa konuşma gerçekleştiren bir katılımcı için bir arama tablosunun yaklaşık olarak düğüme[8] sahip olacağını hesaplamıştır. Bu hesaplamayı, gerekli olan düğüm sayısının tüm gözlemlenebilir evrenden daha büyük olan bir alana denk geldiği ve bu yüzden sağlanamayacağı gerekçesiyle, Turing Testi’ndeki bir programın “el simülasyonu” olmasının ne nominal olarak ne de fiziksel olarak mümkün olmadığını göstermek için kullanmak makuldür.)

4.4 Olasılıksal Destek

Turing’in kendi testinde sağladığı ilk formülasyona baktığımızda bu testi geçmenin zekâ hipotezi için olasılıksal destek sağladığını düşündüğü açıktır. Burada ele alınması gereken en az iki farklı nokta vardır. İlk olarak, Turing’in yaptığı tahminin kendisi olasılıksaldır: Turing, makaleyi yazdığı tarihten itibaren (1950) yaklaşık elli yıl içerisinde, Taklit Oyunu’nu çok iyi oynayan dijital bilgisayarların programlanacağını ve ortalama bir sorgulayıcının, beş dakikalık bir sorgulamadan sonra doğru kimlik belirleme şansının yüzde 70’den fazla olamayacağını tahmin ediyordu. İkinci olarak, Turing’in tahmininin olasılıksal doğası, Turing’in önerdiği testin kendisinin olasılıksal bir doğaya sahip olduğunu düşünmek için iyi bir neden sağlıyor. Taklit Oyunu’ndaki belirli bir başarı düzeyi, söz konusu katılımcının zeki olduğuna (bir zihne, düşüncelere sahip olduğuna) dair güvende belirli bir düzeyde artışa sebep olur veya hiç değilse olması gerekir Turing, Taklit Oyunu’ndaki başarı seviyelerinin, söz konusu katılımcının zeki olduğuna dair güven artışıyla nasıl ilişkili olduğunu düşündüğünü bize söylemediğinden Turing Testi’nin büyük ölçüde yetersiz olduğuna ilişkin bir his vardır. İlgili değişkenler açıkça şunları içerir: oyunda sorgulamanın gerçekleştiği sürenin uzunluğu (veya hiç değilse sorgulamanın “miktarı”); sorgulayan kişinin becerileri ve uzmanlığı (bu örneğin, sorgulamanın “derinliğini” ve “zorunluğunu” belirlerdi); oyundaki üçüncü katılımcının becerileri ve uzmanlığı; oynayan oyunun birbirinden bağımsız oturumlarının sayısı (özellikle oyundaki diğer katılımcılar her oturumda değiştiğinde). Oyundaki diğer rollerdeki katılımcıların yeterince yetenekli olduğu birçok farklı seferde oldukça uzun süre katılım gösterip çok başarılı olmuş bir makine, son derece deneyimsiz katılımcılarla birlikte sadece bir oyunda oldukça kısa katılım gösterip başarılı olmuş bir makineden çok daha güçlü bir zekâ iddiasına sahip olacaktır. Bir makinenin, yetersiz rakiplerine karşı oyunun kısa bir turunda başarılı olması, söz konusu makinenin zeki olduğuna dair güvenin artması için bir neden olabilir. Fakat oyunun birçok sefer tekrarlanması durumunda sonuçların, başlangıçtaki bu güven artışını hızla tersine çevirebileceği açıktır. Bir makinenin çeşitli yetenekteki katılımcılara karşı tekrarlanan Taklit Oyunu’nun birçok uzun turunda sadece şansla başarılı olmaktan çok daha iyisini yapması, bu makinenin zeki olduğuna dair çok daha güçlü kanıtlar sağlardı. (Bu türden yeterince kanıt verildiğinde, biri bu makinenin zeki olduğuna dair gerçekten de emin olabilirmiş gibi görünüyor. Elbette kişinin, bu yargısının daha fazla kanıtla tersine çevrilebileceğinin de farkında olması gerekiyor. Örneğin, oyundaki makinenin kimliğini doğru bir şekilde belirleyebilmek için, birçok kısa süreli tur şeklinde tekrarlanan oyunda aynı stratejiyi defalarca kez kullanan katılımcıların olduğu testlerden elde edilen sonuç, şans faktöründen çok daha kötü olurdu.)

Turing Testi’nin olasılıksal doğası genellikle göz ardı ediliyor. Fakat “zorlu bir Turing Testi’nde” sağlanacak başarının, zekâya ilişkin çürütülebilir kanıtlardan farklı bir şey sağlamadığını söylemekle bir önceki paragrafta parmak bastığımız olasılıksal özellikleri fark etmek aynı şey değildir. Örneğin, Moor’un gözlemini (Moor 2001: 83) göz önünde bulunduralım, “Turing Testi’nden elde edilecek yeni kayıtlar, bu test için toplanan tümevarımsal kanıtlardan daha önemli bir hâle gelebilir. Yeni kanıtlar bir makinenin Turing Testi’ni, sahne arkasındaki bir insan tarafından kullanılan bir uzaktan kumanda ile geçtiğini gösteriyorsa bu testin geçerliliği için yeniden değerlendirme yapılması gerekirdi.” Bu ve buna benzer olan diğer pasajlardan anladığımız kadarıyla Moor, “zorlu Turing Testi’nin” teste giren makinenin ya başarılı ya da başarısız olduğu tek seferlik bir olay olduğunu varsayıyormuş gibi görünüyor. Fakat Turing Testi’nin bu yorumu, Bringsjord (1994) tarafından getirilen şu eleştiriye karşı savunmasızdır: Zeki olmayan bir makinenin, nispeten uzman katılımcılarla gerçekleştirilen orta uzunluktaki bir tek seferde bile şans eseri başarılı olması pek olası olmayabilir. Bizim düşüncemizse yeterince uzman olan farklı katılımcılarla ne kadar çok uzun turlar şeklinde oynanırsa, makinenin şans eseri başarılı oluğuna dair olasılığın kişinin isteyeceği kadar düşük olacağı yönündedir. Dolayısıyla, Bringsjord’un “şans eseri başarıya dayanan argümanı” Turing Testi’nin bazı versiyonlarına karşı güçlü bir eleştiriyken, Turing’in kendisinin önerdiği testin en makul yorumuna karşı bir şey ifade etmemektedir.

Taklit Oyunu’nun daha ayrıntılı istatistiksel veriler sağlayan daha karmaşık versiyonlarını oluşturmanın oldukça kolay olduğunu belirtmek önemlidir. Örneğin hakemler, sorgucunun oyundaki her iki katılımcının kimliği hakkında da Evet/Hayır kararları vermesini istemek yerine, olasılık dâhilinde cevaplar vermesini isteyebilir. (“Örneğin, A’nın makine olma olasılığının %75, B’ninkinin ise %25 olduğunu düşünüyorum.”) Bu nokta, “Turing Testi ”ne ilişkin “metodoloji” eleştirilerini dikkate aldığımızda önemlidir. (Turing Testin olasılıksal doğası hakkında daha fazla tartışma için, Shieber (2007) bakabilirsiniz. )

5. Alternatif Testler

Turing Testi ile ilgili literatürden bazı yazılar, yapay zekâ alanında gelecekteki araştırmalar için uygun bir rehber sağlayabilecek bir testin şekillenmesine ilişkin sorularla ilgilidir. Buradaki fikir çok basittir. Yapay olarak zeki bir varlık üretme azmimiz olduğunu varsayalım. Akıllı yapay sistemlerin ulaşması gereken tahmini hedefleri belirlerken hangi testleri yapmalıyız? Turing Testi’nin bu alandaki araştırmalar için uygun bir hedef sağladığını varsaymalı mıyız? Bu teklifleri değerlendirirken akılda tutulması gereken iki farklı soru vardır. İlk soru, yapay zekâ alanındaki araştırmaların, Turing Testi’ni (belirtilen başarı derecesinde ve süreler boyunca) geçebilecek bir makine yapmayı amaçlamasının yararlı bir hedef olup olmadığıdır. İkincisi soru ise, testi (belirtilen başarı derecesinde ve süreler boyunca) geçmeyi başaran bir makinenin zihinsel kapasiteleri hakkında nasıl bir sonuca varmamız gerektiğidir.

Bu sorularla ilgili görüşler birbirinden son derecede ayrılmış durumdadır. Bazı insanlar, Turing Testi’ni geçebilecek bir sistem üretmek çok zor olduğundan dolayı bu testin yapay zekâ araştırmaları için yararlı bir hedef sağlamadığını düşünüyor. Bazıları, Turing Testi’nin yürütülen araştırmalar için çok dar bir hedef belirlediğinden dolayı (ve bu yüzden yürütülen araştırma türüne gereksiz kısıtlamalar koyduğundan dolayı), bu testin yapay zekâ araştırmaları için yararlı bir hedef sağlamadığına inanıyor. Diğerleri, Turing Testi’nin yapay zekâ araştırmaları için tamamen uygun bir hedef sağladığını düşünürken bazılarındaysa Turing Testi’nin gerçekten de yeterince zorlu olmadığına dair bir his var. Ayrıca bu kişiler, bu testin yapay zekâ araştırmaları adına uygun bir hedef sağlaması için, testin kapsamının çeşitli şekillerde genişletilmesi gerektiğini düşünüyorlar. Bu pozisyonların her birinin bazı örneklerini sırayla inceleyelim.

5.1 Turing Testi Çok Zordur

Bazı insanlar, Turing Testi’ni geçebilecek bir sistem üretme hedefine ulaşmaktan bayağı uzakta oluğumuzdan dolayı bu testin yapay zekâ araştırmaları için uygun bir hedef sağlamadığını düşünüyorlar. Bu şekilde düşünen insanlar, Turing Testi’ni geçebilecek bir makine yapabileceğimizin şüpheli olduğunu veya hiç değilse bunu öngörülebilir bir gelecekteki herhangi bir zamanda yapabileceğimizin şüpheli olduğunu düşünmek için nedenler ortaya koymuştur. Bu tarz argümanların en ilginçleri French’den (1990) geliyor olabilir. Her halükarda bunlar, üzerinde düşünmeye devam edeceğimiz argümanlardır. (Cullen (2009) de bu argümanlara benzer düşünceler ortaya koymuştur.)

French’e göre, Turing Testi’ni “insan bilişinin alt seviyelerine” sahip olmayan hiçbir şeyin geçemeyeceğinden ve “insan bilişinin alt seviyelerinin” yapay bir şeklinin geliştirilmesinin neredeyse imkânsız denilebilecek kadar zor olduğundan Turing Testi gerçek bir zekâ testi olarak “adeta işe yaramaz”dır. French en azından, “düşük seviyeli bilişsel yapıyı” ortaya çıkaran ve insanları makinelerden ayırmada başarılı olacağı neredeyse kesin olan belli sorular olduğunu düşünmüştür.

İlk olarak, sorgulayıcıların örneğin çağrışımsal çalışmaya yönelik araştırma sonuçlarından yararlanmalarına izin verilirse insanları makinelerden çok makul bir biçimde ayıracak veriler bulunabilirdi. Mesela, insanlara bir dizi harf rastgele bir şekilde gösterildiğinde bu karıştırılmış harf dizisinin önünde eğer (konuştukları dilde) alakasız veya anlamlı bir kelime olmayan harf dizisi yerine, bu gösterilen harf dizisiyle alakalı bir kelime (konuştukları dilde) varsa, bu karıştırılmış harflerle anlamlı bir kelime oluşturabilmeleri (konuştukları bir dilde) için daha az zamana ihtiyaç duyduklarını gösteren bir araştırma vardır. Sorgulayan kişi, söz konusu dili konuşan katılımcıların bu kelimeleri tanıma süreleri hakkında doğru verilere sahip olabilirse uygun harf dizilerini tanıma sürelerine bakarak basit bir şekilde makineyle insan arasında ayrım yapabilir; en azından French böyle düşünüyordu. Bunun doğru olup olmadığı net değildir. Sonuçta, Turing Testi’nin tasarımı, sorgulayan kişinin bir dizi sembol dizisine yanıt süreleri hakkındaki güvenilir bilgileri nasıl elde edeceğini görmeyi zorlaştırıyor. Bu testte, bilgisayarı ayrı bir odaya koymak ve teleprinter ile iletişim kurmak, bilgisayarın kimliğini doğru tanımlamanın bazı alakasız yollarını ortadan kaldırmak anlamına gelir. Eğer bu gereksinimler, çağrışımsal çalışma testlerinin uygulanmasıyla bilgisayarın kimliğinin doğru bir şekilde tanımlanmasını hâlihazırda ortadan kaldırmıyorsa gereksinimler bunu sağlayacak bir duruma getirilmek için kesinlikle değiştirilebilir. French’in hayal ettiği türden bir test uygulamasının sıradan bir konuşma olmadığını ve birkaç uzman sorgulayan kişi dışında diğer sorgulayıcıların yapabilmesinin beklenmediğini belirtmekte fayda olabilir. Sonuç olarak, Turing Testi’nin koşulları French’in burada öngördüğü türden bir prosedürü ortadan kaldırmasa bile Turing Testi’nin makinelerin geçmesi için inanılmaz derecede zor olduğu açık değildir.

İkinci olarak, birazcık daha yüksek bir bilişsel düzeyde, French’in insanlar ve makineler arasında oldukça güvenilir ayrıştırıcılar olacağını düşündüğü belirli türden “derecelendirme oyunları” vardır. Örneğin, katılımcılardan uydurma sözcükleri belirli tür varlıklara isim olarak uygunluklarına göre sıralamalarını isteyen “Uydurma Sözcükleri Derecelendirme Oyunu” ve katılımcılardan bir kategorideki şeyleri başka bir kategorideki şeylerle sınıflandırmalarını isteyen “Kategori Derecelendirme Oyununun” her ikisi de French’e göre, insanlar ve makineler arasında ayrım yapmada oldukça güvenilir kanıtlar sağlıyor. İlk durumdaki oyunda, insanların yaptığı derecelendirmeler kültürel olarak edinilmiş çok sayıda ilişkiye bağlıdır (bu kültürel ilişkilerin belirlenmesi ve tanımlanması neredeyse imkânsızdır ve bu nedenle (muhtemelen) bir bilgisayara programlanması neredeyse imkânsız olacaktır). Ve ikinci durumdaki oyunda, insanları yaptıkları derecelendirmeler aslında büyük ölçüde belirli sosyal ve kültürel ortamlara (ve insan yaşamının deneyimlendiği belirli yollara) bağlıdır. Şimdi French’in verdiği örneklere bakalım. Teknolojik olarak gelişmiş Batı dünyasında İngilizce’yi yetkin konuşanlar arasında “Flugblogs” kelimesinin kahvaltılık gevrek için uygun bir isim olmadığı konusunda yaygın bir fikir birliği olurdu ama aynı zamanda, bir çocuğun oyuncak ayısı için “Flugly” isminin uygun olduğunu da düşünülürdü. Gelişmiş ülkelerde İngilizce’yi yetkin konuşanlar arasında ayrıca, kalemlerin silah olarak değerlendirilme olasılığının büyük piyanoların el arabası olarak değerlendirilme olasılığından daha yüksek olduğuna ilişkin de yaygın bir fikir birliği olurdu. Buna karşılık, French’in bu argümanı hakkında sorulabilecek bazı sorular vardır. Değerlendirme oyunlarının dayandığı verilerin French’in düşündüğü kadar güvenilir olup olmadığı da net değildir. (En azından biri, “Flugly” kelimesinin bir oyuncak ayı için tamamen uygunsuz bir isim olacağını düşünüyor olabilir. Bu yanıt aslında, uydurulmuş olan “Flugly” kelimesiyle, büyük ihtimal ikimizin de almış olduğu üniversitedeki lisans eğitimlerinde daha sık rastlanılan “Fugly” (çok çirkin) kelimeleri arasındaki benzerlikten ortaya çıkmıştır. Ayrına en azından birisi, küçük çocukların “Flugblogs” isimli bir mısır gevreği yemekten büyük olasılıkla memnun kalacaklarını düşünebilirdi ve bu görüşten, kalemleri ve büyük piyanoları derecelendirme hakkındaki soruya iyi bir yanıt getirilebilir: Sorunun cevabı tamamen söz konusu kalemlere ve büyük piyanolara bağlıdır. Ya bu büyük piyanonun tekerlikleri varsa? Ya rakibin bir kılıcı veya hafif makineli tüfeği varsa? Bu tür bir derecelendirme oyunu oynamayı reddetmenin, makine olan katılımcının kimliğini zorunlu bir şekilde açığa çıkaracağı bariz değildir.) Dahası, veriler güvenli olsa bile seçkin bir grup sorgulayan kişi dışında herhangi bir sorgulayıcının makinenin kimliğini açığa çıkarmak için bu tür bir stratejiyi kullanacağı açık değildir. Ayrıca, normal insanların bu tür testlerde göstereceği gibi performans gösterebilen bir makine yapmanın inanılmaz derecede zor olduğu da açık değildir. Özellikle de Turing’in varsaydığı gibi, çeşitli görevlerin nasıl yapılacağını öğrenmek için “eğitilebilen” öğrenen makineleri yapmak mümkünse o zaman bu makinelerin, insan çocuklarının dil kullanımı konusunda “eğitildiklerinde” edindikleriyle aynı türden “bilişsel yeterlilikleri” neden edinemedikleri sorusunun cevabı açık değildir.

Turing Testi’nin çok zor olduğunu ve bu nedenle yapay zekâya yönelik mevcut araştırmalar için hedefler belirlemede uygun olmadığını düşünmek için verilen başka nedenler de vardır. Bu nedenlerden birinin genel fikri, insan bilişinin yapay olarak üretilmesi özellikle zor olan fakat zekâ (düşünce veya zihnin varlığı) için hiçbir şekilde gerekli olmayan özelliklerinin olabileceğiyle ilgilidir. Buradaki sorun sadece Turing Testi’nin yalnızca insan zekâsını test etmesi olmasından ziyade insan zekâsının bir makineye kopyalanmasının olağanüstü derecede zor olan oldukça gereksiz özelliklerinin olduğu gerçeğidir. Eğer bu itiraz gerekçelendirilmişse (yani, eğer gerçekten de insan zekâsının makinelerde kopyalanması olağanüstü derecede zor olan ve Turing Testinde oynanan turlarda makine olan katılımcının kimliğini açığa çıkarmak için güvenilir bir şekilde kullanılabilecek olan özellikleri varsa), Turing Testi’nin yapay zekâ araştırmaları için uygun bir yön belirlediği fikri hakkında endişelenmek için bir nedene sahip olurduk. Bununla birlikte, French’in görüşlerine ilişkin tartışmalarımızın gösterdiği gibi, bu bölümde tartışılan türden düşüncelerin, Turing Testi’nin gerçekten de yapay zekâ araştırmaları için uygun olmayan hedefler belirlediğini söyleyebilecek durumda olduğumuzu gösterdiğini varsaymak için bir nedenimiz olabilir.

5.2 Turing Testi Çok Kısıtlayıcıdır

Turing Testi’nin yapay zekâ alanındaki araştırmalar için yeterince geniş bir hedef belirlemediğini öne süren yazarlar vardır. Bu yazarlar arasındaki birçok kişi Turing Testi’nin çok kolay olduğunu düşünmüştür ki bunlardan bazılarını bir sonraki alt bölümde inceleyeceğiz. Fakat aynı zamanda, Turing Testi’nin hedefi gerçekten çok zor olsa da buna rağmen çok kısıtlayıcı olduğunu düşünen bazı yazarlar da vardır.

Turing Testi’nin zekâ için mantıksal olarak yeterli bir koşul sağladığı fikrine getirilen eleştiri, Turing Testi’nin çok kısıtlayıcı olduğunu gösterme amacına uyarlanabilirdi. Örneğin, Gunderson’ı (1964) ele alalım. Gunderson’ın Turing Testi’ne karşı getirdiği iki büyük eleştiri vardır. İlk olarak, Turing’in Taklit Oyunu’ndaki başarının sebebinin belli bir zekâya sahip olmanın dışında başka nedenlerden dolayı olabileceğini söyler. İkinci olarak da Taklit Oyunu’nda başarılı olmanın sadece, zeki bir varlığın yapabileceği türden şeylere bir örnek olduğunu ve bu yüzden tek başına, zekânın varlığını kanıtlamak için güvenilir bir ölçüt olmadığını savunmuştur. Gunderson bunu, bir elektrikli süpürge satıcısının “çok amaçlı” olduğunu iddia ettiği bir süpürgesinin aslında tek yaptığının toz emmek olması örneğine benzetir. Gunderson’a göre Turing, bir makinenin sadece Taklit Oyunu’nundaki başarısı temelinde akıllı olduğunu söylemeye hazırsa elektrikli süpürge satıcısı ile aynı konumdadır. Tıpkı “çok amaçlı” olmanın bir dizi şeyi yapma yeteneğini gerektirmesi gibi, “düşünme” de Taklit Oyunu’nda başarılı olmanın ötesinde bir dizi yeteneğe sahip olmayı gerektirir.

Taklit Oyununu geçmekte başarılı olabilecek bir makinenin aynı zamanda çok çeşitli farklı şeyler de yapabileceğini iddia ederek, Gunderson’a atfedilen argümana karşı bir yanıt verilebilir. Bu oyundaki sohbeti başarılı bir şekilde yürütebilmek için her biri farklı alanlara da uygulanabilecek olan çeşitli bilişsel becerilere sahip olmak gerekir. Hafıza, algılama vb. gibi bariz bir şekilde görülen genel bilişsel yetkinlikler dışında, Yapay Oyununun tekrarlanan turlarında test edilen birçok özel yetkinlik vardır. Bunlara örnek olarak, temel aritmetik yetenekler, oyunun kurallarının anlaşılması, oyunun özgün amacının temel anlamda anlaşılması vb. verilebilir. Taklit Oyunu’nu oynamada şaşırtıcı derecede iyi olan ama kendisine verilebilecek diğer görevleri iyi şekilde yapamayan bir makinenin olması düşünülemezdi. Fakat aynı zamanda, Taklit Oyun’unu oynamada şaşırtıcı derecede iyi olan ama çeşitli alanlarda gösterilebilecek geniş bir yetkinlik yelpazesine sahip olmayan bir makinenin olması da aynı derecede düşünülemezdi. Yani, Gunderson’ın böyle bir cevap verirken düşündüğü şey şudur:

Taklit Oyunu’nda başarılı olabilecek bir makinenin, dar bir yetenekler yelpazesinden fazlasına sahip olması gerektiğini düşünmek için hiçbir neden yoktur. Sonuç olarak, biz bu cevabın ciddiye alınması gerektiğine inanmak için hiçbir neden olmadığını düşünüyoruz.

Daha yakın zamanlarda Erion (2001), Gunderson’ınkine bir miktar yakınlığı olan bir pozisyonu savundu. Erion’a göre, makineler “belirli ortamlardaki sınırlı sayıdaki görevde insanlardan daha iyi bir performans gösterebilirlerdi ama yine de sağduyu sahibi bir kişinin yapabileceği çeşitli durumlarda maharetli bir şekilde davranamazlardı” (36). Erion’un öne sürdüğü bu iddiayı yorumlamanın bir şekli şöyledir: Erion da Turing Testi’nin zeki insanların sahip olduğu bir dizi bağımsız yetkinlik arasından yalnızca birini tanımladığına inanıyordu ve bu yüzden, “bir varlığın kullandığı dilin daha dikkatli bir incelemesini içeren ve aynı zamanda bu varlığın geniş çeşitlilikteki günlük durumlardaki problemleri çözme yeteneğini test eden daha kapsamlı bir ‘Kartezyen Test’ önermiştir” (37). Bizce, en azından Turing Testi doğru bir şekilde anlaşıldığında, Turing Testi’ni geçen herhangi bir şeyin geniş çeşitlilikteki günlük durumlardaki problemleri çözme yeteneğine sahip olması gerektiği açıktır (çünkü sorgulayan kişiler sorularını bunları ve Taklit Oyunu’nu oynayanların diğer türdeki yeteneklerini araştırmak için kullanacaklardır.)

5.3 Turing Testi Çok Kolaydır

Turing Testi’nin daha zor olan herhangi bir testle değiştirilmesi gerektiğini öneren bazı yazarlar da olmuştur. Bu testlerden herhangi birinin aslında yapay zekâ alanındaki araştırmalar için Turing Testi tarafından belirlenenden daha iyi bir hedef önerdiği hiç de net değildir. Fakat bu bölümde, bu iddiayı savunmaya çalışmayacağız; bunun yerine, önerilen ek testlerin bazılarını basitçe açıklayacağız ve bazılarına kendi yorumlarımızı ekleyeceğiz. (Başlangıç noktası olarak, ısrarla belirtmek istediğimiz şu noktadan başlayabiliriz: Turing’in Taklit Oyunu, o zamanki teknolojinin dayattığı sınırlamaların arka planına karşı olarak tasarlanmıştır. Elbette, oyundaki katılımcıların cinsiyeti veya türü hakkındaki bilgilere doğrudan erişimi engellemek için tele-metin cihazlarının kullanılması oyun için gerekli değildir. İlerleyen kısımlarda bu nispeten olağan türden düşüncelere tekrar tekrar değinmeyeceğiz.)

5.3.1 Daha Kapsamlı Turing Testi (The Total Turing Test)

Harnad (1989, 1991), sadece metin formatlı dilsel girdilere değil de tüm girdilere yanıt vermeyi gerektiren bir testin Turing Testinden daha iyi bir test olacağını iddia etmiştir. Yani Harnad’a göre, yapay zekâ alanındaki araştırmalar için uygun hedef, insan duyusal motor becerilerine benzer bir şeye sahip bir robot yapmak olmalıdır. Harnad ayrıca “nöromoleküler ayırt edilemezliğin” yapay zekâ için uygun bir hedef olabileceği önerisini de değerlendirmiştir. Fakat bu öneriyi, Daha kampsamlı bir Turing testini geçebilecek bir robot yapmayı öğrendiğimizde, zihin modelleme konusunda çözülmemiş hiçbir sorun olmayacağı gerekçesiyle reddetmiştir. Harnad’ın önerdiği testin yapay zekâ araştırması için daha uygun bir hedef belirleyip belirlemediği ilginç bir sorudur. Turing Testi’ni geçebilen ancak Total Turing Testi’ni geçemeyen bir sistemin olabileceğinin net olmadığını belirtmekte özellikle fayda vardır. Harnad’ın kendisi “başarılı dil performansı oluşturmak için tam robotik kapasitelerin gerekli olduğunu” düşündüğü için, Turing Testi’ni genişletilmiş testiyle değiştirmeye neden ihtiyaç duyduğumuz açık değildir. (Harnad’ın görüşüne getirilen bu itiraz, Hauser’de (1993: 227) ve başka yerlerde bulunabilir.)

5.3.2 Lovelace Testi[9]

Bringsjord ve diğerleri (2001), yapay zekâ için daha tatmin edici bir hedefin, Lovelace Testi adını verdikleri belirli bir tür meta-test tarafından sağlandığını ileri sürmektedir. İnsan tarafından tasarlanan yapay bir makinenin (bu bölümün devamında insandan H, tasarlanan makineden A ve bilgilerin işlenmesiyle çıkan üründen O olarak bahsedilecektir), yalnızca şu üç koşulu birlikte sağlaması durumunda Lovelace Testini geçebileceğini söylemişlerdir. (1) Yapay makine A, O çıktısını üretebilir; (2) A’nın O çıkışı, makinenin programında meydana gelen şans eseri bir hata sonucu değil, A’nın tekrarlayabileceği süreçlerin sonucudur; (3) H (ya da H ile aynı bilgilere ve kaynaklara sahip olan başka birisi), A’nın tasarımı ve yapısına, bilgi tabanına ve temel fonksiyonlarına başvurarak A’nın O’yu nasıl ürettiğini açıklayamıyordur. Bu öneriye karşı, üçüncü koşulun yorumlanmasıyla ilgili sorulacak sorular olduğunu belirtmekte fayda vardır. Bir bilgisayar programının kodlarının neredeyse sonu gelmiyorsa ve karmaşıksa hiçbir insan çıktının nasıl üretildiğini tam olarak açıklayamaz. (Bilgisayar neden 3.17 yerine 3.16 çıktısını verdi?) Fakat oldukça şematik bir açıklama yapmamıza izin verilirse (örneğin, bilgisayar girdiyi aldı, bazı içsel işlemler yaptı ve ardından bir yanıt üretti gibi), insanların bu testte gerçekten yaratıcı olan bir şey yaptığı iddiasını desteklemek çok zor olacak gibi görünüyor. Sonuçta biz de dış girdileri alıyoruz, içsel işlemler yapıyoruz ve çıktılar üretiyoruz. İncelediğimiz bu açıklamada eksik olan şey, bir açıklamanın uygunluk seviyesiyle ilgili olan her önerinin kanıtlanması gerektiğidir.

5.3.3 Çok Daha Kapsamlı Turing Testi (The Truly Total Turing Test)

Schweizer (1998), katılımcıların evrimsel geçmişine değinen bir testin, Turing Testinden daha iyi olacağını iddia etmiştir. İnsanlara zekâyı atfettiğimizde onların entelektüel başarılarının kapsamlı bir tarihsel kaydına bel bağlıyoruz. Bu tarihsel kaydın temelinde, insanların zeki olduğunu iddia edebiliriz ve eğer zekâyı her bir insan bireyinin davranışı temelinde atfediyorsak, bu iddiaya güvenebiliriz. Schweizer’a göre, zekâyı her bir makineye atfedeceksek insanınkine benzer bir bilişsel başarının tarihsel kaydına değinebiliyor olmamız gerekir. Dolayısıyla sadece makineler diller geliştirdiğinde, yazılı bilimsel araştırmalar yaptığında, senfoniler oluşturduğunda, oyunlar icat ettiğinde ve buna benzer şeyler yaptığında, her bir makinenin davranışı temelinde onlara zekâyı atfedebilecek bir konumda olurduk. Elbette, söz konusu teste tâbi olan bir makinenin zeki olup olmadığını belirlemek için Turing Testi’ni hâlâ kullanabilirdik. Fakat soruya verdiğimiz cevap yalnızca, makinenin Turing Testi’nde başarılı olup olmadığına bağlı olmayacaktır çünkü karşılanması gereken daha ileri bir “evrimsel” koşul vardır. Bununla birlikte, “İnsanlara, onların davranışları temelinde zekâ atfetmemizin, onların kolektif bilişsel başarıları hakkında sahip olduğumuz ön bilgiden kaynaklı olduğu” varsayımının doğru olduğunun kesin olmadığı belirtilerek Schweizer’a karşı çıkılabileceğini söylemekte fayda var.

5.4 Turing Testi Zararlı Olarak mı Değerlendirilmelidir?

Turing Testi’nin yapay zekâ için uygun bir araştırma hedefi sağladığı önerisine yapılan belki de en iyi bilinen eleştiri, Hayes ve Ford’a (1995) aittir. Hayes ve Ford’un öne sürdüğü tartışmalı iddialardan bazıları şu şekildir:

(a) Turing, Taklit Oyunu’nu yapay zekâ araştırma programı için nihai bir hedef olarak önerdi.
(b) Turing, Turing Testi’nin bir tür testi olmaktan çok bir cinsiyet testi olmasını amaçladı.
(c) Turing Testinde başarılı bir makine yapmaya çalışmak, hiç kimsenin böyle bir makinenin yapılmasını ciddi bir araştırma hedefi olarak benimseyemeyeceği kadar zordu.
(d) Turing Testi, “boş hipotezi” (yani, bazı makineler ve insanlar arasında davranış açısından hiçbir fark olmadığı hipotezi) doğrulamak için ortaya koyduğu temel tasarım eksikliğinden mustaripti.
(e) Oyunda sorulacak olan sorular her zaman, sorgulayan kişilerin yeterince dikkatli olmadığı (ve doğru türden sorular gündeme getirmediği) bir şekilde ortaya çıkabileceğinden dolayı hiçbir boş etki deneyi, zekâ için yeterli bir kriter sağlayamaz. Eğer bunu sağlayamıyorsa, sorgulayan kişinin yaptığı sorgulama için sabit bir bitirme noktası olamaz.
(f) Boş etki deneyleri hiçbir şeyi ölçemez: Turing Testi yalnızca, tam başarıyı test edebilir. (“Test boyunca söylediklerinin %10’unda kadın gibi gibi görünmeyi başaramayan bir erkek Taklit Oyunu’nda neredeyse her zaman başarısız olurdu.”)
(g) Turing Testi gerçekten de insan türünün kendi üyelerini insanmış gibi davranan sahtekârlardan ayırt etme yeteneğinin testidir (“Cinsiyet testi ise, kadın gibi davranan mekanik bir araç yapma testiydi.”)
(h) Turing Testi döngüseldir: Birçok insan Turing Testinde başarısız olacağından dolayı, bu test “zekâyı” veya “insanı” doğrulayamaz. Dahası, “Katılımcılardan birinin kimliğinin makine olarak belirlenmesi gerektiğinden, insan popülasyonunun yarısı tür testinde başarısız olur”.
(i) Turing Testi’nin perspektifi kibirli ve dar görüşlüdür: Bilişin temel ilkelerinin sağlam bir kavrayışına sahip olmadan önce insan bilişini anlayacağımızı (yanlış bir şekilde) varsaymıştır.
(j) Turing Testi, insan için layık görülenden daha zayıf, farklı ve hatta daha güçlü zekâ biçimlerini kabul etmez.

Bu iddialardan bazıları açıkça yanlış görünüyor. Örneğin, (h)’yi değerlendirelim. İnsan popülasyonunun %50’sinin “tür testinde” başarısız olacağı nasıl iddia edilebilir? “Tür testi”, sorgulayan kişinin iki kişiden hangisinin makine olduğuna karar vermesini gerektiriyorsa makine olduğuna karar verilen kişinin zekâsının değerlendirilmesinde sorgulayan kişinin kararının herhangi bir sonucu olduğu neden düşünülmelidir? (Hayes ve Ford tarafından tanımlanan orijinal “tür testinin” koşullarından birinin katılımcılardan birinin makine olması olduğunu hatırlayın. Makinenin Taklit Oyunu’nda başarılı olması onun zekâsını “gösterebilecekken” bir insanın bu oyunda başarısız olması onun zekâsının eksik olduğunu “göstermez”.)

Turing Testi’nin “sıfır etki deneyi” olduğu için kusurlu olduğunu söylemek de yanlış görünüyor. Turing Testi’nin “boş sonuca” yol açtığına dair bir hissin olduğu doğrudur: Belirtilen koşullarda normal düzeydeki sorgulayan kişiler, makinenin kimliğini doğru belirlemekte başarısız olurlarsa bu makinenin zeki olduğuna dair olasılık vardır. (Burada, belirtilen koşullarda “normal düzeydeki sorgulayan kişiler” ifadesinin üzerinde durulmasının amacı, makinenin kimliğini belirlemenin konumuzla alakasız olan yollarını (yani, makinenin zeki olup olmadığı sorusuyla ilgili olmayacak bir şekilde makinenin kimliğini belirleme yollarını) ortadan kaldırmaktır. Ele aldığımız makine ile bir insan arasındaki zekâ dışındaki her şey tamamen farklı olabilir çünkü Turing’in ortaya koyduğu deneysel proje, bu farklılıkların hepsini algılanabilir bir hâle getirmiyor. Fakat Turing Testi, zekâyı tanımlamakla ilgisi olmayan bu farklılıkları görmezden gelebildiği sürece iyi bir test olarak kalacaktır.)

Turing Testi’nin yalnızca “tam başarı” durumlarında işe yarayan bir test olmasının ciddi bir başarısızlık olduğunu söylemek de ayrıca şüpheli görünüyor. Bir yandan, bir erkeğin, bir kadın tarafından geldiği açıkça anlaşılmayan bir iddiada bulunma şansı onda bir ise N soruyu cevapladığı bir oyunda gerçek kimliğinin keşfedilme şansını hesaplayabiliriz. (Ayrıca, N sayısı yeterince küçükse bu kişinin “oyunu oynadığı neredeyse her seferde başarısız olacağı” anlamı çıkmazdı.) Diğer bir taraftan, yukarıda Bölüm 4,4’ün sonunda belirttiğimiz gibi, eğer birisi “Turing Testi’nin” “EVET/HAYIR” doğası hakkında endişeleniyorsa sorgulayan kişilerin bu şekilde cevap vermesi yerine olasılıksal kararlar vermesini sağlayabilirdi. Bu değişiklik Turing Testi’nin karakteristik yapısını korurdu fakat daha fazla istatistiksel karmaşanın ortaya çıkmasına sebep olurdu.

Hayes ve Ford (1995) tarafından savunulan iddialara yönelik yapılabilecek (birçok) başka eleştiri olsa da, Turing Testi’nin yapay zekâ araştırmaları için belirleyici hedefi sağladığı önerisi konusunda endişelenmekte haklı oldukları kabul edilmelidir. Yapay zekâ araştırmasının temel amaçlarından birinin yapay insanlar üretmek olduğu önermesini kabul etmekten hoşlanmamak için çeşitli nedenler vardır. Fakat Turing’in, Turing Testi’nin yapay zekâ araştırma alanını tanımladığını varsaydığını düşünmek için hiçbir neden olmadığını belirtmek de önemlidir (ve diğer ciddi düşünürlerin de böyle düşündüğüne dair çok fazla kanıt yoktur). Turing, insan dışı zekâ biçimleri olabileceğinin farkındaydı (yukarıda verdiğimiz (j) iddiasının aksine). Bununla birlikte tüm bunlar, Turing Testi’nin yapay zekâ araştırması için uzun vadeli bir hedef belirlediğini varsaymanın oldukça uygun olduğu önerisiyle tutarlı kalmaktadır:

Yapay insanlar üretmek, eninde sonunda hedefleyebileceğimiz iyi hedeflerden biridir. Hayes’in ve Ford’un iddia ettiği gibi, Turing Testi’ni geçmek inanılmaz derecede zor ise testin hedefinin yalnızca çok az kaynağın ayrılması gereken bir saha hedefi olduğunu varsaymanın hiçbir zararı yoktur. Ama böyle olsa bile bunu bir hedef olarak görmek için iyi bir nedenimiz olabilir.

6. Çin Odası

Literatürde Turing Testi’ne yönelik son elli yılda ortaya çıkan fakat henüz tartışmadığımız birçok farklı eleştiri vardır. Tüm bu eleştirileri bu yazıda gözden geçirmeyi umamazdık. Fakat Turing Testi ile bağlantılı olarak sıkça dile getirilen ve bununla ilgili bir tartışma ile bu yazıyı bitirmek istediğimiz bir argüman var: Searle’ın “Çin Odası” argümanı.

Minds, Brains and Programs’da (Zihinler, Beyinler ve Programlar) ve başka yerlerde John Searle, “uygun şekilde programlanmış bilgisayarların kelimenin tam anlamıyla bilişsel durumlara sahip olduğu” iddiasına karşı çıkmıştır (64). Searle’ın burada, Turing’in uygun şekilde programlanmış bir bilgisayarın düşünebileceği iddiasına katılmadığı açıktır. Searle’ın argümanı hakkında tartışmalı olan çok şey var ama bu yazıda, onun iddia ettiği şeyi yorumlamanın sadece bir yolunu inceleyeceğiz.

Searle’ın argümanının temel yapısı çok iyi bilinmektedir. Simüle edilen davranışın arkasında herhangi bir uygun zekânın yatmasına izin verme konusunda çok isteksiz olabileceğimiz durumlarda, Çince konuşan zeki bir varlığın “el simülasyonunu” hayal edebiliriz. (Dolayısıyla, mantıksal bir olasılık olduğunu varsaymaya davet edildiğimiz şey, Block’un bizi mantıksal bir olasılık olduğunu varsaymaya davet ettiğinden çok da farklı değildir. Fakat Searle’ın geliştirdiği argüman, Block’un savunduğu argümandan oldukça farklıdır.) Searle’ın argümanının kilit noktası olan kısım ise söz konusu “el simülasyonu”nun, konuyla ilgili olan tüm açılardan, sadece özel bir tür dijital hesaplama olmasıdır. Dolayısıyla, dijital bir bilgisayarın zekâyı simüle ettiği, fakat dijital bilgisayarın kendisinin zekâya sahip olmadığı, gerçek dünyadan oldukça farklı olan olası bir dünya vardır. Fakat gerçek dünyadaki herhangi bir dijital bilgisayarı düşünürsek farklı olan olası dünyadaki bilgisayardan hiçbir şekilde farklı olmaz. Buradan da şuna ulaşabiliriz: Gerçek dünyadaki bilgisayarın, farklı olan olası dünyadaki bilgisayardan daha zeki olduğu bir durum mümkündür. Çin Odasındaki “el simülatörü” bilgisayarın zeki olmadığını kabul ettiğimizde dijital bilgisayarların zeki olabilecek şeyler olmadığı sonucuna varmaktan başka seçeneğimiz kalmaz.

Şu ana kadar anlattığımız haliyle bu argüman, uygun şekilde programlanmış hiçbir bilgisayarın düşünemeyeceği sonucuna varmıştır. Bu sonuç Turing’in kabul ettiği bir sonuç olmasa da Turing Testi’nin zekâyı tanımlama için iyi bir test olduğu iddiasıyla uyumlu olduğuna dikkat etmek önemlidir. Şu ana kadar iddia edilen şeyler için bunun nedeni, zekânın herhangi bir “el simülasyonunu” sağlamanın alışılmış bir şekilde mümkün olmaması (ve özellikle de, herhangi bir bilgisayar kullanarak zekâyı simüle etmenin mümkün olmaması) olabilir. En azından ifade ettiğimiz şekliyle Searle’in argümanını Turing Testine karşı bir eleştiri hâline getirmek için bilgisayarları kullanarak zekâyı simüle etmenin en azından alışılmış bir şekilde mümkün olduğunu düşünmemize sebep olacak bir nedene ihtiyacımız var. (Bilgisayarları kullanarak zekâyı simüle etmek alışılmış bir şekilde mümkün değilse, dijital bilgisayarların gerçek bir zekâ modeline sahip olamayacağı iddiasının Turing Testi üzerinde hiçbir etkisi yoktur çünkü Turing Testindeki dijital bilgisayarlar, sadece zekâ simülasyonunun olduğu durumlar silsilesinden alışılmış bir şekilde dışarıda bırakılmıştır.) Böyle bir nedenin olduğuna dair bir inancımız yokken Searle’ın argümanı en fazla dijital bilgi işlem makinelerinin bir gün Turing Testi’ni geçeceğine dair Turing’in kendinden emin inancına bir eleştiri olabilirdi. (Bu kısımda da, daha önceki kısımlarda varsaydığımız gibi, her tür C varlığı için, C’nin Turing’in tanımladığı türden olan testteki makinenin rolünü üstlendiği Turing Testi’nin bir versiyonu olduğunu varsayıyoruz. Zekânın varlığını test etmeye yönelik bu genel format, Searle’ın Çin Odası argümanının başarısıyla zorunlu bir şekilde zayıflamayacaktır.)

Searle’a atfettiğimiz argümana verilebilecek çeşitli yanıtlar vardır. Bu yanıtlardan biri, Çin Odası’nın durumunda hiçbir zeki varlığın bulunmadığı iddiasına itiraz etmektir. (“El simülasyonunun” uygun sensörler vb. ile donatılmış bir robota yerleştirildiğini varsayalım. Ayrıca, “el simülasyonunun” “el simülasyonu” vb. sürecinin güncellenmesini de içerdiğini varsayalım. Bu türden yeterli olacak şekilde ayrıntının eklenmesi halinde, Çin Odası’nda hâlâ zeki bir sistemi tanımlamadığımızı söylemeyi isteyip istemediğimiz oldukça belirsiz hale gelirdi.) Diğer bir yanıtlama ise, gerçek dünyadaki dijital bilgisayarların, farklı olan olası dünyadaki Çin Odası’nda kullanılan sistemden bu kadar büyük bir farka sebep olacak şekilde farklı olamayacağı iddiasına itiraz etmektir. (Çin Odası’nın çekirdeğinin bir tür devasa arama tablosu olduğunu varsayarsak, gerçek dünyadaki dijital bilgisayarların bu tür bir şekilde arama tablolarıyla çalışmadığını not etmek önemli olabilir.) Başka olası yanıt türleri de vardır elbette fakat bu tartışmayı daha ileri götürmeye çalışmak bizi bu yazının kapsamından çıkaracaktır. (Braddon-Mitchell ve Jackson (1996), bu konularla ilgili daha fazla tartışmaya bakmak için iyi bir kaynaktır.)

7. Zekâ Ölçümü Üzerine Kısa Bir Not

Zekânın ölçülmesine ilişkin bu makalede ele alınmayan çok farklı görüşler vardır. Bu yazıdaki ilgimizse Turing’i (1950) ve bıraktığı mirası tartışmaktı. Fakat elbette, zekânın ölçülmesiyle ilgili olan daha geniş kapsamlı bir tartışma örneğin, Algoritmik Bilgi Teorisi (Algorithmic Information Theory) , Kolmogorov Karmaşıklık Teorisi (Kolmogorov Complexity Theory), En Kısa İleti Uzunluğu Teorisi (Minimum Message Length Theory) ve benzerlerinin matematiksel ve sayısal kaynaklarını kullanarak zekânın ölçülmesine ilişkin araştırmayı da dikkate alacaktır. (Bu literatürle ilgili daha fazla şey öğrenmek için Hernandez-Orallo ve Dowe (2010), ayrıca burada yer alan referanslar listesine bakabilirsiniz.) Yapay zekâ araştırmasına daha genel bir giriş için, Marquis ve diğerlerine (2020) bakabilirsiniz.

Dipnotlar

[1] Ned Block tarafından geliştirilen düşünce deneyindeki teorik bilgisayar sisteminin adıdır.
[2] Bugünkü modern matematiksel mantığın Gödel’in eseri olduğu söylenebilirdi. 23 yaşındayken, birinci eksiklik teoremi olarak bilinen kuramıyla, aritmetikte doğruluğu ya da yanlışlığı model içinde ispatlanamayan ama doğru olan önermelerin mutlaka olmak zorunda olduğunu kanıtlamıştır – çev. notu.
[3] 20. yüzyılın en büyük tartışmalarından biri olan “karmaşık hesaplar, sonlu sayıda adım içeren belli bir algoritma tarafından yapılabilir mi?” sorusuna Turing, Sonlanma Problemiyle “hayır” cevabını vermiştir (Algoritmayla çözülemeyecek problemler de vardır) – çev. notu.
[4 ] Lister Madal denilen madalya ödülünü kazanan kişi bu konuşmayı yapmaya hak kazanır. Lister Madalyası, İngiltere Kraliyet Cerrahlar Koleji (Royal College of Surgeons of England) tarafından cerrahi bilime katkılarından dolayı bir kişiye verilen bir ödüldür. Madalyanın ön yüzü, Lord Lister’in bir büstünün temsilidir – çev. notu.
[5 ] Genel amacı solo çalgının virtiözitesini (çalma ustalığını) müzikal bir anlayışla dinleyiciye sunmak amacıyla icra edilen müzik parçası genel adıdır – çev. notu.
[6] Canlı ve cansız nesnelerin ve olayların beş duyunun yardımı olmadan algılanmasına verilen addır. 6. his olarak da düşünebilirsiniz. İngilizcesi: clairvoyance –çev. notu.
[7] Gelecekteki olayları önceden altıncı his aracılığıyla (yani durugörü aracılığıyla) algılanması durumuna Parapsikoloji’de verilen addır – çev.notu.
[8] (node) Bir node’un tanımı kullanıldığı bağlama göre büyük oranda farklılık gösterilebilir. Burada ise, ağaç veri yapısının temel bir birimidir. Her biri farklı veri içerir ve bilgisayar ağlarında birbirine bağlıdır – çev. notu.
[9] Tarihteki ilk bilgisayar programcısı olarak kabul edilen Ada Lovelace’a ithafen böyle denmiştir –çev. notu.

Kaynakça

Abramson, D., 2008, “Turing’s Responses to Two Objections,” Minds and Machines, 18: 147–67.
–––, 2011a, “Descartes’ Influence on Turing,” Studies in History and Philosophy of Science, 42: 544–551.
–––, 2011b, “Philosophy of Mind is (in Part) Philosophy of Computer Science,” Minds and Machines, 21: 203–219.
Block, N., 1981, “Psychologism and Behaviorism,” Philosophical Review, 90: 5–43.
Boolos, G. and Jeffrey, R., 1980, Computability and Logic, Second Edition, Cambridge: Cambridge University Press.
Bowie, L., 1982, “Lucas’s Number is Finally Up,” Journal of Philosophical Logic, 11: 279–85.
Braddon-Mitchell, D. and Jackson, F., 1996, The Philosophy of Mind and Cognition, Oxford: Blackwell.
Bringsjord, S., Bello, P. and Ferrucci, D., 2001, “Creativity, the Turing Test, and the (Better) Lovelace Test,” Minds and Machines, 11: 3–27.
Chalmers, D., 1995, “On Implementing a Computation,” Minds and Machines, 4: 391–402.
Churchland, P. M. and Churchland, P. S., 1990, “Could a Machine Think?” Scientific American, 262 (1): 32–37.
Clark, A., 1997, Being There: Putting Brain, Body and World Together Again, Cambridge: MIT Press.
Copeland, J. (ed.), 1999, “A Lecture and Two Radio Broadcasts on Machine Intelligence by Alan Turing,” in K. Furukawa, D. Michie, and S. Muggleton (eds.), Machine Intelligence 15, Oxford: Oxford University Press.
–––, 2000, “The Turing Test,” Minds and Machines, 10: 519–39.
Copeland, J. and Sylvan, R., 1999, “Beyond the Universal Turing Machine,” Australasian Journal of Philosophy, 77: (1): 46–66.
Copeland, J., et al. (eds.), 2017, The Turing Guide, Oxford: Oxford University Press
Crooke, A., 2002, Confabulating Consciousness, Ph.D. Dissertation, Philosophy Department, Monash University.
Cullen, J., 2009, “Imitation Versus Communication: Testing for Human-Like Intelligence,” Minds and Machines, 19: 237–54.
Dennett, D., 1985, “Can Machines Think?” in M. Shafto (ed.), How We Know, Cambridge, MA: Harper and Row.
Dietrich, E. (ed.), 1994, Thinking Computers and Virtual Persons: Essays on the Intentionality of Machines, San Diego: Academic Press.
Dreyfus, H & Dreyfus, S., 1986, Mind Over Machine, New York: Free Press.
Erion, G., 2001, “The Cartesian Test for Automatism,” Minds and Machines, 11: 29–39.
Feferman, S., 1996, “Penrose’s Gödelian Argument,”, Psyche, 2: 21–32.
Floridi, L., Taddeo, M., and Turilli, M., 2008, “Turing’s Imitation Game: Still an Impossible Challenge for all Machines and some Judges,”, Minds and Machines, 19: 145–50.
French, R., 1990, “Subcognition and the Limits of the Turing Test,” Mind, 99: 53–65.
Genova, J., 1994, “Turing’s Sexual Guessing Game,” Social Epistemology, 8: 313–26.
Gunderson, K., 1964, “Descartes, La Mettrie, Language and Machines,” Philosophy, 39: 193–222.
–––, 1985, Mentality and Machines, 2nd edition, Minneapolis: University of Minnesota Press.
Harnad, S., 1989, “Minds, Machines and Searle,” Journal of Theoretical and Experimental Artificial Intelligence, 1: 5–25.
–––, 1991, “Other Bodies, Other Minds: A Machine Incarnation of an Old Philosophical Problem,” Minds and Machines, 1: 43–54.
Haugeland, J., 1981, “Semantic Engines: An Introduction to Mind Design,” in J. Haugeland (ed.), Mind Design: Philosophy, Psychology, Artificial Intelligence, Cambridge: MIT Press, 1–34.
Hauser, L., 1993, “Reaping the Worldwind: Reply to Harnad’s Other Bodies, Other Minds,” Minds and Machines, 3: 219–38.
Hauser, L., 2001, “Look Who’s Moving the Goalposts Now,” Minds and Machines, 11: 41–51.
Hayes, P., and Ford, K., 1995, “Turing Test Considered Harmful,” Proceedings of the Fourteenth International Joint Conference on Artificial Intelligence, Montreal: Morgan Kaufmann, 972–977.
Hernandez-Orallo, J., and Dowe, D. L., 2010, “Measuring Universal Intelligence: Towards an Anytime Intelligence Test,” Artificial Intelligence, 174: 1508–39.
Hodges, A., 1983, Alan Turing: The Enigma, London: Burnett with Hutchinson.
Hofstadter, D., 1982, “The Turing Test: A Coffee-House Conversation,” in D. Hofstadter and D. Dennett (eds.), The Mind’s I: Fantasies and Reflections on Self and Soul, London: Penguin, 69–95.
Levesque, H., 2017, Commonsense, the Turing Test, and the Quest for Real AI, Cambridge, MA: MIT Press.
Lewis, D., 1969, “Lucas against mechanism,” Philosophy, 44: 231–233.
–––, 1979, “Lucas against mechanism II,” Canadian Journal of Philosophy, 9: 373–376.
Lucas, J., 1961, “Minds, Machines and Gödel,” Philosophy, 36: 120–4.
Marquis, P., et al. (eds.), 2020, A Guided Tour of Artificial Intelligence Research, Cham: Springer.
Masum, H., Christensen, S., and Oppacher, F., 2003, “The Turing Ratio: A Framework for Open-Ended Task Metrics,” Journal of Evolution and Technology, 13(2), available online.
McDermott, D., 2014, “On the Claim that a Look-Up Table Program could Pass the Turing Test,” Minds and Machines, 24: 143–88.
Moor, J., 1976, “An Analysis of Turing’s Test,” Philosophical Studies, 30: 249–57.
–––, 2001, “The Status and Future of the Turing Test,” Minds and Machines, 11: 77–93.
Pautz, A. and Stoljar, D. (eds.), 2019, Blockheads! Essays on Ned Block’s Philosophy of Mind and Consciousness, Cambridge, MA: MIT Press
Penrose, R., 1989, The Emperor’s New Mind, Oxford: Oxford University Press.
Piccinini, G., 2000, “Turing’s Rules for the Imitation Game,” Minds and Machines, 10: 573–85.
Saygin, A., Cicekli, I., and Akman, V., 2000, “Turing Test: 50 Years Later,” Minds and Machines, 10: 463–518.
Schweizer, P., 1998, “The Truly Total Turing Test,” Minds and Machines, 8: 263–72.
–––, 2012, “The Externalist Foundation of a Truly Total Turing Test,” Minds and Machines, 22: 191–212.
Searle, J., 1981, “Minds, Brains, and Programs,” Behavioral and Brain Sciences, 3: 417–57.
Shah, H. and Warwick, K., 2010, “Hidden Interlocutor Misidentification in Practical Turing Tests,” Minds and machines, 203: 441–54.
Shieber, S., 1994, “Lessons from a restricted Turing Test,” Communications of the Association for Computing Machinery, 37: 70–8. [Preprint available online]
–––, 2007, “The Turing Test as Interactive Proof,” Noûs, 41: 686–713.
–––, 2014, “There can be no Turing-Test-Passing Memory Machines,” Philosophers’ Imprint, 14: 1–13.
Sterrett, S., 2000, “Turing’s Two Tests for Intelligence,” Minds and Machines, 10: 541–59.
Traiger, S., 2000, “Making the Right Identification in the Turing Test,” Minds and Machines, 10: 561–572.
Turing, A., 1950, “Computing Machinery and Intelligence,” Mind, 59 (236): 433–60.
Weizenbaum, J., 1966, “ELIZA-A Computer Program for the Study of Natural Language Communication Between Men and Machines,” Communications of the ACM, 9: 36–45.
Whitby, B., 1996, “The Turing Test: AI’s Biggest Blind Alley?” in P. Millican and A. Clark (eds.), Machines and Thought: The Legacy of Alan Turing, Volume 1, Oxford: Clarendon.
Zdenek, S., 2001, “Passing Loebner’s Turing Test: A Case of Conflicting Discourse Functions,” Minds and Machines, 11: 53–76.

Graham Oppy & David Dowe- “The Turing Test”, (Erişim Tarihi: 18.02.2021)

Çevirmen: Hasan Alparslan Bayrak

Çeviri Editörü: Beyza Nur Doğan

“Zihin Felsefesi” ve “Bilinç” ile ilgili içeriklerimize erişmek için tıklayın.

Öncüller Sonucu Belirler