Daha Basit Olan Neden Daha İyidir? – Elliott Sober

541 Okunma
Okunma süresi: 10 Dakika

Barselona’nın iki mimari başyapıtı birbirlerinden olabildiğince farklılar. Antoni Gaudi tarafından tasarlanan Sagrada Familia, Mies van der Rohe tarafından inşa edilen Barselona Pavyonu’ndan yalnızca birkaç mil ötede bulunuyor. Gaudi’nin kilisesi gösterişli ve karmaşıkken Mies’in pavyonu sakin ve basit. Minimalist mimarinin öncüsü olan Mies neyi hedeflediğini göstermesi adına ‘Az çoktur.’ sloganını kullanıyordu. Gaudi hiç ‘Çok çoktur.’ demese de yapıları aklında bulunanın bu olduğuna işaret ediyor.


Mies ve Gaudi arasındaki bu zıtlığa karşı verilebilecek uygun bir tepki her türden sanatın nasıl olması gerektiğine dayanan bir inançla taraf seçmek olabilir. Eğer sanat tamamen basit ya da karmaşık olmalı diyeceksek o zaman seçim açık. Buna karşın her iki norm da absürt gözüküyor. Bazı saygıdeğer sanat eserlerinin basit bazılarınınsa karmaşık olduğu gayet açık değil mi? Evet, sınırların ötesine çıkan bazı aşırı örnekler olabilir; bizler aşırı karmaşık sanat eserlerine yabancı kalıyorken fazla basit eserlerden de sıkılıyoruz. Yine de bu iki ekstrem ucun arası olanaklarla dolu bir boşluk içeriyor. Farklı sanatçılar farklı amaçları hedefleyebilir. Sanatçılar tüm sanat eserlerinin sahip olması gereken eşsiz karmaşıklık derecesini keşfetmeye çalıştıkları bir işin içinde değiller. Zamanından bağımsız ideal diye bir şeyden bahsedemeyiz.

Bilim ise farklı, en azından birçok bilim insanına göre öyle. Albert Einstein ‘Tüm teorilerin en üst hedefinin indirgenemez temel elementleri-her bir deneyimin verisine eşit temsil olanağı tanımaktan vazgeçmeden- olabildiğince basit ve az hale getirmek olduğu neredeyse reddedilemez.’ dediğinde birçok bilim insanı adına konuşmuştu. Öyleyse basit teori arayışı bilimsel faaliyetin bir gerekliliğidir diyebiliriz. Teoriler fazla karmaşık bir hal aldığında bilim insanları düzeltme yapmak için Ockham’ın Usturası‘na, basitlik prensibine, başvurur. Bu prensip der ki basit ve karmaşık iki teoriden basit olanı gözlemlerimizle uyumlu olduğu sürece daha az içeriğe, aşamaya ya da nedene ihtiyaç duyan teori daha çok ihtiyaç duyandan daha iyidir. Peki bu ‘daha iyi’ ne demek oluyor? Basit teorilerin güzel, anlaması, hatırlaması ve test etmesi kolay olabildiği oldukça açık. İşin zor kısmı neden bir teorinin diğerinden basit oluşunun bize dünyanın nasıl işlediği hakkında bir şeyler söylediği gerçeğini açıklayabilmekte yatıyor.

Ockham’ın Usturası’na en ünlü bilimsel desteklerden birini Isaac Newton’un şu dört önermeyi ‘Mantığın Kuralları’ olarak öne sürdüğü Doğal Felsefenin Matematiksel Prensipleri’nde (1687) bulmak mümkün. İlk iki kural şunlar:

Kural I. Fenomenleri açıklamak için uygun ve yeterli olandan daha fazla nedeni olduğu kabul edilmemelidir. Filozofların dediği gibi: doğa hiçbir şeyi boşa yapmaz ve daha azı yeterliyken daha fazla neden olması boşunadır. Çünkü doğa basittir ve fazladan, gereksiz nedenlere sahip olma lüksüne başvurmaz.

Kural II. Bu yüzden aynı sonuçlar mümkün olduğunca aynı ya da benzer türden nedenlerle bağdaştırılmalıdır. Örnek olarak solunumun insan ve hayvanlardaki varlık nedeni, taşların Avrupa ve Amerika’da düşüşü, mutfak ateşinin ve Güneş’in ışığı ya da ışığın Dünya ve diğer gezegenlerdeki yansıması verilebilir.

Newton bu kuralları gerekçelendirmek adına pek bir şey yapmıyor, ancak Yeni Ahit’in Vahiy (Apokalips olarak da bilinir – Ç.N.) kitabı üzerine yayımlanmamış bir yorumunda daha fazlasını söylüyor. Onun ‘Metod için kurallar/Apokalips’i çözümlemek’ yorumundan bir kesit:

“Bu, zorlamaya başvurmadan şeyleri olabildiğince basite indirgeyen yorumları seçmeliyiz… Bunun sebebi… hakikatin çoklukta ve şeylerin karmaşıklığında değil basitlikte bulunabilir olmasıdır. Her şeyin mükemmel bir basitlikle çalışıyor olması Tanrı’nın mükemmelliğindendir. O karmaşanın değil düzenin Tanrısıdır. Ve böylece dünyanın yapısını anlamlandırmaya çalışanlar sürece bütün bilgileri olabildiğince basite indirgemeye gayret göstermelidirler; bu sayede dünyanın vizyonunu anlamaya başlayabilirler…”

Newton konu İncil yorumu da olsa fizik yasalarını keşfetmek de olsa daha basit teorileri tercih etmenin makul olduğunu düşünüyordu. Ockham’ın Usturası her iki durumda da geçerliydi çünkü Evren Tanrı tarafından yaratılmıştı.

20. yüzyılda filozoflar, istatistikçiler ve bilim insanları bir teorinin basitliğinin o teorinin dünyayı açıklamayla olan bağlantısını anlama konusunda gelişme kaydettiler. Ockham’ın Usturası’nın meşruiyetine dair açıklamaları teolojiye ya da doğanın basitliğinde yatan mükemmellik tezine dayanmıyordu. Elimizde usturayı meşru gösterebilecek en azından üç ‘basitlik paradigması’ var.

İlk paradigma tıp öğrencilerine verilen ‘zebraları kovalamaktan kaçının’ tavsiyesiyle örneklenebilir. Eğer hastanın semptomları hem yaygın bir C hastalığına işaret eden hipotezle hem de hastanın nadir görülen bir R hastalığına yakalandığı hipoteziyle açıklanabiliyorsa C teşhisini R teşhisine tercih etmelisiniz. C’yi tercih etmek daha basit olurdu. Bu vakada da basit olan hipotezin doğru çıkma ihtimali daha yüksek.

Basit teorilerin daha yüksek ihtimallere sahip olduğu başka bir durum daha var. Bu durum benim ‘sessizliğin usturası’ olarak adlandırdığım bir Ockham’ın Usturası versiyonunu da içeriyor. Eğer C1’in E’nin sebebi olduğuna dair bir kanıtın varsa ama C2’nin E’nin nedeni olduğuna dair bir kanıtın yoksa o zaman C1 E için tek başına C1 ve C2’den daha iyi bir açıklama olacaktır. 19. yüzyıl filozofu John Stuart Mill basitlik ilkesi için genel pratik ilkenin -ortada kanıt olmayan hiçbir şeye inanmamak- bir örneğidir dediğinde bu tarz durumları düşünüyordu. Fazladan bir nedene dair varsayımda bulunmak kanıtsız bir inançtır; uçurumdan kayarak düşüp ölen bir adamın aynı zamanda zehir de almış olması gerektiğini varsayıyormuşuz gibi düşünülebilir.

Mill sessizliğin usturasından bahsediyordu. E için daha iyi olan açıklama C2 hakkında sessiz kalır; C2’nin neden olduğunu reddetmez. Problem iki hipotezin bileşiği olan hipotezi düşündüğümüzde, yani ‘C1 ve C2’ hipotezini düşündüğümüzde değişiyor. Hangisi E için daha iyi bir açıklama: ‘C1 ve C2-değil’ mi yoksa ‘C1 ve C2’ mi? Sessizliğin usturası bize bu konuda yol göstermiyor ancak reddetmenin usturası bize rehberlik yapabilir. Bize ilkini tercih etmemiz gerektiğini söyler. Ne yazık ki eğer elimizde bir kanıt yoksa buna neyin meşru bir zemin sağladığı pek açık değil; öyle ya da böyle, C2 doğru olsa da olmasa da. Sessizliğin usturasını gerekçelendirmek kolay; reddetmenin usturasını gerekçelendirmekse daha zor.

Yaygın ve nadir hastalıklar hakkındaki örnekte iki hipotez gözlem için aynı olasılığı taşıyordu. İkinci basitlik paradigması gözlemde farklı olasılıklar sunan bir basit hipotez bir de karmaşık hipotez olan durumlara odaklanır. Bu şekildeki birçok durumda kanıt basit teoriyi karmaşık olan rakip teoriye karşı önceler. Örneğin mahallenizdeki tüm ışıkların aynı anda kesildiğini düşünün. Bu durumda aklınıza iki olası senaryo gelirdi:

(H1) Salı günü saat 8’de enerji kaynağına bir şey oldu ve bu tüm ışıkları etkiledi; ya da

(H2) Salı günü saat 8’de ışıkların gidip gitmemesinden bağımsız olarak her bir ampule bir şey oldu.

Ortaya tek bir ortak neden sürmek birbirinden bağımsız birçok neden sürmekten daha basittir. Tüm o ışıkların aynı anda kararması durumu H1’in doğru olduğu senaryoda H2’nin doğru olacağı bir senaryodan çok daha olasıdır. Filozof Hans Reichenbach‘ın düşüncelerine dayanarak diyebiliriz ki gözlemlerimizin H1’i H2’ye önceliyor oluşunu matematiksel olarak (H1 ve H2’nin ne dediğini ayrıntılarıyla anlatan varsayımlardan yola çıkarak) kanıtlayabiliriz. Meselenin matematiksel boyutunu merak edenler benim “Ockham’ın Usturası: Bir Kullanıcı Kılavuzu (2015)” kitabıma göz atabilir.

Ortak nedenlerin bağımsız nedenlere tercih ediliyor oluşuyla ilgili önemli biyolojik bir örnek Charles Darwin‘in günümüzdeki yaşamın tamamının bir ya da birkaç orijinal ataya dayanıyor oluşuyla ilgili hipotezidir. Modern biyologlar genetik kodumuzun neredeyse evrensel olduğuna işaret ederken evrensel ortak bir ataya dayanan hipotezin birçok ataya dayanan hipoteze üstünlük sağladığı konusunda hemfikirler. Eğer farklı organizma grupları farklı kökenlerden ortaya çıkmış olsaydı paylaştığımız ortak kod oldukça şaşkınlık verici bir tesadüf olurdu. Yaşamın ortak tek bir kökene dayanıyor olması çok daha olası diyebiliriz.

Üçüncü basitlik paradigmasına göre basitlik bir modelin yeni gözlemler hakkında ne kadar isabetli bir tahminde bulunacağını kestirmekle ilgilidir. Bu ilişkiyi ortaya koyan şaşırtıcı bir teoremi ispatlayan Hirotugu Akaike ‘model seleksiyon teorisi’ olarak adlandırılan istatiksel bir teorinin merkezi sonucunu da ortaya koyuyor. Bu teorem AIC (Akaike Bilgi Kriterleri) olarak adlandırılacak olan model değerlendirme kriterlerinin temelini oluşturuyor. AIC bir modelin yeni verileri tahmin edebilme yeteneğinin bu modelin a) eski verilerle ne kadar uyumlu ve b) ne kadar basit olduğunu göz önünde bulundurarak ölçülebileceğini söylüyor.

Bir örnek. Yazın sonlarına doğru şehre doğru yol alıyorsunuz ve yolun her iki tarafında devasa mısır tarlaları olduğunu fark ettiniz. Arabanızı durdurup her iki tarladan da 100’er örnek mısır aldınız. İlk aldığınız örneğin ortalama uzunluğunun 52 inç ikinci örneğinse 56 inç olduğunu ölçtünüz. Büyüme sezonunun sonlarında olunduğuna göre her iki tarladaki mısırların ortalama uzunluklarının önümüzdeki günlerde de değişmeyeceğini varsaydınız. Yarın bu iki tarlaya dönüp 100’er mısırla tekrar ölçüm yapmayı planladınız. Aşağıdaki iki tahminden hangisinin daha isabetli olduğunu düşünürdün?

Tahmin A: İlk tarladan aldığın 100 örneğin ortalama uzunluğu 52 ikincisininse 56 inç olacaktır.

Tahmin B: Her iki örneğin de ortalama uzunluğu 54 inç olacaktır.

Model seçim teorisi bu problemin tarlalardaki ortalama uzunluklarla ilgili iki modeli dikkate alarak çözülebileceğini söylüyor:

DIFF:
ilk popülasyondaki ortalama uzunluk = h1, ve ikinci popülasyondaki ortalama uzunluk = h2.

NULL: ilk popülasyondaki ortalama uzunluk = ikinci popülasyondaki ortalama uzunluk = h.

Her iki model de h1, h2 ve h’nin değerlerini söylemiyor; bunlar ‘ayarlanabilir parametreler’ olarak adlandırılır. NULL* modeli bu isme sahip çünkü iki popülasyondaki mısırların ortalama uzunluklarının birbirlerinden farklı olmadığını söylüyor. DIFF* modeline verdiğim isim biraz yanıltıcı çünkü model popülasyonlardaki mısırların ortalama uzunluklarının birbirlerinden farklı olduğunu söylemiyor. DIFF bu olasılığa izin veriyor ancak aynı zamanda her iki popülasyondaki mısırların ortalama uzunluklarının aynı olmasına da izin veriyor.

DIFF ve NULL modelleri yarın tarlalardan elde etmeye gideceğiniz veri hakkında nasıl bir tahminde bulunuyor? Modeller kendi başlarına bir sayı vermiyor ancak modellere elinizdeki eski veriyi koyarak ayarlanabilir parametrelerin (h1, h2 ve h) değerleri hakkında değerlendirmede bulunabilirsiniz. Bunun sonucunda iki model şu hale gelir:

f(DIFF): h1=52 inç ve h2=56 inç.

f(NULL): h=54 inç.

Hangi modelin yeni veriyi daha isabetli tahmin edeceği sorusu burada şu anlama gelecek şekilde yorumlanabilir: hangi model elinizdeki eski veriyi göz önünde bulundurduğunuzda henüz elinizde olmayan yeni verilerin ne şekilde olacağını daha isabetli bir biçimde tahmin edebiliyor?

Muhtemelen DIFF’in doğru sonuca ulaşacağını düşünüyorsunuz. Tabii NULL’un da muhtemelen yanlış sonuca ulaşacağını düşünüyorsunuz. İki devasa popülasyona sahip mısır tarlalarının tam olarak aynı ortalama uzunluğa sahip olma oranları nedir ki? Eğer amacınız iki modelden hangisinin doğruya hangisinin yanlışa ulaşacağını söylemekse bunu yapabilirsiniz. Ancak önümüzdeki problem bu değil. Daha çok her bir modelin tahminlerinin ne kadar isabetli olacağını görmeyi istiyorsunuz. NULL ve DIFF gibi modeller hakkındaki şaşırtıcı şeylerden biri bazen yanlış olduğu bilinen modellerin doğru oldukları bilinen modellere kıyasla daha isabetli tahminlerde bulunabiliyor olmasıdır. NULL yanlış olmasına rağmen doğruya yakın olabilir. Eğer durum buysa yeni veriler hakkında tahmin yaparken DIFF yerine NULL’u tercih etmen yararına olabilir. Sonuçta elindeki eski verideki örnekler popülasyon ortalamasını temsil etmek açısından iyi örnekler olmayabilir! NULL seni düz ve dar bir alanda tutuyor; DIFF ise yoldan çıkarıyor.

Akaike Bilgi Kriterleri NULL ve DIFF’i iki olguya bağlı olarak değerlendiriyor: f(DIFF) elimizdeki verilere f(NULL)’dan daha iyi uyum sağlıyor ve DIFF, NULL’dan daha karmaşık bir model. Bu bağlamda bir modelin karmaşıklığı modelin içerdiği ayarlanabilir parametre sayısına bağlı. Daha önce de söylediğim üzere AIC aşağıda basitçe şu şekilde açıklanabilecek olan Akaike teoremine dayanıyor:

Model M’nin tahminsel isabetliliğinin önyargısız bir değerlendirmesi = [f(M)’nin elimizdeki veriyle ne kadar uyumlu olduğu] – [M’nin içerdiği ayarlanabilir parametre sayısı].
 
Sonuç olarak bu matematiksel sonuç basitliğin ne kadar isabetli tahminlerde bulunabileceğini değerlendirmek açısından önemli olduğunu ortaya koyabilir.

Akaike’nin teoremi bir teoremdi ve sonuç olarak varsayımlardan türetilmişti. Bu teoremin üç varsayımı var. İlki eski ve yeni veri setlerinin aynı temel gerçeklikten elde edildiğiydi; bu varsayımın bizim örneğimizde gerçekleşebilmesi için her iki popülasyonun ortalama uzunluğu yeni ve eski veri setleri elimize geçtikten sonra değişmemiş olmalıydı. İkinci varsayım modeldeki her bir parametrenin tekrarlanan değerlendirmelerinin çan eğrisi şeklinde bir dağılıma neden olacağıdır. Üçüncü varsayım ise rekabet halindeki modellerin birinin doğru ya da doğruya yakın olduğudur. Bu varsayım mısır örneğinde doğruydu çünkü NULL ya da DIFF’ten biri doğru olmak zorundaydı.

Gaudi ve Mies iş sanat eserlerindeki basitlik ve karmaşıklığın değerini biçmeye geldiğinde renkler ve zevklerin tartışılmaz olduğunu bize hatırlatıyor. Einstein ve Newton ise bilimin farklı olduğunu söylüyor- basitlik bilimde bir zevk meselesi değildir. Reichenbach ve Akaike bunun neden böyle olduğunu gösterecek birkaç neden sunuyor. Sonuçta elimizde neden bir teorinin basitliğinin dünyanın nasıl işlediğini anlamamızla ilişkili olduğunu açıklayabilecek üç basitlik paradigması var:

Paradigma 1: bazen basit teorilerin doğru olma olasılığı daha yüksektir.

Paradigma 2:
bazen basit teoriler gözlemlerimiz tarafından daha iyi desteklenir.

Paradigma 3: bazen bir modelin basitliği tahminsel isabetliliğini değerlendirmemiz açısından önemlidir.

Bu üç paradigmanın önemli bir ortak noktası var. Bir problemin bu üçünden birine uyup uymaması problem hakkındaki empirik varsayımlara dayanıyor. Bu varsayımlar bazı problemler için doğru oluyorken diğerleri için yanlış olabilir. Basitliğin dünyanın nasıl işlediği hakkında yargılar oluşturmamızla açıkça ilgisi olmasına rağmen günün sonunda Ockham’ın Usturası için elimizde koşulsuz ya da varsayımsız bir gerekçelendirme olmadığını söyleyebiliriz.

* DIFF ve NULL metinde modellerin temsil ettiği içeriğe göre verilmiş yakıştırma isimler olarak kullanılıyor. DIFF differın kısaltması olarak değişken olan anlamında kullanılırken NULL ise sabit, değişken olmayan anlamında kullanılıyor. Benzer şekilde kısaltma kelimeler bulamadığım için okurken kolaylık olması adına metin boyunca orijinal hallerini kullandım.

Kaynak:, “Are scientific theories really better when they are simpler?” https://aeon.co/essays/are-scientific-theories-really-better-when-they-are-simpler, (Erişim Tarihi: 02.03.2020) Çevirmen: Yiğit Aras Tarım

Bir cevap yazın

Your email address will not be published.

Önceki Gönderi

Türkçede Yapay Zekaya Dair 14+2 Kitap - Yunus Şahin, CogIST

Sonraki Gönderi

Taner Beyter- Erdem Epistemolojisi “Bilgiye Erdem Yoluyla Ulaşmak Mümkün mü?”

En Güncel Haberler Pozitif Bilimler