
Image generated with OpenAI
Görüş: AI Modelleri Gizemli “Varlıklar” ve Hatta Yaratıcıları Bile Onları Tam Anlamıyla Kavrayamıyor
Anthropic’in son zamanlarda Claude 3.5 Haiku modelinin nasıl çalıştığı üzerine yaptığı çalışma, çığır açan bilgiler ve gelişmiş AI teknolojilerinin nasıl işlediğini anlamaya dair bir kıvılcım vaat ediyor. Peki, onlar LLM’lerin “yaşayan organizmalar” olduğunu ve “düşündüğünü” söylediklerinde ne demek istiyorlar?
Birkaç gün önce, Anthropic iki makale yayınladı ve Büyük Dil Modelleri (LLM’ler) nasıl çalışır ona dair çığır açan araştırmalar yaptı. Teknik gelişmeler ilginç ve alakalı olsa da, dikkatimi en çok çeken şey, AI uzmanları tarafından kullanılan kelime dağarcığı oldu.
Çalışmada Büyük Bir Dil Modelinin Biyolojisi Üzerine araştırmacılar, kendilerini milyarlarca yıl süresince evrimleşmiş karmaşık “yaşayan organizmaları” inceleyen biyologlara benzettiler.
“Aynı şekilde, dil modelleri basit, insan tasarımı eğitim algoritmaları tarafından oluşturulmuşken, bu algoritmaların doğurduğu mekanizmalar oldukça karmaşık görünüyor,” diye yazdı bilim insanları.
Son birkaç yılda, Yapay Zeka modelleri önemli ölçüde gelişti. Ve hızlı evrimini son birkaç aydır gözlemliyoruz. ChatGPT’yi sadece metinden konuşan bir arkadaşa, şimdi de Studio Ghibli tarzı etkileyici görüntüler oluşturabilen çok boyutlu bir ajan olmaya kadar gördük.
Peki ya mevcut AI modelleri, süreçlerini ve sistemlerini bile yaratıcıları anlayamayacak kadar ileri düzeyde geliştirecek bir bilim kurgu seviyesine ulaşıyorsa? 2025’te yeniden ziyaret etmemiz veya derinlemesine incelememiz gerekebilecek birçok Yapay Zeka teknolojisi ile ilgili gizem bulunmaktadır.
Yapay Zeka Modellerinin Ürkütücü Kara Kutu Paradoksu
AI benimsenmesi ve AI okuryazarlığı üzerine birden çok tartışma bulunmakta ve jeneratif AI modellerinin nasıl çalıştığını anlayanların chatbotları “arkadaşları” veya “büyülü” uygulamalar olarak görmeye daha az eğilimli olduğu bir gerçek. Ancak, başka bir tartışma daha var—uzmanlar ve teknolojiye daha aşina olan kişiler arasında—LLM’leri bağımsız yaratılar olarak karşılaştırmak veya değerlendirmek gerekip gerekmediği üzerine. İkincisi hakkında, tartışmada kritik bir rol oynayan “AI kara kutu paradoksu” adı verilen özel bir bileşen bulunmakta.
Derin öğrenme sistemleri, insanların yaptığı gibi öğeleri ve trendleri tanımak için eğitilmiştir. Biz çocuklara farklı objelere belirli kelimeler atamayı ve desenleri tanımayı öğrettiğimiz gibi, LLM’ler de benzersiz bağlantılar kurmak ve “büyüdükçe” daha da karmaşık hale gelen ağlar oluşturmak için eğitilmiştir.
Samir Rawashdeh, Elektrik ve Bilgisayar Mühendisliği Yardımcı Doçenti, yapay zekâ konusunda uzmanlaşmıştır ve açıklıyor ki, insan zekâsını incelediğimizde olduğu gibi, derin öğrenme sistemlerinin nasıl kararlar verip sonuçlara ulaştığını gerçekten görmek neredeyse imkansızdır. Bu, uzmanların “siyah kutu problemi” olarak adlandırdığı bir durumdur.
Yapay Zekâ Modelleri, İnsan Anlayışını Zorluyor
Anthropic’in yakın zamanda yaptığı çalışma, modelinin belirli senaryolarda nasıl “düşündüğünü” açıklayarak daha önce belirsiz veya tamamen yanlış olan AI siyah kutu durumuna ışık tuttu. Çalışma, Claude 3.5 Haiku modeli üzerine kurulu olsa da, uzmanların diğer yapay zekâ modellerinde benzer özellikleri geliştirmek ve analiz etmek için araçlar geliştirmesine olanak sağlar.
“Bu zekanın doğasını anlamak, ‘düşünmek’ anlamına gelen kavrayışımızı yeniden şekillendirme potansiyeli olan derin bir bilimsel meydan okumadır,” şeklinde belirtiyor makale Anthropic’in araştırmacıları tarafından paylaşıldı.
Ancak, AI teknolojilerine atfedilen “düşünmek” terimi, endüstrinin belirli uzmanlarını rahatsız ediyor ve eleştirinin bir parçası. Bir Reddit kullanıcısı, bir grup insanı neden rahatsız ettiğini açıkladı: “Makale boyunca, işi bulanıklaştıran çok fazla antropomorfizm var. Örneğin, ‘hesaplama’ demesi gereken yerde sürekli ‘düşünmek’ kelimesini kullanıyor. Biz bir bilgisayar yazılımından, biyolojik bir beyinden bahsediyoruz.”
“İnsanlaştırılmış” terimler, teknik olmayan insanların AI modellerini daha iyi anlamalarına yardımcı olur ve toplulukta tartışma yaratırken, gerçek şu ki, biz “hesaplama” ya da “düşünme” desek de, aynı sorun devam ediyor: LLM’lerin nasıl çalıştığına dair tam bir anlayışımız veya tam bir şeffaflığımız yoktur.
Yakın Gelecekteki Gelişmiş AI Modellerinden Ne Beklemeli?
ChatGPT, DeepSeek, Perplexity veya Claude gibi gelişmiş AI teknolojilerinin varlığını görmezden gelmeyi hayal edebiliyor musunuz—şimdi ya da yakın gelecekte? Tüm işaretler, geri dönüşün olmadığına işaret ediyor. Üretken ve akıl yürütme AI, günlük yaşamımızı zaten dönüştürdü ve sadece evrimleşmeye devam edecekler.
WizCase’de neredeyse her gün, toplumumuz üzerinde büyük bir etki yaratma potansiyeline sahip olan yeni bir AI modeli, yeni bir AI aracı, yeni bir AI şirketi hakkında sektördeki yeni bir gelişmeyi rapor ediyoruz. Bu gelişmiş modelleri ve nasıl çalıştıklarını daha iyi anlamak için bir ara verme ya da hızı biraz olsa bile yavaşlatma fikri, AI yarışındaki hızlı tempo ve hükümetlerin ve dünyanın en güçlü şirketlerinin dahil olması sebebiyle imkansız gibi görünüyor.
Anthropic’in makalesi, “AI modelleri, yaşamımız ve iş şeklimiz üzerinde artan bir etkiye sahip, bu nedenle etkilerinin olumlu olmasını sağlamak için onları iyi anlamalıyız,” diye belirtiyor. Biraz gerçek dışı gibi görünse de, araştırmacılar pozitif kalmayı sürdürüyor: “Buradaki sonuçlarımızın ve üzerine inşa edildikleri ilerleme yolunun, bu zorluğu aşabileceğimizi gösteren heyecan verici kanıtlar olduğuna inanıyoruz.”
Ama bu keşifler ne kadar hızlı ilerleyebilir gerçekten? Makale, sonuçların sadece birkaç alanı ve belirli durumları kapsadığını ve daha genel sonuçlar çıkarmanın mümkün olmadığını da belirtiyor. Yani, muhtemelen yeterince hızlı değil.
Düzenleyiciler, daha fazla şeffaflık talep etmek için AB Yapay Zeka Yasası gibi önlemler alırken, ilerlemeyi yavaşlattığı iddiasıyla büyük teknoloji şirketlerinden suçlamalar ve serzenişler alıyor, güçlü yapay zeka modelleri ilerlemeye devam ediyor.
Bir toplum olarak, bu teknolojilerin nasıl çalıştığını daha derin bir şekilde anlamayı ve onları topluluklarımıza anlamlı faydalar ve ilerlemeler getirecek şekillerde benimsemeyi dengelemeye çalışmalıyız. Bu mümkün mü? Bu “varlıkların” “etik” ve “iyi” kalma konusunda sadece dua etmeyi veya ummayı düşünmek şu anda çok da uçuk gelmiyor.
Yorum bırakın
Vazgeç