
Image by TechCrunch, from Flickr
Konuşmadan Önce Düşünen Yapay Zeka? Claude 3.7 Sonnet, Hibrit Mantığıyla Karşınızda
Anthropic, AI modelinin yeni sürümü olan Claude 3.7 Sonnet’i sundu. Bu yeni sürüm, kullanıcılara modelin karmaşık görevleri nasıl işlediği üzerinde daha fazla kontrol sağlayan opsiyonel bir “genişletilmiş düşünme” modunu tanıtıyor.
Acele Mi Ediyorsunuz? İşte Kısa Bilgiler!
- Model, yanıt vermeden önce öz-refleksiyona izin vererek akıl yürütme ve problem çözme becerilerini geliştirir.
- Genişletilmiş düşünme modu yalnızca ücretli planlarda mevcuttur.
- Claude Code, bir kodlama asistanı, geliştiriciler için sınırlı önizlemededir
Anthropic, hibrid akıl yürütme özelliği sunan güncellenmiş bir AI modeli olan Claude 3.7 Sonnet’i yayımladı. Bu sayede kullanıcılar hızlı yanıtlar ve geniş kapsamlı düşünme arasında seçim yapabiliyorlar.
Bu yeni yaklaşım, modele gerektiğinde yanıtlarını değerlendirmek ve iyileştirmek için ekstra zaman vererek problem çözmeyi geliştirmeyi amaçlar.
Standart modda, Claude 3.7 Sonnet öncülü Claude 3.5 Sonnet üzerinde iteratif bir gelişme olarak işlev görür. Ancak genişletilmiş düşünme modunda, model bir yanıt üretmeden önce kendini sorgular.
Michael Gerstenhaber, Anthropic’in AI için ürün lideri, bu özelliği, kullanıcıların yanıt süresi ve akıl yürütme derinliği arasında denge kurma yolu olarak tanımladı. ” [Kullanıcı] davranış üzerinde çok fazla kontrole sahip – ne kadar süre düşündüğü ve zaman ve bütçe ile akıl yürütme ve zeka ticaret yapabileceği” dedi, WIRED tarafından bildirildiği gibi.
Bu süreç, matematik, fizik, kodlama ve talimat takibi gibi çok adımlı akıl yürütme gerektiren alanlarda doğruluğu artırmayı amaçlamaktadır. API aracılığıyla modelle etkileşime giren kullanıcılar, “düşünmek” için kaç tane token kullanabileceğini belirleyebilir, böylece yanıt hızı ve maliyet üzerinde kontrol sağlar.
WIRED, güncellemenin ayrıca bir “kağıt parçası” özelliği içerdiğini belirtiyor, bu da modelin bir isteği işlerken mantıksal adımlarını gözler önüne seriyor. Bu yaklaşım, DeepSeek’in kullandığı diğer AI modellerindeki tekniklere benzer.
Anthropic, Claude 3.7 Sonnet’in yarışma tarzı referans noktalarından ziyade gerçek dünya uygulamaları için optimize edildiğini belirtiyor. Erken testler, genişletilmiş akıl yürütme modunun karmaşık kod tabanları, gelişmiş araç kullanımı ve tam yığın yazılım geliştirmede görevler üzerindeki performansı geliştirdiğini öne sürüyor.
Model, SWE-bench Verified ve TAU-bench’te değerlendirildi ve Anthropic tarafından raporlandığı üzere önceki versiyonları geride bırakıyor.
CNN Anthropic’in Claude 3.7 için fiyatlandırmayı önceki modellerle aynı tuttuğunu belirtiyor. Bu, onu OpenAI’nin en son tekliflerinin altına konumlandırıyor. Milyon başına 3 dolar giriş tokeni ve milyon başına 15 dolar çıkış tokeni maliyeti var, bu da OpenAI’nin benzer seviyelerdeki 15 ve 60 dolarlık teklifleriyle karşılaştırıldığında daha uygun.
Yorum bırakın
Vazgeç