
Image by Matheus Bertelli, from Pexels
DeepSeek’in Yapay Zekası Kendi Kendine Düşünmeyi Öğreniyor
Çinli girişim DeepSeek, Tsinghua Üniversitesi ile ortaklaşa, yapay zeka modellerinin daha iyi ve hızlı düşünmelerine yardımcı olabilecek daha zeki bir yol geliştirdiğini söylüyor, ve bunu devasa bilgisayarlara veya pahalı kaynaklara ihtiyaç duymadan yapıyor.
Acelesi olanlar için hızlı bilgiler:
- DeepSeek, Kendi İlkelerine Dayalı Eleştirel Ayarlama (SPCT) kullanarak kendini geliştiren bir AI oluşturdu.
- SPCT, AI’ya kendi oluşturduğu kurallarla kendi işini değerlendirmeyi öğretir.
- Bu yöntem, devasa bir hesaplama gücü olmadan performansı artırır.
Bu ilerleme, Self-Principled Critique Tuning (SPCT) adı verilen yeni bir teknikten geliyor. SPCT, AI modellerini daha büyük yaparak performansı artırmaktan farklıdır – SPCT, AI’ya kendi işini kendisi oluşturduğu bir dizi kural kullanarak değerlendirmeyi öğretmek için çok fazla enerji ve hesaplama gücü gerektirmez.
İşleyiş biçimi, AI’nin yanıtının hem dahili akıl yürütme kurallarına uyduğunu hem de insan çıktısı için uygun göründüğünü doğrulayan yerleşik bir “hakem” aracılığıyladır. AI, sağlam bir yanıt sağladığında olumlu geri bildirim alır, bu da benzer soruları gelecekteki durumlarda yanıtlama yeteneğini geliştirmesine yardımcı olur.
DeepSeek, bu yöntemi DeepSeek-GRM sisteminin bir parçası olarak uygular. GRM, Generative Reward Modeling (Yaratıcı Ödül Modelleme) anlamına gelir. GRM, hem doğruluğu hem de tutarlılığı artırmak için paralel kontroller gerçekleştirdiği için geleneksel yöntemlerden farklı şekilde çalışır.
“Araştırmacılar, makalelerinde “Ölçeklenebilir ödül üretme davranışlarını teşvik etmek amacıyla Kendi İlkelerine Dayalı Eleştiri Ayarlama (SPCT) öneriyoruz,” diye yazdılar. “SPCT, [modelin] girdi sorgusu ve yanıtlara dayalı olarak ilkeler ve eleştirileri uyarlamasını sağlar, bu da daha iyi sonuç ödülleri elde edilmesine yol açar.”
Bu sistem sayesinde, DeepSeek, AI’sinin artık Google’ın Gemini’si, Meta’nın Llama’sı ve OpenAI’nin GPT-4o’su gibi rakiplerinden daha iyi performans gösterebildiğini iddia ediyor, özellikle mantık yürütme veya karar verme gibi karmaşık görevler söz konusu olduğunda, Euronews tarafından belirtildiği gibi.
Önemli olan, DeepSeek’in bu yeni araçları açık kaynak yazılım olarak yayınlama planları olduğunu belirtiyor, ancak henüz bir yayınlanma tarihi paylaşılmadı.
Yorum bırakın
Vazgeç