DeepSeek’in Yapay Zekası Kendi Kendine Düşünmeyi Öğreniyor

Image by Matheus Bertelli, from Pexels

DeepSeek’in Yapay Zekası Kendi Kendine Düşünmeyi Öğreniyor

Okuma süresi: 2 dk.

Çinli girişim DeepSeek, Tsinghua Üniversitesi ile ortaklaşa, yapay zeka modellerinin daha iyi ve hızlı düşünmelerine yardımcı olabilecek daha zeki bir yol geliştirdiğini söylüyor, ve bunu devasa bilgisayarlara veya pahalı kaynaklara ihtiyaç duymadan yapıyor.

Acelesi olanlar için hızlı bilgiler:

  • DeepSeek, Kendi İlkelerine Dayalı Eleştirel Ayarlama (SPCT) kullanarak kendini geliştiren bir AI oluşturdu.
  • SPCT, AI’ya kendi oluşturduğu kurallarla kendi işini değerlendirmeyi öğretir.
  • Bu yöntem, devasa bir hesaplama gücü olmadan performansı artırır.

Bu ilerleme, Self-Principled Critique Tuning (SPCT) adı verilen yeni bir teknikten geliyor. SPCT, AI modellerini daha büyük yaparak performansı artırmaktan farklıdır – SPCT, AI’ya kendi işini kendisi oluşturduğu bir dizi kural kullanarak değerlendirmeyi öğretmek için çok fazla enerji ve hesaplama gücü gerektirmez.

İşleyiş biçimi, AI’nin yanıtının hem dahili akıl yürütme kurallarına uyduğunu hem de insan çıktısı için uygun göründüğünü doğrulayan yerleşik bir “hakem” aracılığıyladır. AI, sağlam bir yanıt sağladığında olumlu geri bildirim alır, bu da benzer soruları gelecekteki durumlarda yanıtlama yeteneğini geliştirmesine yardımcı olur.

DeepSeek, bu yöntemi DeepSeek-GRM sisteminin bir parçası olarak uygular. GRM, Generative Reward Modeling (Yaratıcı Ödül Modelleme) anlamına gelir. GRM, hem doğruluğu hem de tutarlılığı artırmak için paralel kontroller gerçekleştirdiği için geleneksel yöntemlerden farklı şekilde çalışır.

“Araştırmacılar, makalelerinde “Ölçeklenebilir ödül üretme davranışlarını teşvik etmek amacıyla Kendi İlkelerine Dayalı Eleştiri Ayarlama (SPCT) öneriyoruz,” diye yazdılar. “SPCT, [modelin] girdi sorgusu ve yanıtlara dayalı olarak ilkeler ve eleştirileri uyarlamasını sağlar, bu da daha iyi sonuç ödülleri elde edilmesine yol açar.”

Bu sistem sayesinde, DeepSeek, AI’sinin artık Google’ın Gemini’si, Meta’nın Llama’sı ve OpenAI’nin GPT-4o’su gibi rakiplerinden daha iyi performans gösterebildiğini iddia ediyor, özellikle mantık yürütme veya karar verme gibi karmaşık görevler söz konusu olduğunda, Euronews tarafından belirtildiği gibi.

Önemli olan, DeepSeek’in bu yeni araçları açık kaynak yazılım olarak yayınlama planları olduğunu belirtiyor, ancak henüz bir yayınlanma tarihi paylaşılmadı.

Bu makaleyi beğendiniz mi?
Puan verin!
Hiç sevmedim Pek beğenmedim Fena değildi Gayet iyiydi! Bayıldım!

Çalışmamızı beğenmeniz bizi çok mutlu etti!

Değerli bir okuyucumuz olarak Trustpilot sitesinde bizi puanlamak ister miydiniz? Bu hemen halledilebilen bir işlemdir ve emin olun ki görüşünüz bizim için çok kıymetlidir. Desteğiniz için ne kadar teşekkür etsek az!

Trustpilot'ta bize puan ver
0 0 kullanıcı tarafından oy verildi
Başlık
Yorum
Geri bildiriminiz için teşekkür ederiz
Loader
Please wait 5 minutes before posting another comment.
Comment sent for approval.

Yorum bırakın

Loader
Loader Devamını oku...