A.B.D. Araştırmacıları, 50 Doların Altında Bir Fiyata Gelişmiş Mantık Modeli Oluşturuyor

Photo by Sebastien Bonneval on Unsplash

A.B.D. Araştırmacıları, 50 Doların Altında Bir Fiyata Gelişmiş Mantık Modeli Oluşturuyor

Okuma süresi: 2 dk.

Washington Üniversitesi ve Stanford’dan Yapay Zeka araştırmacıları, bulut bilgisayar kredileriyle maliyeti 50 doların altında olan bir AI akıl yürütme modeli eğittiler – bu modelin adı s1. Ekip, metodolojilerinin daha fazla detayını içeren s1: Basit test zamanı ölçeklendirme adlı bir makale yayınladı bu Pazartesi.

Acele Mi Ettiniz? İşte Önemli Noktalar!

  • Washington Üniversitesi ve Stanford’dan yapay zeka araştırmacıları, bir AI akıl yürütme modelini 50 doların altında bir maliyetle eğitti ve araştırmalarını bu Pazartesi paylaştılar.
  • 1000 soruluk bir veri seti kullanarak, damıtma tekniği, bir test zamanı ölçeklendirme ve gözetimli ince ayar yöntemi kullandılar.
  • Model s1, DeepSeek R1 ve OpenAI o1 ile benzer şekilde performans göstermektedir.

TechCrunch‘a göre, yeni model, DeepSeek’in R1’i veya OpenAI’in o1’i gibi ileri modellerle benzer şekilde performans gösteriyor ve GitHub’da mevcut.

AI modelini geliştirmek için, araştırmacılar, daha büyük bir AI modelinin daha küçük bir modele veri sağladığı bir süreç olan damıtma sürecini uyguladılar—Google’ın Gemini 2.0 Flash Düşünme Deneyselinden akıl yürütme yetenekleri elde ettiler.

Bu süreç, AI endüstrisinde popülerlik kazanıyor, çünkü OpenAI, DeepSeek’in bu süreci, izinsiz bir şekilde, ileri seviye akıl yürütme modelini geliştirmek için kullandığını iddia ediyor. UC Berkeley’den Araştırmacılar da yakın zamanda bu teknikle bir akıl yürütme modelini 450 doların altında bir maliyetle eğitmeyi başardılar, bu da Silicon Valley’de tartışmalara ve büyük AI şirketleri arasında öfkeye neden oluyor.

Araştırmacılar, s1 modelini geliştirirken “test zamanı ölçeklendirme” yaklaşımını da dikkate aldılar – modelin bir yanıt vermeden önce durup daha fazla düşünmesini sağlayarak – ve AI mantıklı modelini oluşturmak için önceden eğitilmiş bir modelden gözetimli ince ayar yaptılar.

“Modelin düşünme sürecini zorla sonlandırarak veya ‘Bekle’ komutunu modelin üretimine birkaç kez ekleyerek uzatarak, test zamanı hesaplamasını kontrol etmek için bütçe zorlaması geliştiriyoruz,” diye belirtiyor makale. “Bu, modelin yanıtını iki kez kontrol etmesine ve genellikle yanlış mantığı düzeltmesine neden olabilir.”

Uzmanlar, Nvidia H100 GPU’ları kullanarak modelini 30 dakika içinde eğitmek için 1.000 adet özenle seçilmiş soru ve cevaptan oluşan bir veri seti kullandılar. Bu, küçük bir veritabanı ile ve diğer teknolojileri ve AI modellerini kullanarak ileri sonuçlara ulaşmanın mümkün olduğunu gösterdi.

“OpenAi’nin o1 ve DeepSeek’in R1 gibi son zamanlardaki mantık yürütme ilerlemeleri, geniş kapsamlı araştırma ilerlemesini sınırlayan bir şeffaflık eksikliği gösteriyor,” diye yazdı araştırmacılar. “Bizim çalışmamız, tamamen açık bir şekilde mantık yürütmenin sınırlarını zorlamayı hedefliyor, yenilik ve işbirliğini teşvik ederek, sonuçta topluma fayda sağlayacak ilerlemeleri hızlandırıyor.”

Bu makaleyi beğendiniz mi?
Puan verin!
Hiç sevmedim Pek beğenmedim Fena değildi Gayet iyiydi! Bayıldım!

Çalışmamızı beğenmeniz bizi çok mutlu etti!

Değerli bir okuyucumuz olarak Trustpilot sitesinde bizi puanlamak ister miydiniz? Bu hemen halledilebilen bir işlemdir ve emin olun ki görüşünüz bizim için çok kıymetlidir. Desteğiniz için ne kadar teşekkür etsek az!

Trustpilot'ta bize puan ver
0 0 kullanıcı tarafından oy verildi
Başlık
Yorum
Geri bildiriminiz için teşekkür ederiz
Loader
Please wait 5 minutes before posting another comment.
Comment sent for approval.

Yorum bırakın

Loader
Loader Devamını oku...