Araştırmacılar, OpenAI ve DeepSeek’i Rakip Eden AI Modelini Sadece 50 Dolar’a İnşa Ediyorlar

Image by lucabravo, from Freepik

Araştırmacılar, OpenAI ve DeepSeek’i Rakip Eden AI Modelini Sadece 50 Dolar’a İnşa Ediyorlar

Okuma süresi: 3 dk.

Stanford ve Washington Üniversitesi’nden bir grup AI araştırmacısı, bulut bilişim maliyetlerinde 50 doların altında bir maliyetle yüksek performanslı bir AI mantık modeli eğittiler. Bu durum, ilk olarak TechCrunch tarafından bildirildiği gibi, geçtiğimiz Cuma günü yayınlanan bir araştırma makalesine göre gerçekleşti.

Acele mi Ediyorsunuz? İşte Hızlı Bilgiler!

  • Araştırmacılar, bulut bilgisayar maliyetlerinde 50 doların altında bir maliyetle bir AI mantık modeli eğittiler.
  • Model, s1, OpenAI’nin o1’i ve DeepSeek’in R1’i kadar iyi performans gösteriyor.
  • s1, eğitim verileri ve koduyla birlikte GitHub’da açık kaynaklı olarak mevcuttur.

s1 adı verilen model, matematik ve kodlama testlerinde OpenAI’nin o1 ve DeepSeek’in R1 gibi gelişmiş mantık AI’ları kadar performans gösteriyor. Model, eğitim verileri ve kodları ile birlikte GitHub üzerinde ücretsiz olarak mevcuttur.

S1’i geliştirmek için araştırmacılar, zaten mevcut olan bir AI modeli ile başladılar ve onu damıtma adı verilen bir süreç kullanarak ince ayar yaptılar. Bu yöntem, daha gelişmiş bir AI’den yanıtları üzerinde eğitim yaparak akıl yürütme yeteneklerini çıkarır.

Ekip, s1’in Google’ın Gemini 2.0 Flash Düşünme Deneysel modelinden damıtıldığını açıkladı.

Araştırmacı grubu, zorlu matematik ve mantık problemlerini çözmede OpenAI’nin o1-preview modeliyle yarışabilecek bir açık kaynaklı AI modeli oluşturdu. Onların sırrı mı? AI’ya cevap vermeden önce daha fazla düşünme zamanı veren basit bir hile.

“Bütçe zorlama” olarak adlandırılan yöntem, AI’ın sorunları çözerken ekstra adımlar atmasını sağlayarak hızla bir yanıta koşmak yerine işlem yapmasını sağlar. Kendine daha fazla zaman vererek, AI işini çift kontrol edebilir ve doğruluğunu artırabilir.

Ekip, modelini, s1-32B olarak isimlendirilen, sadece dikkatlice seçilmiş 1,000 örnek soru ve aşama aşama açıklamaları kullanarak eğitti.

Bu küçük veri setine rağmen, model, MATH ve AIME24 gibi karmaşık matematik testlerinde OpenAI’nin o1-preview modelinden daha iyi performans göstererek sonuçları %27’ye kadar iyileştirdi. Model hatta, cevapları sonlandırmadan önce daha uzun süre düşünerek, ekstra bir eğitime gerek kalmadan test puanını %50’den %57’ye çıkarmayı başardı.

Bu büyük bir konu çünkü çoğu AI iyileştirmesi, yeni eğitim verilerinin büyük miktarına dayanıyor. Ancak bu araştırma, birçok AI modelinin zaten kendilerinde gizli güçlü muhakeme yeteneklerine sahip olduğunu – onların kilidini açmak için doğru tekniklere ihtiyaçları olduğunu öneriyor.

Çalışma ayrıca bir AI’nin düşünme süresini uzatmanın farklı yollarını da test etti. Bir yöntem, AI’ın cevaplarını adım adım rafine etmesine izin verirken, diğer bir yöntem birden çok olası cevap üretmesini ve en iyisini seçmesini içeriyordu. Her ikisinin bir kombinasyonu, ağaç benzeri bir karar süreci kullanarak en iyi sonucu verdi.

Bu teknik sınırlara sahipken—örneğin AI’ın hesaplamalar için bellek alanı gibi— araştırmacılar, daha fazla ince ayarın yeteneklerini daha da ileriye götürebileceğine inanıyorlar. Ayrıca, AI’nın deneme yanılma yoluyla öğrenme yöntemi olan pekiştirmeli öğrenmenin, test zamanı düşüncesini daha da akıllı hale getirebileceğini öneriyorlar.

Model ve araştırmalarını serbestçe kullanılabilir hale getirerek, ekip daha açık ve şeffaf AI gelişimini teşvik etmeyi umuyor, başkalarına daha akıllı ve daha güvenilir AI sistemleri oluşturmalarına yardımcı oluyor.

Bu makaleyi beğendiniz mi?
Puan verin!
Hiç sevmedim Pek beğenmedim Fena değildi Gayet iyiydi! Bayıldım!

Çalışmamızı beğenmeniz bizi çok mutlu etti!

Değerli bir okuyucumuz olarak Trustpilot sitesinde bizi puanlamak ister miydiniz? Bu hemen halledilebilen bir işlemdir ve emin olun ki görüşünüz bizim için çok kıymetlidir. Desteğiniz için ne kadar teşekkür etsek az!

Trustpilot'ta bize puan ver
0 0 kullanıcı tarafından oy verildi
Başlık
Yorum
Geri bildiriminiz için teşekkür ederiz
Loader
Please wait 5 minutes before posting another comment.
Comment sent for approval.

Yorum bırakın

Loader
Loader Devamını oku...