Kâr Amacı Gütmeyen Organizasyon Ai2, Meta’nın Llama’sı ile Rekabet Edebilecek Yeni bir LLM Yayınladı

Photo by Sigmund on Unsplash

Kâr Amacı Gütmeyen Organizasyon Ai2, Meta’nın Llama’sı ile Rekabet Edebilecek Yeni bir LLM Yayınladı

Okuma süresi: 2 dk.

Kâr amacı gütmeyen araştırma kuruluşu olan The Allen Institute for Artificial Intelligence (Ai2), Meta’nın Llama 3.1 gibi piyasadaki önde gelen modellerle karşılaştırılabilir araçlar ve yeteneklere sahip olan açık dil modelinin ikinci ailesi OLMo 2’yi başlattı.

Acele Mi Ediyorsunuz? İşte Hızlı Gerçekler!

  • Ai2, dün gelişmiş ve açık kaynaklı bir dil modeli olan OLMo 2’yi piyasaya sürdü
  • Organizasyon, bunu “bugüne kadar en iyi tamamen açık dil modeli” olarak tanımlıyor
  • OLMo 2, Meta’nın Llama 3.1 gibi diğer açık kaynaklı modellerle rekabet ediyor

Microsoft’un kurucu ortağı Paul Allen tarafından 2014’te kurulan Ai2, bu modeli “bugüne kadarki en iyi tamamen açık dil modeli” olarak tanımladı.

“Yeni bir model ailesi olan OLMo 2’yi, 7B ve 13B modelleri ile birlikte 5T token üzerinde eğitilmiş olarak tanıtıyoruz,” diye yazdı organizasyon, web sitesindeki bir duyurusunda. “Bu modeller, tamamen açık modellerle eşdeğer veya daha iyidir ve İngilizce akademik referanslar üzerinde Llama 3.1 gibi açık ağırlık modelleri ile rekabet ederler.”

OLMo 2, yıl boyunca yayınlanan model versiyonlarının bir yükseltmesinin sonucudur – Ai2 ilk modeli olan OLMo’yu Şubat ayında duyurmuştur – eğitim kararlılığı, ön eğitim, son teknoloji sonrası eğitim ve bir değerlendirme çerçevesi aracılığıyla performans gibi kritik aspectlerin iyileştirilmesine odaklanılmıştır.

Yeni model şu anda sadece İngilizce olarak mevcut ve halkın OLMo 2’yi test etmesi için bir çevrimiçi demo sunulmaktadır.

TechCrunch’a göre, OLMo 2, verileri ve araçları halka açık ve test edilmeye hazır olduğu için açık kaynaklı bir AI olarak kabul edilme kriterlerini karşılıyor.

Ai2, bu yeni modelin benzer yapıdaki diğer popüler modelleri aşabildiğini kanıtlayan verileri paylaştı.

“OLMo 2 7B ve 13B’nin bugüne kadar geliştirilen en iyi tamamen açık modeller olduğunu görüyoruz, genellikle eşdeğer büyüklükteki açık ağırlık modellerini sıklıkla geçiyorlar,” diye belirtiyor kuruluş tarafından paylaşılan belgede. “Sadece daha önceki OLMo 0424 modelimize kıyasla tüm görevlerde ciddi bir performans artışı gözlemlemekle kalmıyoruz, belirgin olarak, OLMo 2 7B, LLama-3.1 8B’yi ve OLMo 2 13B, daha düşük toplam eğitim FLOPs’una rağmen Qwen 2.5 7B’yi geride bırakıyor.”

Alibaba, yeni Qwen 2.5 modellerini yayınladı, Eylül ayında Ai2 tarafından karşılaştırma için değerlendirildi.

Bu makaleyi beğendiniz mi?
Puan verin!
Hiç sevmedim Pek beğenmedim Fena değildi Gayet iyiydi! Bayıldım!

Çalışmamızı beğenmeniz bizi çok mutlu etti!

Değerli bir okuyucumuz olarak Trustpilot sitesinde bizi puanlamak ister miydiniz? Bu hemen halledilebilen bir işlemdir ve emin olun ki görüşünüz bizim için çok kıymetlidir. Desteğiniz için ne kadar teşekkür etsek az!

Trustpilot'ta bize puan ver
0 0 kullanıcı tarafından oy verildi
Başlık
Yorum
Geri bildiriminiz için teşekkür ederiz
Loader
Please wait 5 minutes before posting another comment.
Comment sent for approval.

Yorum bırakın

Loader
Loader Devamını oku...