Photo by Sigmund on Unsplash

Kâr Amacı Gütmeyen Organizasyon Ai2, Meta’nın Llama’sı ile Rekabet Edebilecek Yeni bir LLM Yayınladı

Okuma süresi: 2 dk.

Son Güncellenen Nov 28, 2024

Yazan Andrea Miliani Teknoloji Haberleri Uzmanı
Çevirisi tarafından yapılmıştır Lokalizasyon ve Çeviri Ekibi Lokalizasyon ve Çeviri Hizmetleri

Kâr amacı gütmeyen araştırma kuruluşu olan The Allen Institute for Artificial Intelligence (Ai2), Meta’nın Llama 3.1 gibi piyasadaki önde gelen modellerle karşılaştırılabilir araçlar ve yeteneklere sahip olan açık dil modelinin ikinci ailesi OLMo 2’yi başlattı.

Acele Mi Ediyorsunuz? İşte Hızlı Gerçekler!

Ai2, dün gelişmiş ve açık kaynaklı bir dil modeli olan OLMo 2’yi piyasaya sürdü
Organizasyon, bunu “bugüne kadar en iyi tamamen açık dil modeli” olarak tanımlıyor
OLMo 2, Meta’nın Llama 3.1 gibi diğer açık kaynaklı modellerle rekabet ediyor

Microsoft’un kurucu ortağı Paul Allen tarafından 2014’te kurulan Ai2, bu modeli “bugüne kadarki en iyi tamamen açık dil modeli” olarak tanımladı.

“Yeni bir model ailesi olan OLMo 2’yi, 7B ve 13B modelleri ile birlikte 5T token üzerinde eğitilmiş olarak tanıtıyoruz,” diye yazdı organizasyon, web sitesindeki bir duyurusunda. “Bu modeller, tamamen açık modellerle eşdeğer veya daha iyidir ve İngilizce akademik referanslar üzerinde Llama 3.1 gibi açık ağırlık modelleri ile rekabet ederler.”

OLMo 2, yıl boyunca yayınlanan model versiyonlarının bir yükseltmesinin sonucudur – Ai2 ilk modeli olan OLMo’yu Şubat ayında duyurmuştur – eğitim kararlılığı, ön eğitim, son teknoloji sonrası eğitim ve bir değerlendirme çerçevesi aracılığıyla performans gibi kritik aspectlerin iyileştirilmesine odaklanılmıştır.

Yeni model şu anda sadece İngilizce olarak mevcut ve halkın OLMo 2’yi test etmesi için bir çevrimiçi demo sunulmaktadır.

TechCrunch’a göre, OLMo 2, verileri ve araçları halka açık ve test edilmeye hazır olduğu için açık kaynaklı bir AI olarak kabul edilme kriterlerini karşılıyor.

Ai2, bu yeni modelin benzer yapıdaki diğer popüler modelleri aşabildiğini kanıtlayan verileri paylaştı.

“OLMo 2 7B ve 13B’nin bugüne kadar geliştirilen en iyi tamamen açık modeller olduğunu görüyoruz, genellikle eşdeğer büyüklükteki açık ağırlık modellerini sıklıkla geçiyorlar,” diye belirtiyor kuruluş tarafından paylaşılan belgede. “Sadece daha önceki OLMo 0424 modelimize kıyasla tüm görevlerde ciddi bir performans artışı gözlemlemekle kalmıyoruz, belirgin olarak, OLMo 2 7B, LLama-3.1 8B’yi ve OLMo 2 13B, daha düşük toplam eğitim FLOPs’una rağmen Qwen 2.5 7B’yi geride bırakıyor.”

Alibaba, yeni Qwen 2.5 modellerini yayınladı, Eylül ayında Ai2 tarafından karşılaştırma için değerlendirildi.

Kâr Amacı Gütmeyen Organizasyon Ai2, Meta’nın Llama’sı ile Rekabet Edebilecek Yeni bir LLM Yayınladı

Çalışmamızı beğenmeniz bizi çok mutlu etti!

Yorum bırakın