Alibaba, Yeni Qwen Yapay Zeka Modelini Yayınladı ve DeepSeek-V3’ü Geride Bıraktığını İddia Ediyor
Çinli dev Alibaba, amiral gemisi yapay zeka modeli Qwen’in en son versiyonunu bu Çarşamba yayınladı. Şirket, bu modelin popüler DeepSeek-V3’ten daha iyi performans gösterebileceğini iddia ediyor.
Acelesi Olanlar İçin İşte Kısa Bilgiler!
- Alibaba, en son mantık modeli Qwen 2.5-Max’ı bu Çarşamba yayınladı.
- Çin devi, popüler modeller olan DeepSeek-V3, GPT-4o ve Llama-3.1-405B’yi geride bıraktığını iddia ediyor.
- Şirket ayrıca bu hafta, resimleri işleyebilen ve bilgisayarlar ve mobil cihazları kullanarak görevleri yerine getirebilen bir AI ajanı olarak görev yapabilen Qwen2.5-VL adlı bir AI modeli de başlattı.
Reuters‘a göre, Alibaba, Çin’deki Ay Yeni Yılı tatilleri sırasında yeni mantık modelini, yani yeni Qwen 2.5-Max’ı piyasaya sürdü, böylece son birkaç gün içindeki büyük AI gelişmelerine katılmış oldu ve iç pazarda rekabeti artırdı.
Pazartesi günü, DeepSeek, Apple’ın App Store’da ABD’de birinci sıraya yükseldi, ChatGPT’yi geride bıraktı, AI sektöründeki diğer şirketleri endişelendirdi ve yatırımcıları alarma geçirdi—Nvidia hisseleri sadece bir günde %17 düştü.
Şimdi, Alibaba, Qwen modelinin en son sürümlerini duyurdu—geçen yıl Eylül ayında Qwen seti için 100 açık kaynaklı AI modeli yayınladı—popüler sınır modellerinden daha iyi sonuçlar vaat ediyor.
“Qwen 2.5-Max, hemen hemen her alanda GPT-4o, DeepSeek-V3 ve Llama-3.1-405B’yi geride bırakıyor,” diye yazdı şirket resmi WeChat hesabında.
Yeni akıl yürütme modeli Qwen 2.5-Max’in API’si Alibaba’nın bulutu üzerinden kullanılabilir ve kullanıcılar ayrıca modeli sohbet sayfasında da test edebilirler.
“20 trilyon token üzerinde önceden eğitilmiş ve Supervised Fine-Tuning (SFT) ve Reinforcement Learning from Human Feedback (RLHF) metodolojileriyle daha da post-egitim yapılmış büyük ölçekli bir MoE modeli olan Qwen2.5-Max’ı geliştiriyoruz,” diye yazdı Github’daki Qwen Takımı.
Çinli devi ayrıca Pazartesi günü Qwen2.5-VL‘yi yayınladı, bu da görüntüleri işleyebilen ve görevleri gerçekleştirmek için mobil cihazlara ve bilgisayarlara erişebilen çok modlu AI modelleri serisidir. OpenAI, Operator adlı benzer bir özellik duyurdu, bu özellik kullanıcının bilgisayarını otomatik olarak kontrol ederek ChatGPT’nin görevleri gerçekleştirmesine izin verir.
Alibaba ekibine göre, tüm Qwen modelleri OpenAI, Microsoft, Google, Meta ve DeepSeek’ten alınan benzer versiyonları geride bırakıyor.
Yorum bırakın
Vazgeç