DeepSeek, Şimdiye Kadarki En Güçlü Açık Kaynaklı Yapay Zeka Olan 3V Modelini Tanıttı
Çinli AI şirketi DeepSeek, bu hafta en son açık kaynaklı modeli DeepSeek-V3’ü yayınladı. Startup, yeni büyük modelinin 671B parametreye sahip olduğunu ve OpenAI’nin GPT-4o’su ve Anthropic’in Claude-Sonnet-3.5’i gibi öncü modellerden daha iyi performans gösterebileceğini iddia ediyor.
Acele mi Ediyorsunuz? İşte Hızlı Bilgiler!
- DeepSeek, en yeni AI modeli DeepSeek-V3’ü yayınlayarak, bu modelin GPT 4o ve Claude-Sonnet-3.5’ten daha iyi performans gösterdiğini iddia etti.
- Çinli AI şirketi, yeni modelin 671B parametre içerdiğini ve önceki modele göre üç kat daha hızlı olduğunu açıkladı.
- DeepSeek-V3 şimdi piyasadaki en güçlü açık kaynaklı AI modeli
Kullanıcılar, resmi web sitesi üzerinden modelle etkileşim kurabilir, şirketin makalesini okuyabilir ve Hugging Face üzerinden modele erişebilirler. DeepSeek, bu yeni modelin Kasım ayında yayınlanan önceki sürümden üç kat daha hızlı olduğunu ve gelişmiş kapasiteler ile API uyumluluğuna sahip olduğunu belirtti.
🚀 DeepSeek-V3’ü tanıtıyoruz!
Şimdiye kadarki en büyük ilerleme:
⚡ Saniyede 60 token (V2’den 3x daha hızlı!)
💪 Gelişmiş özellikler
🛠 API uyumluluğu korundu
🌍 Tamamen açık kaynaklı modeller & makaleler🐋 1/n pic.twitter.com/p1dV9gJ2Sd
— DeepSeek (@deepseek_ai) 26 Aralık, 2024
“DeepSeek-V3’ü sunuyoruz, toplamda 671B parametre içeren ve her bir token için 37B’si aktif olan güçlü bir Karışım-uzmanları (MoE) dil modeli,” diye yazdı şirket GitHub üzerinde. “Kapsamlı değerlendirmeler, DeepSeek-V3’ün diğer açık kaynaklı modelleri geride bıraktığını ve önde gelen kapalı kaynaklı modellerle karşılaştırılabilir bir performans sergilediğini ortaya koymaktadır.”
Birçok kullanıcı, organizasyon ve şirket, DeepSeek’in başarısını kutladı. Hugging Face X üzerinden “Muhteşem bir yayın için tebrikler!” yazdı, “Model kontrol noktaları ve ayrıntılı bir rapor – gerçekten de Noel burada!”
Andrej Karpathy—eski OpenAI araştırmacısı ve Tesla’nın AI başkanı—birkaç düşünce de paylaştı. “DeepSeek (Çinli AI şirketi) bugün sınırları zorlayan bir LLM’nin açık ağırlık yayınını, komik bir bütçeyle (2 ay boyunca 2048 GPU, 6M $) kolay gösteriyor.”
DeepSeek-V3 şimdi piyasadaki en güçlü açık kaynaklı AI modellerinden biri ve ücretli API’si piyasadaki en uygun fiyatlılar arasında yerini koruyor.
Yorum bırakın
Vazgeç