Nvidia ve Mistral AI’ın kurumsal yapay zekayı bilgisayarlara taşıyan yeni modeli: Mistral-NeMo
Temmuz 19, 2024 | Posted by SiberBulucu.Com under Genel |
|

Gemma 2 9B ve Llama 3 8B ile karşılaştırılan Mistral-NeMo, Llama 3 8B’yi tüm ölçütlerde, Gemma 2 9B ‘yi ise MMLU (Kitlesel Çoklu Görev Dil Anlayışı) ölçütü dışında tüm ölçütlerde geride bırakıyor.
Farkındaysanız, son bir kaç haftadır küçük yapay zeka modelleri gündemimizde. Meta’dan OpenAI’a şirketler art arda yeni küçük modellerini duyurarak cihaz üzerinde çalışan bu küçük modellerin yapay zeka erişimini artırabileceğine dikkat çekiyor. Meta AI ekibi mobil cihazlar için kompakt büyük dil modeli yaklaşımı
Belli bir süre dünyanın en değerli şirketi olmayı başaran Nvidia ve Avrupa’nın yapay zeka yıldızı Mistral AI ile gücünü birleştirerek yeni yapay zeka modeli Mistral-NeMo’yu tanıttı. Bu yeni model, 12 milyar parametre ve 128 bin token’lık geniş bir bağlam penceresine sahip. Güçlü yapay zeka yetenekleriyle dikkat çeken modelin doğrudan iş bilgisayarlarında çalışması hedefleniyor.
Nvidida’Nın paylaştığı bilglere göre; model, NVIDIA NeMo’nun bir parçası olan Megatron-LM kullanılarak, NVIDIA AI mimarisinden oluşan DGX Cloud üzerinde 3.072 H100 80GB Tensor Core GPU ile eğitildi.
Nvidia uygulamalı derin öğrenme araştırmaları başkan yardımcısı Ryan Catanzaro‘nun aktardıklarına göre; model Apache 2.0 lisansı altında piyasaya sürülüyor. detaylı ⇒
Alıntının kaynağı: Webrazzi