Faydalı İnternet Bulucusu...
Çin merkezli e-ticaret devi Alibaba’nın yapay zeka araştırmacılarından oluşan Qwen ekibi, bu hafta, vibe coding’e odaklanan Qwen3-Coder-Next ile karşımıza çıktı. 80 milyar parametreli özel bir model olan Qwen3-Coder-Next, ileri geçiş başına yalnızca 3 milyar parametreyi etkinleştiren ultra seyrek Mixture-of-Experts (MoE) mimarisini kullanıyor. Bu tasarım sayesinde model, hafif bir yerel modelin düşük dağıtım maliyetlerini ve yüksek verimini koruyor. Aynı şekilde devasa özel sistemlerle rekabet edebilecek akıl yürütme yetenekleri sunuyor.
Qwen3-Coder-Next’in geleneksel Transformer’ları etkileyen ikinci dereceden ölçeklendirme sorunlarını aşmak için özel olarak tasarlanmış bir hibrit mimarden yararlandığını söyleyebiliriz. Böylece model, uzun vadeli akıl yürütmede tipik olan aşırı detaylı ⇒
Alıntının kaynağı: Webrazzi
SiberBulucu.Com © 2019... ALL RIGHTS RESERVED... SiberBulucu.Com dış linklerdeki ve kaynaklardakı içerikler, alıntılar için sorumlu değildir!...
Gizlilik politikası