Qwen’den agentic kodlama için açık kaynaklı yeni model: Qwen3-Coder-Next
| Şubat 4, 2026 | Posted by SiberBulucu.Com under Genel |
|
Çin merkezli e-ticaret devi Alibaba’nın yapay zeka araştırmacılarından oluşan Qwen ekibi, bu hafta, vibe coding’e odaklanan Qwen3-Coder-Next ile karşımıza çıktı. 80 milyar parametreli özel bir model olan Qwen3-Coder-Next, ileri geçiş başına yalnızca 3 milyar parametreyi etkinleştiren ultra seyrek Mixture-of-Experts (MoE) mimarisini kullanıyor. Bu tasarım sayesinde model, hafif bir yerel modelin düşük dağıtım maliyetlerini ve yüksek verimini koruyor. Aynı şekilde devasa özel sistemlerle rekabet edebilecek akıl yürütme yetenekleri sunuyor.
Qwen3-Coder-Next’in mimarisi ve eğitim süreci
Qwen3-Coder-Next’in geleneksel Transformer’ları etkileyen ikinci dereceden ölçeklendirme sorunlarını aşmak için özel olarak tasarlanmış bir hibrit mimarden yararlandığını söyleyebiliriz. Böylece model, uzun vadeli akıl yürütmede tipik olan aşırı detaylı ⇒
Alıntının kaynağı: Webrazzi
