Home » Genel » Qwen’den agentic kodlama için açık kaynaklı yeni model: Qwen3-Coder-Next




Qwen’den agentic kodlama için açık kaynaklı yeni model: Qwen3-Coder-Next

Çin merkezli e-ticaret devi Alibaba’nın yapay zeka araştırmacılarından oluşan Qwen ekibi, bu hafta, vibe coding’e odaklanan Qwen3-Coder-Next ile karşımıza çıktı. 80 milyar parametreli özel bir model olan Qwen3-Coder-Next, ileri geçiş başına yalnızca 3 milyar parametreyi etkinleştiren ultra seyrek Mixture-of-Experts (MoE) mimarisini kullanıyor. Bu tasarım sayesinde model, hafif bir yerel modelin düşük dağıtım maliyetlerini ve yüksek verimini koruyor. Aynı şekilde devasa özel sistemlerle rekabet edebilecek akıl yürütme yetenekleri sunuyor. 

Qwen3-Coder-Next’in mimarisi ve eğitim süreci

Qwen3-Coder-Next’in geleneksel Transformer’ları etkileyen ikinci dereceden ölçeklendirme sorunlarını aşmak için özel olarak tasarlanmış bir hibrit mimarden yararlandığını söyleyebiliriz. Böylece model, uzun vadeli akıl yürütmede tipik olan aşırı detaylı ⇒

Alıntının kaynağı: Webrazzi

Bir cevap yazın

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir

*