Home » Genel » Google DeepMind’dan metin üretimini 4 kata kadar hızlandıran açık model: DiffusionGemma




Google DeepMind’dan metin üretimini 4 kata kadar hızlandıran açık model: DiffusionGemma

Google DeepMind, metin difüzyonunu araştıran deneysel açık kaynak yapay zeka modeli DiffusionGemma’yı duyurdu. Gemma 4 açık model ailesinin yeni bir üyesi olan DiffusionGemma, çoğu yapay zeka modeli gibi çıktıları doğrusal bir şekilde üretmiyor. Bunun yerine, bir metin bloğunun tamamını paralel olarak üretebiliyor. Google’ın paylaştığı bilgilere göre, bu özellik, modelin Nvidia DGX gibi yerel donanımlarda ya da sıradan bir oyun GPU’sunda çalıştırıldığında daha hızlı ve verimli olmasını sağlıyor.

Apache 2.0 lisansı ile yayınlanan DiffusionGemma, 26 milyar parametreli bir Mixture of Experts modeli olarak konumlanıyor. Ancak model, çıkarım sırasında yalnızca 3,8 milyar parametreyi aktif hale getiriyor. Google, modelin quantize edildiğinde 18 GB VRAM detaylı ⇒

Alıntının kaynağı: Webrazzi

Bir cevap yazın

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir

*