Hugging Face’in 8 milyar parametreye sahip yeni açık kaynak görsel dil modeli: Idefics2
Nisan 16, 2024 | Posted by SiberBulucu.Com under Genel |
|
2023 yılında DeepMind’ın teknolojisini kullanarak Idefics görsel dil modelini piyasaya süren Hugging Face, şimdi de modelin yeni yükseltmesi Idefics2 ile karşımızda. Idefics2, daha küçük bir parametre boyutu, açık bir lisans ve geliştirilmiş Optik Karakter Tanıma (OCR) yeteneklerine sahip.
Model kıyaslamaları
Bilmeyenler için Idefics’in metin ve görüntü istemlerine yanıt verebilen genel bir çok modlu (multimodal) model olduğunu belirtelim. Idefics 80 milyar parametre boyutuna sahipken, Idefics2, 8 milyar ile Idefics’in onda biri boyutunda. Bu anlamda Idefics2, DeepSeek-VL ve LLaVA-NeXT-Mistral-7B ile karşılaştırılabilir.
Öte yandan Hugging Face’in paylaştığı bilgilere göre Idefics2, Görsel Soru Yanıtlama kıyaslamalarındaki performansı ile LLava-Next-34B ve MM1-30B-chat gibi çok daha büyük modellerle detaylı ⇒
Alıntının kaynağı: Webrazzi