Home » Genel » Gemini 3 Flash’ın görsel muhakeme ile kod yürütmeyi birleştiren yeni yeteneği: Agentic Vision




Gemini 3 Flash’ın görsel muhakeme ile kod yürütmeyi birleştiren yeni yeteneği: Agentic Vision

Google, Gemini 3 Flash için Agentic Vision yeteneklerini duyurdu. Şirket, Gemini gibi ileri seviye modellerin genellikle dünyayı tek bir statik bakışta işlediğini belirtiyor. Bu modeller, mikroçipteki seri numarası veya uzaktaki bir sokak levhası gibi ince ayrıntıları kaçırırlarsa, tahmin yapmak zorunda kalıyor. Gemini 3 Flash’taki Agentic Vision ise görüntü anlamayı statik bir eylemden ajansal bir sürece dönüştürüyor. Agentic Vision’ı Gemini 3 Flash modelinin, cevapları görsel kanıtlara dayandırarak görüntüyle ilgili görevleri daha doğru hale getirmek için geliştirdiği yeni bir yetenek olarak tanımlayabiliriz. 

Model, görsel muhakemeyi, Agentic Vision tarafından desteklenen ilk araçlardan biri olan kod yürütme ile birleştirerek, görüntüleri adım adım yakınlaştırmak, detaylı ⇒

Alıntının kaynağı: Webrazzi

Bir cevap yazın

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir

*