Home » Genel » Meta’dan 1600 dili tanıyabilen konuşma tanıma sistemi: Omnilingual ASR




Meta’dan 1600 dili tanıyabilen konuşma tanıma sistemi: Omnilingual ASR

Meta’nın Temel Yapay Zeka Araştırmaları (FAIR) ekibi, Omnilingual ASR‘ı tanıttı. Omnilingual ASR, 1600’den fazla konuşulan dili yazıya dönüştürebilen otomatik konuşma tanıma sistemi olarak karşımıza çıkıyor. Omnilingual ASR ailesi, 300 milyon parametreli hafif bir sürümden 7 milyar parametreli bir sürüme kadar çeşitli modeller içeriyor. Tüm modeller FAIR’ın PyTorch tabanlı fairseq2 framework’üne dayalı. Konuşulan dili yazılı metne dönüştürmek için eğitilen modeller, sesli asistanlar, transkripsiyon araçları, altyazılar, sözlü arşiv dijitalleştirme ve kaynakları kısıtlı diller için erişilebilirlik özellikleri gibi uygulamaları destekliyor. 

Aslında şimdiye kadar, pek çok konuşma tanıma aracının, bol miktarda transkripsiyonlu ses kaydı bulunan yüzlerce dile odaklandığını gördük. Örneğin, bu alanda popülerliğiyle öne çıkan detaylı ⇒

Alıntının kaynağı: Webrazzi

Bir cevap yazın

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir

*