Meta’dan 1600 dili tanıyabilen konuşma tanıma sistemi: Omnilingual ASR
| Kasım 11, 2025 | Posted by SiberBulucu.Com under Genel |
|
Meta’nın Temel Yapay Zeka Araştırmaları (FAIR) ekibi, Omnilingual ASR‘ı tanıttı. Omnilingual ASR, 1600’den fazla konuşulan dili yazıya dönüştürebilen otomatik konuşma tanıma sistemi olarak karşımıza çıkıyor. Omnilingual ASR ailesi, 300 milyon parametreli hafif bir sürümden 7 milyar parametreli bir sürüme kadar çeşitli modeller içeriyor. Tüm modeller FAIR’ın PyTorch tabanlı fairseq2 framework’üne dayalı. Konuşulan dili yazılı metne dönüştürmek için eğitilen modeller, sesli asistanlar, transkripsiyon araçları, altyazılar, sözlü arşiv dijitalleştirme ve kaynakları kısıtlı diller için erişilebilirlik özellikleri gibi uygulamaları destekliyor.
Aslında şimdiye kadar, pek çok konuşma tanıma aracının, bol miktarda transkripsiyonlu ses kaydı bulunan yüzlerce dile odaklandığını gördük. Örneğin, bu alanda popülerliğiyle öne çıkan detaylı ⇒
Alıntının kaynağı: Webrazzi
