Haberler
22 Oca 2025
Meta, geliştirdiği SeamlessM4T adlı yapay zeka modeli ile 101 farklı dilde sesli çeviri yapma yeteneği sunuyor. Bu model, gerçek zamanlı ve eş zamanlı çeviri imkanı sağlayarak konuşmaların anında başka bir dile çevrilmesini hedefliyor.
SeamlessM4T, sesli çeviri sürecini daha hızlı ve doğrudan bir hale getiriyor. Geleneksel çeviri yöntemleri, önce sesi metne çeviriyor, ardından metni başka bir dile çeviriyor ve son olarak bu metni sesli olarak iletiyor. Bu yöntem her aşamada hatalara yol açabiliyor. Ancak SeamlessM4T, sesli ifadeleri doğrudan başka bir dile çevirerek bu hataları minimuma indiriyor ve kullanım kolaylığı sunuyor.
Yeni model, metin çevirisinde mevcut en iyi modellerden %23 daha fazla doğruluk oranı sağlıyor. Google'ın AudioPaLM modeli, teknik olarak 113 dilde çeviri yapabilse de bu diller yalnızca İngilizceye çevrilebiliyor. SeamlessM4T ise 36 farklı dile çeviri yapabiliyor. Bu modelin başarısının arkasında, ses ve video verilerinin eşleştirilmesi için kullanılan paralel veri madenciliği süreci bulunuyor. Bu süreç, bir ses kaydındaki ifadelerin başka bir dildeki altyazılarla eşleştiği durumları tespit ediyor ve modelin bu eşleşmeleri öğrenmesini sağlıyor.
Araştırmacılar, insan çevirmenlerin kültürel bağlamları anlama becerileri sayesinde çeviri sürecinde hala kritik bir rol oynadığını vurguluyor. Özellikle tıbbi ve hukuki terimler gibi özel alanlarda insan kontrolünün gerekliliği ön plana çıkıyor. Meta'nın SeamlessM4T modeli, dil engellerini aşma konusunda önemli bir adım atarak gelecekte anlık çeviri teknolojilerinin daha da gelişmesini hedefliyor.