Podcast yayıncılarının bir düğmeye basıldığında anında başka bir dil konuşabildiğini hayal edin. Spotify’ın yeni yapay zeka destekli Voice Translation (ses çeviri) özelliğinin arkasındaki fikir bu. Podcast yayıncısının kendi sesini kullanarak diğer dillerdeki podcast’leri yeniden üretiyor.
Şimdilik yalnızca bir grup podcast yayıncısının programlarında ses çevirisi var
Şirket, bu yeniliği tanıtmak için bir dizi popüler podcast yayıncısıyla ortaklık kurmuş ve onların İngilizce yayınlarını İspanyolcaya çevirmiş.Önümüzdeki haftalarda Fransızca ve Almanca çevirileri de kullanıma sunmayı planlıyor. İlk etapta ortaklık kurulan podcast yayıncıları arasında; Steven Bartlett, Dax Shepard, Monica Padman, Lex Fridman ve Bill Simmons gibi büyük isimler yer alıyor. Spotify, bu grubu The Ringer’dan The Rewatchables’ı ve Trevor Noah’ın gelecek şovunu da içerecek şekilde genişletmeyi planlıyor.
Spotify’ın kurucu CEO’su Daniel Ek, aşağıdaki videoyu paylaştı ve kullanıcıların fikrini sordu:
Podcasters – what if I told you could offer your pod to any listener around the world, in their own local language but still keep it in your own voice? That’s the pilot we’re launching @Spotify!
It’s called Voice Translation and using AI, translates podcasts episodes into… pic.twitter.com/kYq0bgxJYq
— Daniel Ek (@eldsjal) September 25, 2023
Çeviri özelliğinin omurgası, OpenAI’ın hem İngilizce konuşmaları yazıya dökebilen hem de diğer dilleri İngilizceye çevirebilen ses transkripsiyon aracı Whisper. Artık Spotify’ın aracı, konuşmadan metne çevirinin ötesine geçiyor; bir podcast’i farklı bir dile çevirebiliyor ve podcast’çilerin kendi sesinin sentezlenmiş bir versiyonunu yeniden üretebiliyor.
Spotify’ın kişiselleştirmeden sorumlu başkan yardımcısı Ziad Sultan amaçlarını şu açıklamayla anlatmış: “Yaratıcının kendi sesini eşleştiren Voice Translation, dünyanın her yerindeki dinleyicilere yeni podcast yayıncılarını her zamankinden daha özgün bir şekilde keşfetme ve onlardan ilham alma gücü veriyor.”
OpenAI dün sabah, sadece metin ve birkaç saniyelik örnek konuşmadan insan benzeri ses oluşturabilecek yenilikler de dahil olmak üzere birkaç duyuru yaptı. Ancak şirket, güvenlik ve gizlilikle ilgili endişeler nedeniyle bu aracın kullanılabilirliğini sınırladı. Bu gelişmelere doğrultusunda Spotify’daki yeni özelliğin ses kopyalama kısmının da arkasında OpenAI olduğu yorumları hakim. Spotify’ın çeviri teknolojisinin şimdilik yalnızca “seçilmiş bir grup” podcast yayıncısı ile test edildiğini söylemesinin nedeni de muhtemelen bu. Şirket, aracı ne kadar geniş bir alanda kullanıma sunmayı planladığı veya ne zaman genişleme bekleneceği konusunda ayrıntılı bilgi vermemiş.
İki hafta önce HeyGen’in yapay zekâlı yeni video çeviri aracı da büyük ses getirmişti. Bu araç kişinin sesini klonluyor ve dudak hareketlerini farklı dillere göre yeniden üretiyor. Bu açıdan bakıldığında görüntülü podcast’ların ve videoların ideal doğallığa ulaşması için dudak hareketleri de oldukça önemli görünüyor. Siz ne dersiniz?
Çeviri Yaparken Dudak Hareketlerini de Düzenleyen Yapay Zekâlı Araç
Görsel: Spotify