Spotify’dan Podcast Yayınlarına Yapay Zekâ Ürünü Ses Çevirisi

Podcast yayıncılarının bir düğmeye basıldığında anında başka bir dil konuşabildiğini hayal edin. Spotify’ın yeni yapay zeka destekli Voice Translation (ses çeviri) özelliğinin arkasındaki fikir bu. Podcast yayıncısının kendi sesini kullanarak diğer dillerdeki podcast’leri yeniden üretiyor.

Şimdilik yalnızca bir grup podcast yayıncısının programlarında ses çevirisi var

Şirket, bu yeniliği tanıtmak için bir dizi popüler podcast yayıncısıyla ortaklık kurmuş ve onların İngilizce yayınlarını İspanyolcaya çevirmiş.Önümüzdeki haftalarda Fransızca ve Almanca çevirileri de kullanıma sunmayı planlıyor. İlk etapta ortaklık kurulan podcast yayıncıları arasında; Steven Bartlett, Dax Shepard, Monica Padman, Lex Fridman ve Bill Simmons gibi büyük isimler yer alıyor. Spotify, bu grubu The Ringer’dan The Rewatchables’ı ve Trevor Noah’ın gelecek şovunu da içerecek şekilde genişletmeyi planlıyor.

Spotify’ın kurucu CEO’su Daniel Ek, aşağıdaki videoyu paylaştı ve kullanıcıların fikrini sordu:

Podcasters – what if I told you could offer your pod to any listener around the world, in their own local language but still keep it in your own voice? That’s the pilot we’re launching @Spotify!
It’s called Voice Translation and using AI, translates podcasts episodes into… pic.twitter.com/kYq0bgxJYq
— Daniel Ek (@eldsjal) September 25, 2023

Çeviri özelliğinin omurgası, OpenAI’ın hem İngilizce konuşmaları yazıya dökebilen hem de diğer dilleri İngilizceye çevirebilen ses transkripsiyon aracı Whisper. Artık Spotify’ın aracı, konuşmadan metne çevirinin ötesine geçiyor; bir podcast’i farklı bir dile çevirebiliyor ve podcast’çilerin kendi sesinin sentezlenmiş bir versiyonunu yeniden üretebiliyor.

Spotify’ın kişiselleştirmeden sorumlu başkan yardımcısı Ziad Sultan amaçlarını şu açıklamayla anlatmış: “Yaratıcının kendi sesini eşleştiren Voice Translation, dünyanın her yerindeki dinleyicilere yeni podcast yayıncılarını her zamankinden daha özgün bir şekilde keşfetme ve onlardan ilham alma gücü veriyor.”

OpenAI dün sabah, sadece metin ve birkaç saniyelik örnek konuşmadan insan benzeri ses oluşturabilecek yenilikler de dahil olmak üzere birkaç duyuru yaptı. Ancak şirket, güvenlik ve gizlilikle ilgili endişeler nedeniyle bu aracın kullanılabilirliğini sınırladı. Bu gelişmelere doğrultusunda Spotify’daki yeni özelliğin ses kopyalama kısmının da arkasında OpenAI olduğu yorumları hakim. Spotify’ın çeviri teknolojisinin şimdilik yalnızca “seçilmiş bir grup” podcast yayıncısı ile test edildiğini söylemesinin nedeni de muhtemelen bu. Şirket, aracı ne kadar geniş bir alanda kullanıma sunmayı planladığı veya ne zaman genişleme bekleneceği konusunda ayrıntılı bilgi vermemiş.

İki hafta önce HeyGen’in yapay zekâlı yeni video çeviri aracı da büyük ses getirmişti. Bu araç kişinin sesini klonluyor ve dudak hareketlerini farklı dillere göre yeniden üretiyor. Bu açıdan bakıldığında görüntülü podcast’ların ve videoların ideal doğallığa ulaşması için dudak hareketleri de oldukça önemli görünüyor. Siz ne dersiniz?

Çeviri Yaparken Dudak Hareketlerini de Düzenleyen Yapay Zekâlı Araç

Görsel: Spotify

OpenAI ile iş birliği yapan Spotify, Voice Translation özelliği sayesinde podcast yayıncılarının seslerini kopyalayıp programların yabancı dil versiyonlarını otomatik olarak oluşturuyor.

Şimdilik yalnızca bir grup podcast yayıncısının programlarında ses çevirisi var

İlgili

Önceki makale

Sonraki makale

Yapay Zekâ ve Yaratıcılar: Kayhan Dural

Kayhan Dural, yapay zekâyla ilgili profesyonel ve kişisel deneyimlerini, projelerini ve öngörülerini anlattı.

Yapay Zekâ Ürünü Sentetik Oyuncuların Çekim Hatalarıyla Sınavı

OpenAI, tamamen yapay zekâ ürünü bir “çekim hataları” videosu yayınlayarak Sora’nın yeteneklerini esprili bir dille ortaya koydu.

Oboe: Tembelleşen İnsanlığı Yapay Zekâ ile Eğiten Öğrenme Platformu

Anchor’un kurucularının yeni girişimi Oboe, yapay zekâ ile öğrenmeyi merkezine koyan, soruları kurslara dönüştüren esnek öğrenme programları sağlıyor.

Sanatçı Haklarına Yaklaşımıyla Fark Yaratan Üretken Yapay Zekâ: Eleven Music

Eleven Music; sinema, TV, oyun, podcast, reklam ve daha pek çok alanda yapay zekâ ürünü kullanıma hazır parçalar üretirken sanatçı haklarını koruyan etik ve teknik önlemleriyle fark yaratıyor.

Çeviri Yaparken Dudak Hareketlerini de Düzenleyen Yapay Zekâlı Araç

HeyGen’in yapay zekâlı yeni video çeviri aracı, kişinin sesini klonluyor ve dudak hareketlerini farklı dillere göre yeniden üretiyor.

Spotify’dan Podcast Yayınlarına Yapay Zekâ Ürünü Ses Çevirisi

OpenAI ile iş birliği yapan Spotify, Voice Translation özelliği sayesinde podcast yayıncılarının seslerini kopyalayıp programların yabancı dil versiyonlarını otomatik olarak oluşturuyor.

Şimdilik yalnızca bir grup podcast yayıncısının programlarında ses çevirisi var

İlgili

Önceki makale

Sonraki makale

Bunlar da ilginizi çekebilir

Yapay Zekâ ve Yaratıcılar: Kayhan Dural

Kayhan Dural, yapay zekâyla ilgili profesyonel ve kişisel deneyimlerini, projelerini ve öngörülerini anlattı.

Yapay Zekâ Ürünü Sentetik Oyuncuların Çekim Hatalarıyla Sınavı

OpenAI, tamamen yapay zekâ ürünü bir “çekim hataları” videosu yayınlayarak Sora’nın yeteneklerini esprili bir dille ortaya koydu.

Oboe: Tembelleşen İnsanlığı Yapay Zekâ ile Eğiten Öğrenme Platformu

Anchor’un kurucularının yeni girişimi Oboe, yapay zekâ ile öğrenmeyi merkezine koyan, soruları kurslara dönüştüren esnek öğrenme programları sağlıyor.

Sanatçı Haklarına Yaklaşımıyla Fark Yaratan Üretken Yapay Zekâ: Eleven Music

Eleven Music; sinema, TV, oyun, podcast, reklam ve daha pek çok alanda yapay zekâ ürünü kullanıma hazır parçalar üretirken sanatçı haklarını koruyan etik ve teknik önlemleriyle fark yaratıyor.

Çeviri Yaparken Dudak Hareketlerini de Düzenleyen Yapay Zekâlı Araç

HeyGen’in yapay zekâlı yeni video çeviri aracı, kişinin sesini klonluyor ve dudak hareketlerini farklı dillere göre yeniden üretiyor.