NVIDIA son yıllarda kendi reklamını yapmak için yapay zeka destekli araçlar üretmek gibi bir strateji izliyor. Bunu da kendi yarattığı ve GauGAN adı verdiği bir alt yapı üzerinden gerçekleştiriyor. Yakın zamanda, manzara eskizini fotoğrafa dönüştüren NVIDIA Canvas ile oldukça ses getirmiş, yaratıcı sektörün oldukça işine yarayabilecek bir araç ortaya koymuştu. Bu defa yine yapay zeka destekli bir araç olan Vid2Vid Cameo ile işin içine bir tutam da empati ve mizah ekliyor.
Vid2Vid Cameo ile selfie’niz dublorünüz oluyor
Salgınla birlikte yaşantımıza Zoom yorgunluğu/görüntülü görüşme yorgunluğu diye bir kavram girdi. Görüntülü görüşmelerin haddinden fazla uzadığında ya da çok sık yapıldığında tıpkı fiziksel toplantılarda olduğu gibi verimi düşürebilen ve hayatı sekteye uğratabilen bir iletişim biçimi olduğu konuşuluyor. Daha önce Sam Lavigne’ın Zoom görüşmelerinden kaçmak için geliştirdiği Zoom Escaper adlı yazılımı anlatırken de bu konuya değinmiştim. Hatta Santa Kupča’nın yorgan rahatlığındaki videolu görüşme giysileri de aynı noktaya parmak basan bir proje olduğundan burada anmadan geçmeyelim. Her neyse… NVIDIA da bu mağduriyeti fark etmiş ve “hiç değilse görüntülü görüşme için yapılan can sıkıcı hazırlık sürecini devreden çıkarayım” demiş herhalde. Dolayısıyla Vid2Vid Cameo adlı araç ortaya çıkmış. Bu araç, selfie’nizin sizin dublörünüzmüşçesine hareket ediyor ve görüşmeye görünmeden katılmanızı sağlıyor. Bu sayede de eşofmanlarınızla ve dağınık arka planınızla öylece oturup sadece sesli olarak görüşmede yer alıyorsunuz.
Kullanıcının tek bir 2B görüntüsü videoda konuşan kafa olarak görünüyor
Vid2Vid Cameo, kaosu kameranın arkasına gizlemeye yardımcı oluyor. Aracı kullanırken kamerayı açmanız gerekiyor. Yapay zeka, yüz hareketlerinizi kamera aracılığıyla referans görüntüyle eşliyor. Böylece mimikleriniz, kendinizin daha bakımlı bir hali olan selfie’nizi hareketlendirmek için kullanılıyor. Başka bir deyişle, görüntülü arama sırasında kamera kullanıcının gerçek zamanlı hareketlerini ve ifadelerini yakalayarak yüklenen görüntüye uyguluyor.
Diyelim ki görüşme sırasında gözünüz TV’deki haberlere ya da başka bir şeye takıldı. O takdirde de Vid2Vid Cameo doğrudan ekrana bakıyormuşsunuz gibi gösterecek şekilde ayarlanabiliyor.
Aslında tembeller ya da numaracılar için tasarlanmış bir araç gibi görünse de başka insani durumlar için de işe yaraması hedeflenmiş. Diyelim ki önceki akşam kötü bir olay yaşadınız ve bütün gece uyuyamadınız ya da depresyondasınız kullandığınız ilaçlar nedeniyle toplantılara son dakikada yetişebiliyorsunuz. O halde bu kötü zamanları, Vid2Vid Cameo ile kimseye belli etmeden atlatabilme şansınız oluyor.
Bu araç da NVIDIA’nın önceki yapay zekalı araçlarında olduğu gibi GAN (generative adversarial networks) adı verilen bir yapay zeka biçimini kullanıyor. Bu yapay zeka biçimini kullanan NVIDIA aracına ise yukarıda belirttiğim gibi GauGAN adı verilmiş.
NVIDIA bu aracın, görüşme sırasında gereksinim duyulan bant genişliği ihtiyacını da önemli ölçüde – 10 kata kadar – azalttığını iddia ediyor. Başka bir deyişle, hızla alakalı sorunlar yaşanmasının önüne geçiliyor.
Vid2Vid Cameo çok yakında geliştiricilere yönelik Nvidia Maxine ve Nvidia Video Code SDK’larında (Software Development Kit/Yazılım Geliştirme Kiti) yerini alacak. Kullanıcılar ise demo versiyonuna şuradan ulaşabilir.
Görsel: NVIDIA