Adobe Research, Interactive Agent for Photo Editing (fotoğraf düzenleme için etkileşimli araç) isimli sesli komuta dayalı bir fotoğraf düzenleme sistemi üzerinde çalışıyor ve Adobe 10 Ocak’ta bununla ilgili 30 saniyelik bir demo videosu yayınladı.
Demo videosu, bir iPad kullanıcısının “Bu fotoğrafı çerçevelemek istiyorum.” komutuyla başlıyor. Program dikdörtgen bir çerçeveyle fotoğrafı kırparak karşılık veriyor. Ardından kullanıcı “Çerçeveyi kare yap” komutunu veriyor ve bunu fotoğrafı yatay olarak çevirme ve yatay çevirme işlemini geri alma komutları izliyor. Kullanıcının “Bunu sevdim, Facebook’ta yayınla” komutuyla ve karşılıklı vedalaşmayla video sona eriyor.
Adobe, videonun açıklamasında Adobe Research’ün, akıllı bir dijital asistan ile fotoğraf düzenlemesinin nasıl yapılacağını “keşfetmekte” olduğunu belirtmiş. Adobe Sensei (yapay zeka ve makine öğrenimi tabanlı Adobe platformu) ile ses etkileşimi bilgisini, müşterilerinin yaratıcı süreçteki ihtiyaçlarına ve yaratıcının iş akışına dair derin anlayışıyla birleştirmiş olduğunu hatırlatmış. Açıklama şöyle devam ediyor: “Konuşma tanıma sistemimiz, yerel olarak aygıt içi hesaplama yoluyla veya bulut tabanlı Natural Language hizmeti yoluyla görüntü düzenleme için doğal kullanıcı sesli komutlarını doğrudan kabul edebiliyor. Bu, yaratıcı müşterilerimizin Adobe mobil uygulamalarını kullanarak görüntüleri kolay ve cazip bir şekilde aramasına ve düzenlemesine olanak tanıyan güçlü, çok modlu ses tabanlı bir arayüze doğru ilk adımdır.”.
Demo videosunun fazlasıyla basit bir teknolojiyi gösterdiği söylenebilir. Öte yandan video, sistemin pratik olup olmayacağı hakkında pek çok tartışmayı da beraberinde getirdi. Kullanıcı sesli komutla yalnızca kırpma, parlaklık-kontrast gibi basit işlemleri mi gerçekleştirebilecek? Eğer tasarımcıların ihtiyaç duyduğu daha karmaşık işlemleri de gerçekleştirebilecekse her kullanıcının Adobe Photoshop’un araç terminolojisini ezbere bilmesi mi beklenecek? Eğer durum öyle olacaksa muhtemelen tasarımcılar da dahil pek çok kullanıcı sesli komutu pratik bulmayacak; araçları, araçların işlevini ve ayarlarını gösteren simgelere dokunarak seçmek daha kolay görünecektir. Peki ya sistem eş anlamlı sözcük ve cümleler de dahil her şeyi anlayabilecek boyutta sofistike bir yapıda olursa? İşte o zaman sesli komutla fotoğraf düzenleme herkes için ciddi bir özgürlük anlamına gelebilir!
Görsel: YouTube