2001: Bir Uzay Macerası (A Space Odyssey) filminin kahramanlarından biri olan bilgisayar HAL 9000, Arthur C. Clark’ın dehasıyla makinaların gelecekte bizimle nasıl iletişim kuracağını gerçekçi bir şekilde ön görmüştü. Spike Jonze’nin daha yakın tarihli Her filmindeyse sohbet arayüzünün çok daha gelişmiş bir versiyonuyla tanışmıştık. Bugünlerde hayatımıza iyice giren sesli konuşmalı arayüzlerin konuşulduğu panelin adının da bu iki popüler kültür efsanesiyle tanıtılması bu yüzden son derece mantıklı.
Fotoğraf: Bigumigu
Konuşmacılar: Microsoft’tan Lesley Carmichael, Google’dan Timothy Jordan, Orion‘dan Jesse Robbins; moderatör David Austin‘in yönetiminde sesli iletişimi konuştular.
Microsoft Cortana’nın Doğuşu:
Bugün konuşarak iletişim kurduğumuz ana oyuncular: Amazon Alexa, Microsoft Cortana, Apple Siri ve Google Now olarak sıralanabilir. Bu uygulamalar -ya da platformlar- ile bir şekilde ufaktan iletişim kurmaya, en azından nasıl çalıştıklarını anlamak için denemeye başlamış olabilirsiniz.
Panelin ilk bölümünde sesle çalışan arayüzleri -ve platformları- geliştirmenin zorluklarından bahsedildi. Lesley Carmichael, bazı basit problemlerin hala bu konuda en önde yer aldığını anlattı; farklı cihazlardaki farklı mikrofon tipleri ve ortam seslerinin her koşulda farklı olabilmesi gibi. Büyük şirketler sesle komut konusunda çok büyük yatırımlar yapabiliyorlar. Jesse Robins’in dikkat çektiği problemse, bu alanda küçük ve aniden parlayan girişimleri görme şansımızın neredeyse sıfır olduğuydu. Yeni girişimler ancak büyük platformlara entegre uygulamalar geliştirerek farklılaşabiliyorlar. Amazon Echo için geliştirilen yeni uygulamalar bunun için iyi örnekler.
Tabii insan sesinin ve konuşmasının algılanması bu alandaki bir zorluk. İşin diğer tarafında bir de makinenin bizim konuşmamıza verdiği yanıt var. Makinelerin yanıtlarını çoğunlukla yargılıyoruz ve yetersiz buluyoruz. Bu da bu teknolojilerin gelişimindeki diğer bir gelişmeye açık olan alan.
Panelde ayrıca şu bilgi de açığa çıktı: Bir dil üzerinde çok iyi sonuçlar veren bir sesli kişisel asistan uygulamasını geliştirdiğinizde bunu hop diye başka bir dile uyarlamak söz konusu olmuyor. Yeni diller için projeyi adeta en baştan çalışırcasına bir emek, veri analizi ve zaman da gerekiyor. Bu yüzden Siri’nin Türkçe olması bu kadar uzun zaman almış olmalı.
Soundhound’un Hound adlı kişisel asistan uygulamasının demosu:
Konuşarak anlaştığımız makinelerin can alıcı özelliğini Tim Jordan açıklıyor: Kullanım kılavuzuna asla bakmak zorunda kalmamak. Bunu başarabilmek için de gerçekten her sorumuzu yanıtlayabilen bir yapay zeka ve makine öğrenme yeteneği gerekiyor.
The New York Times‘da Farhaad Manjo, 3 gün önce çıkan yazısında Amazon Echo’nun ne kadar başarılı olduğunu ve sesle kumanda edilebilen bilgisayarların ne kadar büyük bir potansiyeli olduğunu yazmıştı. Bugün Quartz’da çıkan haberse, bu konuda yaşanabilecek sorunlarla ilgili ilk işaretleri veriyor: NPR’ın Amazon Echo ile ilgili radyo programı, birkaç evde Amazon Echo cihazlarını aktive ederek cihaza bağlı akıllı termostat Nest’lerin ayarlarını değiştirmesine neden olmuş.
Geleceğin elektronik cihazları ve bilgisayarları gelişmiş arayüzleriyle büyük bir ihtimalle önce sesleri, sonra kinayeleri ve yüz ifadelerini anlayacak. Böylece bilgisayarımıza surat asıp trip attığımız günler de gelecek.
Manşet görseli: YouTube