Rabbit, büyük dil modellerinin üretken çıktısının çok ötesine geçmek ve bunun yerine daha etkin bir yapay zekâyı yaşamın parçası haline getirmek istiyor. Bu nedenle kullanıcı adına birden fazla uygulamayı çalıştırarak işleri halleden kişisel yapay zekâ cihazı r1‘ı piyasaya sürecek. Şirket dün CES 2024 etkinliğinde, cihazı tanıttı ve tanıtımla ilgili paylaşımları milyonlarca görüntüleme alarak büyük ilgi uyandırdı.
Cihazın tasarımı, İsveçli teknoloji firması Teenage Engineering’in imzasını taşıyor. Hatta yine Teenage Engineering’in tasarladığı playdate isimli el konsoluna da oldukça benziyor. Cihaz yaklaşık olarak bir Post-it koçanı boyutunda ve kolayca cebe sığıyor. Kullanıcının sözlü isteklerini anlamak için OpenAI kaynaklı geniş bir dil modeli kullanır. Ancak Rabbit’in esas hedefi yukarıda da bahsettiğim gibi geniş dil modellerinin – GDM (large language model / LLM) üretken çıktısının çok ötesine geçerek daha aktif ve eylemli bir yapay zekâya doğru ilerlemek.
Introducing r1. Watch the keynote.
Order now: https://t.co/R3sOtVWoJ5 #CES2024 pic.twitter.com/niUmjFvKvE
— rabbit inc. (@rabbit_hmi) January 9, 2024
r1, kullanıcının kimlik bilgilerini kullanıp uygulamalara ön kapıdan giriyor
Santa Monica merkezli şirketi farklı kılan esas mahareti, kullanıcının uygulamalarını onlar adına çalıştırmayı öğrenen, tescilli bir yapay zekâ modeli olan yazılımı. Bu yapay zekâ modeline, Large Action Model (LAM) adını vermişler. Örneğin, bir kullanıcı r1’a şunları söyleyebilir: “Ofise gitmek üzere bana bir Uber çağır, yolculuk için enerji veren bir müzik seç ve ekibe biraz geç kalacağımı bildir.” Bunun ardından LAM isteği yerine getirmek için ilgili uygulamaları kullanıyor.
LAM’in uygulama koordinasyon yetenekleri, teorik olarak bir tür akıllı telefon sonrası (post-smartphone) deneyimi yaratıyor. Şirketin kurucusu ve CEO’su Jesse Lyu, “Akıllı telefonlarımızda birbiriyle konuşmayan, karmaşık UX tasarımlarına sahip yüzlerce uygulamanın bulunduğu bir noktaya geldik” diyor. “Sonuç olarak, kullanıcılar cihazlarından bıkıyor ve çoğu zaman kaybediliyor.”
Model, başlangıçta çeşitli uygulamalarda binlerce kayıtlı kullanıcı oturumu izletilerek eğitildi. Kullanıcı, dizüstü veya masaüstü bilgisayarındaki bir kurulum sayfasında uygulama kimlik bilgilerini sağlayarak r1’ın uygulamalarına erişmesine izin verebiliyor.
Lyu, API aracılığıyla kullanıma sunulan uygulama işlevselliğinin genellikle sınırlı olduğunu ve API’nin özellik kümesini artırmanın genellikle uygulama üreticilerinin en önemli öncelikleri arasında olmadığını söylüyor. Rabbit’in, kullanıcının kimlik bilgilerini kullanıp ön kapıdan girerek kullanıcının uygulamalarına erişmeyi seçmesinin nedenini böyle açıklıyor. Teorik olarak LAM modeli, kullanıcının bir uygulamayla yapabileceği her şeyi yapmayı öğrenebiliyor.
$199, no subscription: https://t.co/R3sOtVVQTx #CES2024 pic.twitter.com/IFZ9ZC3F21
— rabbit inc. (@rabbit_hmi) January 9, 2024
Uygulama geliştirme şirketleri, Rabbit’in yaklaşımı karşısında ne yapacak?
İster istemez zihinlerde “Uygulama geliştirme şirketleri, Rabbit’in yaklaşımı karşısında ne yapacak?” sorusu canlanıyor. Rabbit, kullanıcıların uygulamalarını kullanmak için bir proxy yapay zeka aracısı göndermesini sağlıyor. Ancak şirkete göre bu proxy’nin reklamları görüntülemesi veya uygulama içi satın alma işlemi yapmaya ikna edilmesi muhtemel değil. Lyu, uygulama sahiplerinin sattıkları hizmetin hâlâ kullanılıyor olması, ancak yalnızca farklı bir şekilde erişilmesi nedeniyle rahatsız olacağına inanmadığını söylüyor.
Bu yılın ilerleyen dönemlerinde kullanıcılar, LAM modelini kendi temel uygulamalarını kullanacak şekilde doğrudan eğitmelerine olanak tanıyan “teach mode”u kullanabilecekler. Bu da şu anlama geliyor: Kullanıcı, “rabbit hole” adı verilen bir web portalı kullanarak, uygulamalarını nasıl kullandığını gösterecek ve bu şekilde modeli eğitebilecek. Şirket basın bülteninde şu açıklamayı yapmış: “Model, kullanıcıların belirli uygulamaları kullandıklarındaki davranışlarını öğrenerek bilgisayar arayüzlerindeki insan eylemlerini anlayabilir ve modelleyebilir. Ardından bunları hem güvenilir hem de hızlı bir şekilde taklit edip yeni görevleri gerçekleştirebilir. Örneğin, bir kullanıcı bir video düzenleme uygulamasına fotoğraflardan filigranları kaldırmayı öğretebilir.
Rabbit, r1’in şeklini ve özelliklerini, kullanıcı görevlerini gelişmiş bir akıllı telefondan daha hızlı etkinleştirebilecek şekilde seçtiğini söylüyor. Elde taşınır cihaz 115 gram ağırlığında 2,88 inçlik bir dokunmatik ekrana sahip. Kaydırma tekeri sayesinde, yapay zeka tarafından gerçekleştirilen görevlerle ilgili metinsel bilgi sağlayan “kartlar” arasında gezinmek mümkün. Dönen bir kamera, bilgisayarla görme görevlerini gerçekleştiriyor. Örneğin, “Bu gıdanın içeriği nedir?” sorusunu bu kamera sayesinde yanıtlıyor. Elbette cihaz görüntülü arama da yapabiliyor. Wi-Fi ve hücresel bağlantıya, MediaTek işlemciye, 4 GB belleğe, 128 GB depolama alanına, USB-C bağlantı noktasına ve SIM kart yuvasına da sahip. Rabbit, cihazın pilinin tüm gün dayanacağını söylüyor.
Lyu, r1’ın fiyatının 199 dolar olacağını ve Paskalya’ya (31 mart) kadar piyasaya sürüleceğini söylüyor.
Görsel: Rabbit