Yaratıcı bünyeler için günlük besin kaynağı
İşaret Dilini Anında Tercüme Eden Yapay Zeka Modeli

İşaret Dilini Anında Tercüme Eden Yapay Zeka Modeli

Mühendislik öğrencisi Priyanjali Gupta, Amerikan İşaret Dili’ni (ASL) gerçek zamanlı olarak İngilizceye çeviren bir yapay zeka modeli geliştirdi.

Gupta, Tamil Nadu’daki Vellore Teknoloji Enstitüsü’nde veri biliminde uzmanlaşmakta olan 20 yaşında bir bilgisayar bilimi öğrencisi. Okulda 3. yılında olan Gupta’nın bu projedeki motivasyon kaynağı ise annesi. Çoğu Hint annenin çocuklarından “artık mühendislik okuduğuna göre bir şeyler yapmalısın” şeklindeki beklentisi Gupta’nın da deneyimlediği bir şey olmuş.

Her şey 2021 yılında başlamış. “Annem bana sataştı. Ama bu, bilgimle ve becerilerimle neler yapabileceğimi düşünmemi sağladı. Güzel bir günde, Alexa ile sohbet ederken kapsayıcı teknoloji fikrinden etkilendim. Bu, bir dizi planı tetikledi” diyor Gupta.

Model, açık kaynaklı olarak geliştirilmeye devam edecek

Gupta, annesiyle olan diyaloğundan sonra yoğun bir şekilde bu konu üzerinde çalışmış. Tensorflow nesne algılama API’sinden yararlanarak bir yapay zeka modeli oluşturmuş. ssd_mobilenet adlı önceden eğitilmiş bir model aracılığıyla transfer öğreniminden yararlanmış. LinkedIn’deki gönderisi, 60.000’den fazla reaksiyon ve 1.500’e yakın takdir dolu yorum ve paylaşımla viral olmuş. Projesi önemli bir boşluğu dolduruyor ve kapsayıcı teknoloji açısından da önemli bir adım sayılıyor. Gupta, ilham kaynağının veri bilimcisi Nicholas Renotte’nin Gerçek Zamanlı İşaret Dili Tespiti başlıklı videosunun olduğunu açıklamış.

Priyanjali Gupta modeli, aşağıdaki demoyla bizzat kendisi tanıtmış:

 

Demoda da gördüğünüz gibi model tek bir kişinin kısa ifadelerini tek kare şeklinde tespit edip tercüme diyor. Gupta, modelin henüz kullanıma hazır olmadığını ve birden fazla kare üzerinde de çalışabilecek şekilde eğitilmesi gerektiğini açıklamış. Şu anda bunun üzerinde araştırma yapıyor ve çözüm için LTSM’yi kullanmayı düşünüyor. Gupta’ya göre Uzun-Kısa Süreli Bellek (Long-Short Term Memory / LTSM) ağları, veri bilimindeki dizi tahmin problemlerini çözmek için etkili bir çözüm.

Gupta, işaret tespiti için sıfırdan bir derin öğrenme modeli oluşturmanın kolay olmadığını belirtmiş. “Yalnızca işaret tespiti için derin bir sinir ağı oluşturmak oldukça karmaşık. Ben sadece amatör bir öğrenciyim ama öğrenmeye devam ediyorum. Benden çok daha deneyimli olan açık kaynak topluluğumuzun er ya da geç bir çözüm bulacağına inanıyorum.” diyor.

işaret dili tercüme

Görsel: Priyanjali Gupta