Yapay zekaya ilişkin karanlık senaryolar, birkaç yıl öncesine kadar yalnızca bilim-kurgu edebiyatının ve sinemanın konusuydu. Oysa bugün bilim ve teknoloji otoriteleri tarafından ciddi olarak masaya yatırılan meseleler arasında. Yapay zekanın insanlığı yok edip etmeyeceği, yok ederse neler olacağı sıkça tartışılıyor. Çünkü akıllı telefonlar aracılığıyla yapay zeka artık hayatımızın tam içinde.
Metin ve görsel içerik üretimi de yapay zekayla dönüşmeye başlayan alanlardan. Hatırlayanlarınız olacaktır, geçtiğimiz yıl Mynet’in Türkçe içerik üretebilecek bir yapay zeka algoritması üzerinde çalıştığına yer vermiştik. Habercilikten reklamcılığa; Adobe ve Nvidia ürünleri, Remove.bg ve AI Portraits gibi görsel düzenleme araçlarına kadar yaratıcı sektör ve iletişim sektöründen pek çok alan yönünü yapay zekaya çevirdi. Peki dünyanın başı sahte haberlerle bu denli beladayken yapay zekanın üretebileceği sahte içeriklerle nasıl mücadele edilebilir? Harvard Üniversitesi ve MIT-IBM Watson Lab’dan araştırmacılar bu soruya odaklandılar ve böylece yapay zeka tarafından üretilen metinleri tespit edebilen yapay zekalı bir araç geliştirdiler. Bu aracın adı GLTR (Giant Language Model Test Room/Dev Dil Modeli Test Odası).
GLTR, belirli bir metin parçasının bir dil modeli algoritması tarafından üretilip üretilmediğini tespit etmek üzere yaratılmış bir sistem. Bir metin girip aracı denemek isterseniz GLTR’a buradan erişebilirsiniz.
Günümüzde sahte haberler üretme ve yanlış bilgi yayma amacıyla çeşitli yapay zeka ve doğal dil oluşturma modelleri kullanılıyor. Uzmanların ve deneyimli kişilerin bu metinleri ayırt etmesi mümkün olabilir. GLTR ise böyle bir bilgi ve deneyime sahip olmayan okuyucu için fayda sağlayabilecek bir araç.
GLTR, testlerde %72 başarı oranına sahip olduğunu gösterdi
Araştırmacılar tarafından paylaşılan sonuçlara göre, GLTR insanların sahte metin tespit oranını yüzde 54’ten yüzde 72’ye çıkardı. Algoritma, farklılıkları tanımlayabilmek için metindeki istatistiksel sözcük dağılımlarını kullanııyor. Temel önermesi şöyle; eğer metin bir dil modeli kullanılarak oluşturulmuşsa, o zaman bir insan tarafından yazılandan daha tahmin edilebilir bir kelime dizisine sahip olur. Ayrıca yapay zekalı üreticiler tarafından oluşturulan cümleler, dilbilgisi açısından doğru olsa da gerçekte anlamsız metinlerden oluşabilir. Bunu daha basit bir şekilde özetlersek, GLTR yapay zekayla metin yazılırken kelimelerin ya da cümlelerin gerçek anlamına değil metindeki istatistiksel örüntülere dayandığı gerçeğini temel alıyor. Böylece metnin bir insan tarafından yazılamayacak kadar tahmin edilebilir olduğunu söyleyebiliyor. Sistem en tahmin edilebilir kelimeleri yeşille, daha az tahmin edilebilir kelimeleri kırmızıyla ve sarıyla, en az tahmin edilebilir kelimeleri ise morla vurguluyor. Vurgulanan metin çoğunlukla yeşil ve sarıyla vurgulanmış sözcüklerden oluşuyorsa bu, yapay zeka tarafından oluşturulduğuna dair güçlü bir gösterge sayılıyor. GLTR, yalnızca sahte metinleri tespit etmekle kalmıyor. Aynı zamanda ülkelerin seçim ve demokratik süreçlerini dahi etkileyebilen Twitter botlarının tespit edilmesi için de potansiyel taşıyor.
Görsel: YouTube