Teknoloji dünyasında zaman, doğal dil işleme teknolojilerinin GPT-3 ile hayatımıza giriş yaptığı 2020 yılından bu yana hızlandırılmış bir şekilde ilerliyor. Sonrasında gerçekleşen ve zamanda âdeta kırılma yaratan ChatGPT lansmanı gündemi tamamen değiştirirken, “What is next?/Sıradaki?” sorusunun yanıtı beklenenden çabuk geldi.
Kendisine iletilen istemlerle kod veya makale yazabilen, soruları yanıtlayabilen, kaleme aldığı kampanya ile reklam sektörüne giren, öğrenciler tarafından hızla benimsenirken aynı hızla eğitim kurumları tarafından intihal gerekçesiyle yasaklanan, insan tabiatının karanlık noktalarını içinde barındıran ve bir yandan şaşkınlık ile hayranlık karışımı duygular uyandırırken diğer yandan da özellikle yaratıcı sektör çalışanları arasında işsizlik korkularını ateşleyen ChatGPT, yeni versiyonu ile gündemi ve belli ki hayatımızı daha fazla domine edecek.
Announcing GPT-4, a large multimodal model, with our best-ever results on capabilities and alignment: https://t.co/TwLFssyALF pic.twitter.com/lYWwPjZbSg
— OpenAI (@OpenAI) March 14, 2023
GPT-4’ün GPT-3’ten Farkı
Dün Open AI tarafından gerçekleştirilen çevrim içi bir etkinlikle tanıtılan ChatGPT-4, şimdiye kadar GPT-3.5 tabanlı dil modelini temel alan sohbet botu ChatGPT’nin hayli gelişmiş bir versiyonu. OpenAI, yayınladığı blog yazısında ChatGPT’den gelen geri bildirimler de dahil olmak üzere daha fazla insan geri bildirimini dikkate alarak yeni versiyonu geliştirmek için kullandıklarını aktardı. Çevrim içi lansman sırasında OpenAI CEO’su Greg Brockman tarafından geri bildirimler sayesinde GPT3’e kıyasla daha yetenekli ve güvenli hale geldiği belirtilen GPT4’ün doğru yanıtlar üretme olasılığının yüzde 40’tan fazla; izin verilmeyen içerik taleplerine yanıt verme olasılığının ise yüzde 82 daha az olduğu açıklandı.
O Da Artık Bizi Görebiliyor
Çok modlu bir nitelik kazanan sohbet robotu, artık yalnızca sözcükleri değil görselleri de işleme yeteneğine sahip. Diğer bir ifadeyle görüntüleri görebilir, anlayabilir; görsellerde bulunan nesneleri tanımlayıp yorumlayarak bir bağlam çerçevesinde müzik bestesi, web sitesi bağlantı linki veya yemek tarifi gibi yeni ve farklı içerik türleri yaratabilir; görsellere alt yazı ve açıklamalar ekleyebilir. Örnek olarak lansman sırasında bir kağıda basit bir web sitesi görseli çizen Brockman, telefonuyla çizimin fotoğrafını çekti ve fotoğrafı ilettiği GPT-4 kısa bir süre sonra web sitesi için bir HTML kodu oluşturdu.
Hand-drawn pencil drawing -> website (https://t.co/4kexpvYAgV).
Prompt: “Write brief HTML/JS to turn this mock-up into a colorful website, where the jokes are replaced by two real jokes.” https://t.co/zQ4smwqGVo pic.twitter.com/cunT74HO5l
— Greg Brockman (@gdb) March 15, 2023
Buna ek olarak kendisine iletilen birkaç malzemenin bulunduğu görseli yorumlayan GPT-4, bunlardan neler yapılabileceği sorusuna aşağıdaki gibi tutarlı bir yanıt verdi.
Sohbet robotu tarafından üretilecek yeni içerik türleri arasında videonun olup olmayacağı şimdilik belirsiz. Buna karşın GPT-4’ün en güçlü yönlerinden biri, elbette halen çoklu doğal dil metinlerini anlama ve üretme becerisi. 26 dilde binlerce çoktan seçmeli soruyu yüksek doğrulukla yanıtlayabilen sohbet robotu, önceki versiyonun yaklaşık 8 katı olan 25 bin kelimeye kadar metin işleme kapasitesine sahip. Bu kapasite artışı onun çeviri, metin özetleme ve soru yanıtlama gibi fonksiyonlarda daha işlevsel hale gelmesini sağlıyor.
Temel olarak metin girdisine dayalı insan benzeri metin üreten bir derin öğrenme modeli olan Generative Pre-trained Transformer’ın (GPT), GPT-3 versiyonu 175 milyar parametre ile eğitilmişti. GPT-4’nin ise 170 trilyon parametre üzerinden eğitildiği açıklandı. Kapasitesiyle birlikte içerikle etkileşime girme şekli değişen ChatGPT-4, kendisine iletilen bir web bağlantısı üzerinden o sayfada yer alan metinle de etkileşime girebiliyor. Brockman’ın ifadesine göre kişiler ayrıca vergi yükümlülüklerini hesaplamak için ChatGPT-4’ü kullanabilirler.
Daha Uzun Sohbetler İçin Hafızası Güçlendirildi
Her ne kadar milyarlarca hatta trilyonlarca parametre ile eğitilmiş olsalar bile dil işleme modellerinin kullanıcı ile etkileşime geçtiği sırada belirli bir hafıza kapasitesi bulunuyor. GPT-3.5 tabanlı ChatGPT’nin sohbet esnasındaki hafızası yaklaşık 8 bin kelime, diğer bir ifadeyle 4 ila 5 kitap sayfası ile sınırlıydı. Bu kapasitenin aşılması durumunda dikkatini kaybeden yapay zekâ konudan kopuyordu. GPT-4’ün hafızası ise 64 bin kelimeden oluşuyor ve yaklaşık 50 sayfaya denk geliyor. Bu, konuşma sırasında veya metin oluştururken 50 sayfaya kadar olan içerikleri hatırlayarak onlara atıfta bulunabileceği anlamına geliyor.
ChatGPT-4’ün Sınav Performansı
60 sayfalık akademik bir makale ile GPT-4’e yönelik çalışmalarının teknik detaylarını yayınlayan Open AI ekibi, GPT-4’ün simüle edilmiş bir avukatlık sınavında yüzde 10’luk dilime girebildiğini, SAT okuma ve SAT matematik sınavında da benzer şekilde yüksek performans sergilediğini iddia ediyor. Yukarıdaki grafikte ChatGPT-4 ile önceki versiyonunun karşılaştırmalı sınav performanslarını inceleyebilirsiniz. Gelişmelerin yanı sıra yapay zekâ sohbet robotunun elbette halen bazı eksiklikler bulunuyor.
Zayıflıkları, İş Birlikleri ve Erişim
Örneğin GPT-4, 2021 yılından önceki veriler baz alınarak eğitildiği için GPT3 gibi güncel olaylar hakkında bilgi verme konusunda yeterli değil. (Lansmandan kısa bir süre sonra yapılan duyuru ile Open AI GPT-4’ün web dahil olmak üzere üçüncü taraf bilgi kaynaklarına ve veritabanlarına erişim sağlayarak işlevselliğini artıran eklentiler kullanıma sunduğunu açıkladı. Bu açıklama aynı zamanda GPT-4’ün artık 2021 sonrası verilere de erişim sağlayabileceği anlamına geliyor.)
Bunun yanı sıra sonradan yapılan bir güncelleme ile yeni versiyondaki birçok sınırlamaya karşın GPT-3’te bulunan sosyal önyargıların bazıları GPT-4’te mevcut. OpenAI da, yeni yazılımın henüz mükemmel olmadığı ve birçok senaryoda insanlardan daha az yetenekli olduğu konusunda uyarıda bulunuyor.
ChatGPT’nin geçen Kasım ayındaki lansmanından farklı olarak herkesin ücretsiz olarak deneyebileceği bir web uygulaması olmayan GPT-4, başlangıçta premium olarak aylık 20 ABD doları ücretle ChatGPT Plus abonelerinin kullanımına sunulacak. Son beş haftadır Microsoft’un Bing Chat’i tarafından kullanılan ChatGPT-4, İzlanda hükümetinden Morgan Stanley’e kadar çeşitli alan ve kurumlarda şimdiden kullanılmaya başlandı.
Sohbet robotunu bu bağlantı üzerinden kayıt olarak deneyebilir; API bekleme listesine buradan erişebilir; ChatGPT-4 demosunun tanıtıldığı lansman videosunun tamamını ise aşağıda izleyebilirsiniz.
Görseller: Twitter, Youtube, Open AI