Yaratıcı bünyeler için günlük besin kaynağı
OpenAI’ın Metinden Video Üreten Yapay Zekâ Modeli “Sora”

OpenAI’ın Metinden Video Üreten Yapay Zekâ Modeli “Sora”

OpenAI'ın yeni Sora modeli, metinlerden bir dakika uzunluğunda gerçekçi ve yaratıcı videolar üretebiliyor.

OpenAI, dün metin komutlarından bir dakikaya kadar yüksek çözünürlüklü videolar üreten yepyeni bir model olan Sora’yı duyurdu. Japonca’da “gökyüzü” anlamına gelen Sora’nın genel kullanıma açılması yakın zamanda söz konusu değil. OpenAI şu an için aracı, zarar ve kötüye kullanım potansiyelini değerlendirecek küçük bir akademisyen ve araştırmacı grubunun kullanımına sunuyor.

Büyük yankı uyandıran bu gelişmeyle ilgili OpenAI’ın internet sitesinde şu detaylar yer alıyor: “Sora, birden fazla karakterin, belirli hareket türlerinin ve konu ile arka planın doğru ayrıntılarının yer aldığı karmaşık sahneler oluşturabiliyor. Model, yalnızca kullanıcının istemde ne istediğini değil, aynı zamanda bu şeylerin fiziksel dünyada nasıl var olduğunu da anlıyor.”

OpenAI, internet sitesinde ve sosyal medyada Sora ürünü çok etkileyici videolar paylaşmış. En çok ses getiren de bu örnek videolar oldu. Çünkü Sora’nın performansı ve 60 saniyelik videolar üretebilmesi gerçekten herkesi şaşkına uğrattı. Bu videolardan biri, etraflarında kiraz çiçeği yaprakları ve kar taneleri uçuşurken Tokyo şehrinde yürüyen bir çifti gösteriyor.

Bir diğer video ise karla kaplı sıradağların fonunda karlı bir çayırda yürüyen gerçekçi görünümlü mamutları gösteriyor.

Yine aşağıdakiler de en çok ilgi gören videolar arasında.

Evet çok iyi ama henüz mükemmel değil

OpenAI, modelin “dili derinlemesine anlama” alt yapısıyla çalıştığını ve bunun da metin istemlerini doğru şekilde yorumlamasını sağladığını söylüyor. Yine de şu anki diğer tüm yapay zekâ görüntü ve video oluşturucular gibi Sora da mükemmel değil. OpenAI modelin neden-sonuç ilişkisini anlamakta şu an için zorlanabileceğini belirtmiş. Örneğin bir kişinin kurabiye yediği bir video oluşturabilir ancak kurabiyede ısırık izleri bulunmayabilir. Ayrıca sosyal medyada, Sora’nın istemlerdeki bazı şeyleri atladığı, yürüyen figürlerin hareketlerinde sadece profesyonellerin fark edebileceği saliselik aksaklıklar olduğu şeklinde yorumlar almış. Benim dikkatimi çeken en bariz kusurlardan biri, gözlüklü kadının sokakta yürüdüğü yukarıdaki videoda, başının çevresinde beyaz bir ışık gibi sınır çizgisi olması. Bu beyaz sınır onu fondan ayırıyor ve bazı saniyelerde çok belirgin oluyor. Yine sosyal medyadaki yorumların bir çoğunda yaratıcı sektörden insanların “işimi kaybedeceğim” “meslekleri incitiyorsunuz” şeklindeki serzenişleri var.

Bildiğiniz üzere Sora, metinden video üreten ilk model değil. Meta, Google ve Runway de böyle araçlar sunuyor. Yine de başka hiçbir araç şu anda 60 saniyeye kadar video oluşturamıyor. Sora ayrıca diğer modellerin yaptığı kare kare bir araya getirme süreci yerine tüm videoları tek seferde oluşturuyor.

“Bu tür bir şeyin seçimleri etkilemesinden korkuyorum”

Metinden videoya dönüştürme araçlarının geldiği bu nokta, yapay zekanın sahte görüntüler oluşturma potansiyeline ilişkin endişeleri artırdı. Washington Üniversitesi’nde yapay zeka konusunda uzman profesör ve siyasi medyadaki dezenformasyonu tespit etmeye çalışan bir kuruluş olan True Media’nın kurucusu Oren Etzioni, “Bu tür bir şeyin seçimleri etkilemesinden kesinlikle korkuyorum” açıklamasında bulunmuştu. Ayrıca bu gelişmeler, işlerini kaybetme ve telif haklarının ihlali konusunda endişe duyan sanatçıların ve yaratıcı profesyonellerin tepkisinin giderek daha fazla yükselmesine neden oluyor.

OpenAI, aracı halka açık hale getirmeden önce yanlış bilgi, nefret söylemi ve önyargı gibi konularda test etmek için uzmanlarla birlikte çalıştığını açıkladı. Şirket ayrıca Sora tarafından oluşturulan videoları tespit edebilen ve daha kolay tespit için oluşturulan videolara meta veriler ekleyebilen araçlar geliştiriyor. Şirket, hem “halka açık videolar” hem de telif hakkı sahiplerinden lisanslanan videolar kullandığını da açıkça belirtmiş. Ancak Sora’nın nasıl eğitildiğiyle ilgili sorulara şu an için yanıt vermiyor.

Görsel: OpenAI