Yaratıcı bünyeler için günlük besin kaynağı
Çin’den OpenAI’ın Sora’sına Güçlü Rakip: Kling

Çin’den OpenAI’ın Sora’sına Güçlü Rakip: Kling

Üretken yapay zekâ modeli “Kling”; videoların gerçekçiliği ve süresi açısından Sora’ya üstünlük sağlamış gibi görünüyor.

Dünya OpenAI’ın Sora’sının piyasaya sürülmesini beklerken Çin’de TikTok’un rakip şirketi Kuaishou, son derece güçlü bir yapay zekâ modeliyle hamle yaptı. Kling adı verilen bu açık erişimli modelle üretilen örnek videolara bakıldığında, rakibi Sora‘dan çok daha iyi olduğu görülüyor. Öyle ki gerçek videolarla yapay zekâ ürünü olanları ayırt etmede kullandığımız yöntemleri gözden geçirmemiz gerekebilir.

Kling, basit istemlere karşılık 1080p kalitesinde, 30 fps’de 2 dakikalık videolar üretebiliyor. En çarpıcı özelliği, gerçek dünyanın fiziksel özelliklerini doğru bir şekilde simüle edebilmesi. Sora da 1920x1080p’den 1080x1920p’ye kadar çeşitli boyutlarda ve çözünürlüklerde görüntüler üretebiliyor. Ancak üretebildiği videoların süresi 60 saniye ile kısıtlı. Üstelik neden-sonuç ilişkisini anlamakta zorlanabiliyor ve bu da videoların gerçekçiliğini bozan bazı aksaklıklara neden olabiliyor. Sosyal medya kullanıcıları bu aksaklıkları yakalamayı başarmıştı ve biz de Sora ile ilgili haberimizde bunları aktarmıştık.

Sora geç kalmış gibi görünüyor

Kling, metinsel istemleri zengin ve canlı sahnelere dönüştürürken Difüzyon Transformatörü mimarisinden yararlanıyor. Derin öğrenme modelleri sınıfında yer alan bir tür yapay sinir ağı olan tescilli bir 3B VAE (Variational Auto Encoder) ve değişken çözünürlük eğitimi aracılığıyla çeşitli en-boy oranları desteği sunuyor. Ayrıca Kling, tek bir tam vücut fotoğrafından tam ifade ve uzuv hareketine olanak tanıyan gelişmiş bir 3B yüz ve vücut yeniden yapılandırma teknolojisine sahip.

Kling “Çinli bir adam masada oturuyor ve yemek çubuklarıyla erişte yiyor” istemiyle aşağıdaki videoyu üretmiş.

Yapay zekâ modelleri oluşturma konusunda Çin’in giderek daha fazla öne geçtiği açık. Açık erişimli olarak piyasaya sürülecek Kling’le üretilen örnek videolar, şu anda modelin gücüne dair yalnızca bir önizleme sunuyor.

OpenAI, Sora’yı bu yılın sonuna kadar piyasaya sürmeyi planladığını ancak şirketin Çin’in metinden video üreten modellerine yetişmesi için çok geç olabileceğini açıkladı. OpenAI’ı avantajlı konuma getirebilecek tek şey ancak Çin’in kendi modellerini dünya çapında erişime sunmaması olabilir.

Kling, Çin’den gelen ilk metinden video üreten model değil. Nisan ayında piyasaya sürülen Vidu AI, 1080p çözünürlükte ve 16 saniye uzunluğunda içerik oluşturarak Sora’ya meydan okuyan ilk Çin yapımı modeldi.

Kling ile hazırlanmış diğer örnek videolardan bir kısmını aşağıdaki tweet zincirinde görebilirsiniz. Daha fazlası için Kling’in imternet sitesini ziyaret edebşlirsiniz.

Görsel: Kling