Dünya OpenAI’ın Sora’sının piyasaya sürülmesini beklerken Çin’de TikTok’un rakip şirketi Kuaishou, son derece güçlü bir yapay zekâ modeliyle hamle yaptı. Kling adı verilen bu açık erişimli modelle üretilen örnek videolara bakıldığında, rakibi Sora‘dan çok daha iyi olduğu görülüyor. Öyle ki gerçek videolarla yapay zekâ ürünü olanları ayırt etmede kullandığımız yöntemleri gözden geçirmemiz gerekebilir.
Kling, basit istemlere karşılık 1080p kalitesinde, 30 fps’de 2 dakikalık videolar üretebiliyor. En çarpıcı özelliği, gerçek dünyanın fiziksel özelliklerini doğru bir şekilde simüle edebilmesi. Sora da 1920x1080p’den 1080x1920p’ye kadar çeşitli boyutlarda ve çözünürlüklerde görüntüler üretebiliyor. Ancak üretebildiği videoların süresi 60 saniye ile kısıtlı. Üstelik neden-sonuç ilişkisini anlamakta zorlanabiliyor ve bu da videoların gerçekçiliğini bozan bazı aksaklıklara neden olabiliyor. Sosyal medya kullanıcıları bu aksaklıkları yakalamayı başarmıştı ve biz de Sora ile ilgili haberimizde bunları aktarmıştık.
Sora geç kalmış gibi görünüyor
Kling, metinsel istemleri zengin ve canlı sahnelere dönüştürürken Difüzyon Transformatörü mimarisinden yararlanıyor. Derin öğrenme modelleri sınıfında yer alan bir tür yapay sinir ağı olan tescilli bir 3B VAE (Variational Auto Encoder) ve değişken çözünürlük eğitimi aracılığıyla çeşitli en-boy oranları desteği sunuyor. Ayrıca Kling, tek bir tam vücut fotoğrafından tam ifade ve uzuv hareketine olanak tanıyan gelişmiş bir 3B yüz ve vücut yeniden yapılandırma teknolojisine sahip.
Kling “Çinli bir adam masada oturuyor ve yemek çubuklarıyla erişte yiyor” istemiyle aşağıdaki videoyu üretmiş.
Sora by OpenAI is insane.
But KWAI just dropped a Sora-like model called KLING, and people are going crazy over it.
Here are 10 wild examples you don’t want to miss:
1. A Chinese man sits at a table and eats noodles with chopstickspic.twitter.com/MIV5IP3fyQ
— Angry Tom (@AngryTomtweets) June 6, 2024
Yapay zekâ modelleri oluşturma konusunda Çin’in giderek daha fazla öne geçtiği açık. Açık erişimli olarak piyasaya sürülecek Kling’le üretilen örnek videolar, şu anda modelin gücüne dair yalnızca bir önizleme sunuyor.
OpenAI, Sora’yı bu yılın sonuna kadar piyasaya sürmeyi planladığını ancak şirketin Çin’in metinden video üreten modellerine yetişmesi için çok geç olabileceğini açıkladı. OpenAI’ı avantajlı konuma getirebilecek tek şey ancak Çin’in kendi modellerini dünya çapında erişime sunmaması olabilir.
Kling, Çin’den gelen ilk metinden video üreten model değil. Nisan ayında piyasaya sürülen Vidu AI, 1080p çözünürlükte ve 16 saniye uzunluğunda içerik oluşturarak Sora’ya meydan okuyan ilk Çin yapımı modeldi.
Kling ile hazırlanmış diğer örnek videolardan bir kısmını aşağıdaki tweet zincirinde görebilirsiniz. Daha fazlası için Kling’in imternet sitesini ziyaret edebşlirsiniz.
4. A white cat driving in a car through a busy downtown street with tall buildings and pedestrians in the backgroundpic.twitter.com/VG9dp6zRaj
— Angry Tom (@AngryTomtweets) June 6, 2024
10. An astronaut runs on the surface of the moon, the low angle shot shows the vast background of the moon, the movement is smooth and appears lightweightpic.twitter.com/rqPG1P9b1u
— Angry Tom (@AngryTomtweets) June 6, 2024
8. Car mirrors and sunsetspic.twitter.com/i1KaIRPDV7
— Angry Tom (@AngryTomtweets) June 6, 2024
6. Little boy riding his bike in the garden through the changing seasons of fall, winter, spring and summer.pic.twitter.com/LY8Wfvs3Po
— Angry Tom (@AngryTomtweets) June 6, 2024
Görsel: Kling