Metinden görüntü üreten yapay zekalı araçlarla yaratılmış ürün tasarımları, afişler, reklamlar, mimari tasarımlar, animasyonlar ve daha nice dijital varlık üzerine sıkça konuşuldu. Metinlerin doğrudan fiziksel bir varlığa dönüşmesi konusunda ise henüz pek bir tartışma gündeme gelmemişti. Bu konuda ilk çarpıcı hamle, ChatGPT ve GPT-4 gibi ürünlerle yapay zeka alanında sıçrama yaratan OpenAI’dan geldi. OpenAI araştırmacıları Heewoo Jun ve Alex Nichol, metinlerden 3B baskıya hazır 3B model (text-to-3D-model) varlıklar oluşturabilen yeni yapay zeka modeli Shap-E’yi duyurdu. Ekip bu yeniliği, metinlerden “doğrudan” 3B baskı nesne üretilebilecek aşamaya getirmek için çalışıyor.
Shap-E ile “metinden ürüne” dönemini konuşacağız
Shap-E, 3B nesneler için şartlı üretken model olarak tanımlanıyor. Yazılım, bilgisayar render’larına olan ihtiyacı devreden çıkararak 3B baskı nesne üretmeyi hızlandırıyor. Açık kaynaklı yazılım, “metinden ürüne” fikrini yalnızca birkaç kelime veya açıklamayla hayata geçiriyor.
Aslında OpenAI, daha önce Shap-E’nin öncülü Point-E’yi de geliştirerek bu konuda bir adım atmıştı. Şirket Shap-E’nin çok daha gelişmiş bir model olduğunun altını çiziyor. Öncülüne göre daha hızlı; daha yüksek boyutlu ve çok temsilli bir çıktı alanı modellemesine rağmen karşılaştırılabilir veya daha iyi örnek kalitesine ulaşmış.
Ya 3B baskı nesne, istemi tam olarak karşılamazsa?
Araştırmacılar henüz Shap-E’yi geliştirmeye devam ediyor. Yeterli doğrulama veya güvenlik testi yapılmadan metinden gerçek nesneler üretmenin potansiyel riskler oluşturabileceğini belirtiyorlar. “Üretilen numuneler istemi yeterince karşılamadığında bu potansiyel olarak zarar yaratabilir.” diyorlar.
Jun ve Nichol, Shap-E ve Point-E arasında yürüttükleri bir dizi karşılaştırmalı testte, Shap-E’nin aynı veri kümesi, model mimarisi ve eğitim hesaplaması verildiğinde benzer bir açık üretken modelle eşleşebildiğinii veya ondan daha iyi performans gösterebildiğini görmüş. Ayrıca Shap-E Point-E’nin pikselli görüntülerine kıyasla daha yumuşak kenarlar, daha gölgeli ana hatlar ve boyut hissi daha güçlü şekiller sergiliyor.
Modelleme aşamasını devreden çıkararak metinleri doğrudan 3B basacak bir süreç üzerinde çalışılıyor
Kullanıcıların somut bir ürün üretebilmesi için işlenmiş modeli elbette 3B baskı makineyle basması gerekiyor. Ancak Shap-E’nin oyuna katılmasıyla birlikte OpenAI, model üretme aşamasını aradan çıkarıp “doğrudan” metinleri 3B baskıya dönüştüren bir süreç geliştirmek için çalışıyor. Aslında Shap-E, ara temsil niteliğindeki görüntülere ihtiyaç duymadan şimdiden bazı nesneleri üretebiliyor. Jun ve Nichol, araştırma ekibinin hala incelemesi gereken sınırlamalar olduğunu kabul ediyor. Shap-E’nin konseptleri oluşturmak için sınırlı bir yeteneğe sahip olması, birden çok niteliği farklı nesnelere bağlamak için hala tam olarak yetkin olmaması ve istendiğinde doğru miktarda nesne üretememesi gibi sorunlar olduğunu söylüyorlar.
Shap-E’nin üretebildiği örnekler, ince ayrıntılar konusunda da henüz tam olarak başarılı değil. Jun ve Nichol, “En iyi sonuçlar için, Shap·E potansiyel olarak optimizasyona dayalı 3B üretken tekniklerle birleştirilebilir” diyor. Araştırma ekibi, yazılımı denemek isteyenler için dosyaları ve talimatları açık kaynak sayfalarına yüklemiş. Ancak testlerinin tam ortasında olduklarının da altını çiziyorlar.
Görsel: Open AI, Inés Álvarez Fdez