Yaratıcı bünyeler için günlük besin kaynağı
Metinden 3B Baskı Nesnelere: Shap-E

Metinden 3B Baskı Nesnelere: Shap-E

OpenAI, metinlerden baskıya hazır 3B modeller üretebilen ve gelecekte metinlerden doğrudan 3B baskı nesneler üretebilecek “Shap-E” isimli yeni bir araç geliştirdi.

Metinden görüntü üreten yapay zekalı araçlarla yaratılmış ürün tasarımları, afişler, reklamlar, mimari tasarımlar, animasyonlar ve daha nice dijital varlık üzerine sıkça konuşuldu. Metinlerin doğrudan fiziksel bir varlığa dönüşmesi konusunda ise henüz pek bir tartışma gündeme gelmemişti. Bu konuda ilk çarpıcı hamle, ChatGPT ve GPT-4 gibi ürünlerle yapay zeka alanında sıçrama yaratan OpenAI’dan geldi. OpenAI araştırmacıları Heewoo Jun ve Alex Nichol, metinlerden 3B baskıya hazır 3B model (text-to-3D-model) varlıklar oluşturabilen yeni yapay zeka modeli Shap-E’yi duyurdu. Ekip bu yeniliği, metinlerden “doğrudan” 3B baskı nesne üretilebilecek aşamaya getirmek için çalışıyor.

Shap-E ile “metinden ürüne” dönemini konuşacağız

Shap-E, 3B nesneler için şartlı üretken model olarak tanımlanıyor. Yazılım, bilgisayar render’larına olan ihtiyacı devreden çıkararak 3B baskı nesne üretmeyi hızlandırıyor. Açık kaynaklı yazılım, “metinden ürüne” fikrini yalnızca birkaç kelime veya açıklamayla hayata geçiriyor.

Aslında OpenAI, daha önce Shap-E’nin öncülü Point-E’yi de geliştirerek bu konuda bir adım atmıştı. Şirket Shap-E’nin çok daha gelişmiş bir model olduğunun altını çiziyor. Öncülüne göre daha hızlı; daha yüksek boyutlu ve çok temsilli bir çıktı alanı modellemesine rağmen karşılaştırılabilir veya daha iyi örnek kalitesine ulaşmış.

Ya 3B baskı nesne, istemi tam olarak karşılamazsa?

Araştırmacılar henüz Shap-E’yi geliştirmeye devam ediyor. Yeterli doğrulama veya güvenlik testi yapılmadan metinden gerçek nesneler üretmenin potansiyel riskler oluşturabileceğini belirtiyorlar. “Üretilen numuneler istemi yeterince karşılamadığında bu potansiyel olarak zarar yaratabilir.” diyorlar.

Jun ve Nichol, Shap-E ve Point-E arasında yürüttükleri bir dizi karşılaştırmalı testte, Shap-E’nin aynı veri kümesi, model mimarisi ve eğitim hesaplaması verildiğinde benzer bir açık üretken modelle eşleşebildiğinii veya ondan daha iyi performans gösterebildiğini görmüş. Ayrıca Shap-E Point-E’nin pikselli görüntülerine kıyasla daha yumuşak kenarlar, daha gölgeli ana hatlar ve boyut hissi daha güçlü şekiller sergiliyor.

OpenAI Shap-E

Modelleme aşamasını devreden çıkararak metinleri doğrudan 3B basacak bir süreç üzerinde çalışılıyor

Kullanıcıların somut bir ürün üretebilmesi için işlenmiş modeli elbette 3B baskı makineyle basması gerekiyor. Ancak Shap-E’nin oyuna katılmasıyla birlikte OpenAI, model üretme aşamasını aradan çıkarıp “doğrudan” metinleri 3B baskıya dönüştüren bir süreç geliştirmek için çalışıyor. Aslında Shap-E, ara temsil niteliğindeki görüntülere ihtiyaç duymadan şimdiden bazı nesneleri üretebiliyor. Jun ve Nichol, araştırma ekibinin hala incelemesi gereken sınırlamalar olduğunu kabul ediyor. Shap-E’nin konseptleri oluşturmak için sınırlı bir yeteneğe sahip olması, birden çok niteliği farklı nesnelere bağlamak için hala tam olarak yetkin olmaması ve istendiğinde doğru miktarda nesne üretememesi gibi sorunlar olduğunu söylüyorlar.

Shap-E’nin üretebildiği örnekler, ince ayrıntılar konusunda da henüz tam olarak başarılı değil. Jun ve Nichol, “En iyi sonuçlar için, Shap·E potansiyel olarak optimizasyona dayalı 3B üretken tekniklerle birleştirilebilir” diyor. Araştırma ekibi, yazılımı denemek isteyenler için dosyaları ve talimatları açık kaynak sayfalarına yüklemiş. Ancak testlerinin tam ortasında olduklarının da altını çiziyorlar.

OpenAI Shap-E

Görsel: Open AI, Inés Álvarez Fdez