Stable Diffusion’un Arkasındaki Girişim, Generatif Sanatı Canlandırıyor
Yapay zeka girişimi Stable Diffusion, geliştirdiği jeneratif sanatın artık animasyonlu olabileceğini duyurdu. Stabilite AI tarafından yapılan açıklamaya göre, şirket, Stable Video Diffusion adlı yeni ürününü araştırma ön incelemeye sunarak kullanıcıların tek bir resimden video oluşturmasına olanak tanıdı. Şirket, “Bu son teknoloji jeneratif yapay zeka video modeli, her türden model oluşturmak için attığımız önemli bir adımdır” ifadesini kullandı.
Stable Video Diffusion İncelemesi
Yeni araç, iki resimden video modu şeklinde piyasaya sürüldü ve her biri saniyede 3 ila 30 kare hızında, 576 × 1024 çözünürlükte 14 ila 25 kare uzunluğunda üretebiliyor. Tek bir kareden çoklu görüntü sentezi yapabilme yeteneğine sahip olan araç, çoklu görüntü veri setlerinde ince ayar yapabilme özelliğine sahiptir. Şirket, “Temel formda serbest bırakıldıkları sırada dış değerlendirmelerle, bu modellerin lider kapalı modelleri kullanıcı tercihi çalışmalarında geçtiğini tespit ettik” dedi ve bu durumu text-to-video platformları Runway ve Pika Labs ile karşılaştırdı.
Stable Video Diffusion Detayları
Stable Video Diffusion şu anda sadece araştırma amaçları için mevcut olup, gerçek dünya veya ticari uygulamalarda kullanılmamaktadır. Potansiyel kullanıcılar, Stability AI tarafından belirtildiği gibi, “metinle video arayüzünü içeren yaklaşan bir web deneyimine erişim için bekleme listesine kaydolabilirler.” Araç, reklamcılık, eğitim, eğlence ve daha fazlası gibi sektörlerde potansiyel uygulamaları sergileyecek.
Stabilite AI’nın Dikkat Çeken Özellikleri ve Sınırlamaları
Videonun kalitesi yüksek gibi görünen yukarıdaki videolardaki örnekler, rakip jeneratif sistemlere uygun görünmektedir. Ancak şirket, bazı sınırlamalara sahip olduğunu belirtti: nispeten kısa videolar üretir (4 saniyeden az), mükemmel fotoğraf gerçekçiliğine sahip değildir, yavaş pan hareketleri dışında kamera hareketi yapamaz, metin kontrolü yapamaz, okunabilir metin üretemez ve insanları ve yüzleri düzgün üretemeyebilir.

Stable Video Diffusion Nasıl Geliştirildi?
Araç, milyonlarca video veri seti üzerinde eğitildi ve daha sonra Stabilite AI tarafından belirtildiği gibi, araştırma amaçları için kamuoyunda bulunan videolar üzerinde ince ayar yapıldı. Veri setinin kaynağı, Stability AI’ın görüntü arşivlerini çekmekle suçlandığı son Getty Images daveti önemlidir.
Generatif Yapay Zeka ve Potansiyel Tehlikeler
Video, içerik oluşturmayı basitleştirmek için büyük potansiyele sahip olduğundan, generatif yapay zeka için bir ana hedeftir. Ancak, deepfake’ler, telif ihlalleri ve daha fazlası aracılığıyla kötüye kullanım potansiyeli en yüksek olan bir araçtır. Ve Stable Diffusion ürününü ticarileştirme konusunda OpenAI’in ChatGPT ürünü kadar başarılı olamamış ve yüksek bir hızda nakit tüketmiştir. Geçen hafta, Stability AI’ın ses başkanı Ed Newton-Rex, generatif yapay zeka modellerini eğitmek için telif hakkı içeren içeriğin kullanımı nedeniyle istifa etti.
YORUMLAR