Kullanıcıların Doğal Dil Talimatlarıyla Görüntüleri Düzenleme İmkanı
Apple, kullanıcıların fotoğraf düzenleme işlemlerini sadece doğal dil talimatlarıyla gerçekleştirebilmelerini sağlayan yeni bir yapay zeka modeli olan MGIE’yi duyurdu. Bu model, metin komutları aracılığıyla görüntülerin kırpılması, yeniden boyutlandırılması, çevrilmesi ve filtrelerin eklenmesi gibi işlemleri gerçekleştirebiliyor.
MGIE veya MLLM-Guided Image Editing
MGIE veya MLLM-Guided Image Editing adındaki bu model, basit ve karmaşık piksel düzeyinde görüntü düzenleme görevlerini gerçekleştirebiliyor. Model, multimodal dil modellerinin (LLM) iki farklı kullanımını birleştirerek kullanıcı komutlarını yorumluyor ve düzenlemenin nasıl olacağını “hayal ediyor”.

Fotoğraf Düzenleme Sürecini Basitleştirme
MGIE, fotoğraf düzenleme sürecini oldukça basit hale getirerek sadece değiştirmek istenen şeyin yazılmasını sağlıyor. Örneğin, “Daha sağlıklı yap” komutu verildiğinde pizza üzerine sebzeler ekleniyor. Bu sayede kullanıcılar, karmaşık düzenleme araçlarını kullanmadan istedikleri değişiklikleri kolayca yapabiliyorlar.
MGIE’nin Kullanılabilirliği ve Planları
Apple, MGIE’yi GitHub üzerinden indirilebilir hale getirdi ve aynı zamanda Hugging Face Spaces üzerinde bir web demosu yayınladı. Şirket, model için gelecekteki planlarını henüz açıklamadı ancak bu yeni yapay zeka modelinin fotoğraf düzenleme alanında önemli bir adım olduğu belirtiliyor.
YORUMLAR