Ana SayfaYapay Zeka

Google’ın En İyi Gemini AI Demo Videosu Sahte Çıktı

Google’ın En İyi Gemini AI Demo Videosu Sahte Çıktı

Yapay Zeka Deep Fake Teknolojisi İyilik İçin Gerçekten Kullanılabilir mi?
Yapay Zeka Terimleriyle Tanışın
Apple, Yeni Yapay Zeka Modeli MGIE’yi Duyurdu
Samsung, Yeni Bir Galaxy AI Dönemi Başlatıyor
Ray-Ban Meta Akıllı Gözlükleri nihayet AI Kamera özelliğine sahip oldu.

Google, GPT-4 Rakibi Gemini’nin Yanıltıcı Bir Tanıtım Videosuyla Eleştiriliyor

Google, Çarşamba günü yayımlanan yanıltıcı bir Gemini tanıtım videosu nedeniyle yapay zeka uzmanları arasında tartışma yaşıyor. Video, yeni yapay zeka modelinin görsel ipuçlarını tanıma ve gerçek zamanlı olarak bir kişiyle sesli etkileşimde bulunma gibi görünüyor. Ancak Google, bunun gerçek olmadığını kabul etti. Bloomberg’in Parmy Olson tarafından bildirildiği üzere, araştırmacılar modelle başarılı yanıtları düzenlemek için hâlâ görüntülerini modele beslemiş ve kısmen modelin yeteneklerini yanıltıcı bir şekilde temsil etmişlerdir.

Bir sözcü, “Gemini’nin yeteneklerini geniş bir yelpazede test etmek amacıyla görüntü yakalayarak demo yarattık,” dedi. “Ardından Gemini’yi, footage’tan alınan hâlâ görüntü çerçeveleri aracılığıyla ve metin aracılığıyla çağırdık,” diye ekledi. Google, insan ellerinin faaliyet gösterdiği bir çift ellerin görüntüsünü çekti ve ardından Gemini Ultra’ya birer birer hâlâ görüntüler gösterdi. Google araştırmacıları, modele metin aracılığıyla, ses aracılığıyla değil, etkileşimde bulundu ve ardından en iyi etkileşimleri seçip bunları ses senteziyle birleştirdi.

Şu anda, büyük dil modellerinden geçen hâlâ görüntüler ve metinleri işlemek, gerçek zamanlı video yorumlamayı büyük ölçüde pratik olmayan hale getirir. Bu, yapay zeka uzmanlarını ilk olarak videonun yanıltıcı olduğuna inanmaya yönelten ipuçlarından biriydi.


Google’ın Yanıltıcı Gemini Tanıtım Videosu Tartışmalara Yol Açtı

Google, Çarşamba günü yayımlanan yanıltıcı bir Gemini tanıtım videosu nedeniyle yapay zeka uzmanları arasında tartışma yaşıyor. Bloomberg’in Parmy Olson’ın bildirdiğine göre, video, yeni yapay zeka modelinin gerçek zamanlı olarak farklı şeyleri Gemini Ultra’ya gösterebileceğinizi ve onunla konuşabileceğinizi gösteriyordu. Ancak Google, bunun gerçek olmadığını kabul etti. Olson, bir tweet’te, “Google’ın videosu, gerçek zamanlı olarak farklı şeyleri Gemini Ultra’ya gösterebileceğinizi ve onunla konuşabileceğinizi gösteriyordu. Ancak bu mümkün değil,” dedi. Bir Google sözcüsü, “kullanıcının seslendirmesi, Gemini çıktısını üretmek için kullanılan gerçek promptlardan alınan gerçek alıntılardır,” dedi.

Hype ile Yetişme Çabaları


Geçen yıl boyunca, yeni başlayan OpenAI, bazıları Google araştırma labaratuvarı çığır açan buluşlarına dayanan generatif yapay zeka teknolojisinde Google’ı geride bırakarak rezil etti. Arama devi, bu yılın başlarından itibaren Bard ve PaLM 2 gibi büyük dil modellerine büyük çaba harcayarak yetişmeye çalışıyor. Google, Gemini’yi OpenAI’nin GPT-4’e karşı ilk gerçek rakip olarak lanse etti; ancak GPT-4 hâlâ büyük dil modellerinde pazar lideri olarak görülüyor.

Google’ın Yapay Zeka Modeli Gemini’yi Tanıtan Video Tartışmalara Yol Açtı

Başlangıçta her şey plana uygun gibi görünüyordu. Çarşamba günü Google Gemini’yi duyurduktan sonra, şirketin hisseleri yüzde 5 arttı. Ancak kısa süre sonra yapay zeka uzmanları, Google’ın belki de abartılı iddialarını, belki de çok anlamlı olmayan ölçütleri çözmeye başladı; sonunda Gemini tanıtım videosuna odaklandılar.

Tartışmalı video, “Gemini ile El Ele: Çoklu Modal AI ile Etkileşim” başlığını taşıyor ve AI modelinin görüneni gördüğü bir görünümü, ekranın sağ tarafında AI modelinin yanıtlarını içeriyor. Araştırmacı karışık çizgiler çizer, eğilir ve Gemini’ye ne görebileceğini sorar. İzleyici, sorulara cevap veren Gemini Ultra’nın sesini duyar gibi oluyor.

Bloomberg’deki yazısında Olson’ın belirttiği gibi video, tanıma demosunun muhtemelen henüz kullanılamayan Gemini Ultra tarafından yapıldığını belirtmiyor. “Bu tür ayrıntıları çarpıtmak, daha geniş pazarlama çabasına işaret ediyor: Google, dünyanın en büyük yapay zeka araştırmacılarından birine ve herkesten daha fazla veriye erişime sahip olduğumuzu hatırlamamızı istiyor,” Olson yazdı.

Tek başına alındığında ve daha doğru bir şekilde temsil edilmiş olsalardı (bu Google’ın blog sayfasında olduğu gibi), Gemini’nin görüntü tanıma yetenekleri hafife alınacak bir şey değildi. OpenAI’nin çoklu modal GPT-4V (GPT-4 ile görüntü) yapay zeka modelinin yetenekleriyle yaklaşık olarak aynı gibi görünüyor; bu model de hâlâ görüntülerin içeriğini tanıyabiliyor. Ancak tanıtım amaçlı sorunsuz bir şekilde düzenlendiğinde, Google’ın Gemini modeli gerçekte olduğundan daha yetenekli gibi göründü ve bu da birçok kişiyi heyecanlandırdı.

TED organizatörü Chris Anderson, Perşembe günü şunları tweetledi: “Bu demoyun sonuçları hakkında düşünmeyi bırakamıyorum. Muhtemelen gelecek yılın başlarında, yeni başlayan bir Gemini 2.0, bir yönetim kurulu toplantısına katılabilir, brifing belgelerini okuyabilir, slaytlara bakabilir, herkesin sözlerini dinleyebilir ve tartışılan konulara akıllı katkılarda bulunabilir mi? Şimdi söyle bana. Bu AGI olarak sayılmaz mı?”

“Peki Chris, bu demoda Gemini’nin gerçekte olduğundan çok daha yetenekli olduğunu ima etmek için inanılmaz bir şekilde düzenlendi,” diye yanıt verdi öncü yazılım mühendisi Grady Booch. “Sen aldatıldın. Ve bunu yapmak için onlara ayıp.”

YORUMLAR

WORDPRESS: 0