Varsayımsal Olarak Tehlikeli...
04:02:04
Gerçeklik İkiye Bölünüyor
Google araştırmacıları, bir kişinin tek bir hareketsiz görüntüsünü hareketli, konuşan bir avatara dönüştürebilen yeni bir yapay zekâ modeli geliştirdi. Adı Vlogger ve şaşırtıcı derecede gerçekçi çıktıları ürkütücü olmaktan başka bir şey değil…
Google ekibi bir teknik incelemede Vlogger‘ı “insanları sesten sentezlemek için yeni bir çerçeve" olarak tanımlıyor ve “bu çalışmada hedeflediğimiz şey tam olarak otomasyon ve davranışsal gerçekçilik… bedenlenmiş bir konuşma aracına çok modlu bir arayüz" diye ekliyor. Bu “ajan," diye devam ediyorlar, sonuçta “bir insan kullanıcıyla doğal konuşmaları desteklemek için tasarlandı."
Başka bir deyişle, bu araştırmacıların amacı kesinlikle diğer uçtaki gerçek insanlarla “insan" hissi veren bir şekilde etkileşime giren gerçekçi görünümlü sahte insanlar yaratmak.
Makalede araştırmacılar, girdi olarak sadece bir görüntü ve istenen bir ses klibini gerektiren bu modelin “çevrimiçi iletişimi, eğitimi veya kişiselleştirilmiş sanal asistanları geliştirmek" için kullanılabileceğini öne sürüyorlar. Vlogger ayrıca araştırmacıların “yaratıcı süreçleri kolaylaştıracağını" iddia ettikleri hareketli videoları da düzenleyebiliyor.
Ancak araştırmacılar, tek bir görüntüden tamamen sentetik, hareketli ve konuşan video klipler üretebilen bir aracın kötü niyetli kişiler tarafından suiistimal edilmeye müsait olduğundan hiç bahsetmiyorlar.
Aslında, Google‘ın Vlogger‘ı yaratırken gerçekleştirdiğini iddia ettiği ilerlemeler onu varsayımsal olarak bu kadar tehlikeli kılıyor.
Örneğin yapay zekâlı deepfake’ler halihazırda büyüyen bir sorun. Ancak, üretken yapay zekâ araçlarının kamuya açık olması nedeniyle deepfake oluşturmak her zamankinden daha kolay olsa da, özellikle ikna edici bir video deepfake oluşturmak genellikle birden fazla yapay zekâ aracının bir kombinasyonunu gerektirir. Şu anda, Vlogger modelini kullanırken, kullanıcıların video için istenen sesi sağlamaları gerekiyor. Yine de, Vlogger muhtemelen süreci genel olarak kolaylaştıracaktır.
This is scary!
Google just revealed VLOGGER, and it can create almost realistic talking + moving videos from JUST ONE PHOTO.
Here's what you need to know:
(+ more examples) pic.twitter.com/V61Sb0Xr9n
— Roni Rahman (@heyronir) March 19, 2024
Dahası, makaleye göre Vlogger, teknolojisinin canlandırdığı “her bir kişi için eğitim gerektirmiyor“. Araştırmacılar ayrıca “görüntünün tamamını oluşturduğunu" ve “iletişim kuran insanları doğru bir şekilde sentezlemek için kritik olan" “geniş bir senaryo yelpazesini dikkate aldığını" söylüyorlar.
Basitçe söylemek gerekirse, bu Vlogger‘ın tek tek canlandırılan her bir kişi için özel bir eğitim gerektirmediği anlamına geliyor; bu da muhtemelen, halkın gözünde olmayan sıradan insanlar da dahil olmak üzere, hemen hemen herkesin tek bir resminden gerçekçi bir sahte video hazırlamasına olanak tanıyor. Bunun bir takım olumsuz sonuçlarının olması kaçınılmaz görünüyor.
Vlogger‘ın yapay zekâ animasyonları henüz mükemmel değil. Hâlâ belirgin bir şekilde insanlık dışı bir kenar taşıyorlar, garip bir şekilde robotik bir şekilde hareket ediyor ve konuşuyorlar. Ancak çok büyük miktarda veriyle (araç, makaleye göre 2.200 saatlik video ve “800.000 kimlik" içeren geniş bir hazine olan MENTOR veri kümesi üzerinde eğitildi) etkinleştirilen teknoloji yine de etkileyici.
Peki ya gelişmeye devam eder de mükemmele doğru yol alırsa?..
Google Vlogger Hakkında Bilgiler
Google Vlogger, Google AI tarafından geliştirilen ve halen deneysel aşamada bulunan bir yapay zekâ sistemidir. Bu sistem, tek bir fotoğraf ve ses kaydı kullanarak gerçekçi videolar oluşturabilme özelliğine sahiptir.
Nasıl Çalışır?
- Fotoğraf: Vlogger’a bir kişinin fotoğrafı yüklenir.
- Ses: Vlogger’a ses kaydı yüklenir.
- Yapay Zekâ: Vlogger, fotoğraftaki kişinin yüzünü ve ses kaydını analiz ederek gerçekçi bir video oluşturur.
Oluşan Videoda Neler Var?
- Konuşan kişi
- Dudak senkronizasyonu
- El ve yüz hareketleri
- Arka plan (yapay zekâ tarafından oluşturulur)
Kullanım Alanları:
- E-ticaret: Ürün tanıtım videoları
- Eğitim: Ders videoları
- Eğlence: Skeçler, animasyonlar
- Sosyal Medya: Kişisel videolar