Google Mengembangkan Vlogger AI yang Mampu Menghidupkan Foto dan Membuatnya Berbicara

Wahana BeritaGoogle Vlogger, sebuah teknologi kecerdasan buatan yang dikembangkan oleh peneliti Google, menjanjikan kemampuan untuk mengubah foto statis menjadi video pendek yang tampak hidup dan bergerak. Teknologi ini menggunakan model difusi yang mendukung konversi teks-ke-gambar, video, dan bahkan 3D, dengan menambahkan mekanisme kontrol tambahan.

Dalam pengembangannya, Google Vlogger memanfaatkan model difusi untuk menghasilkan video bergerak yang realistis dari foto dan audio yang diberikan sebagai input. Proses ini melibatkan pelatihan model AI dengan kumpulan data besar yang disebut MENTOR, yang mencakup lebih dari 800.000 identitas berbeda dan 2.200 jam video. Dengan kumpulan data tersebut, Vlogger dapat belajar membuat video orang-orang dengan beragam etnis, usia, pakaian, pose, dan lingkungan sekitar tanpa bias.

Hasil yang dihasilkan oleh Google Vlogger adalah video pendek di mana subjek di foto terlihat berbicara sesuai dengan audio yang diberikan, dengan gerakan bibir yang menyesuaikan. Video juga mencakup ekspresi wajah, gerakan kepala, dan gerakan tangan yang sesuai dengan konteks percakapan.

Meskipun menawarkan potensi yang menarik, Google Vlogger masih memiliki beberapa keterbatasan. Video yang dihasilkan cenderung pendek dan memiliki latar belakang statis, sementara subjek tidak bergerak dalam lingkungan 3D. Selain itu, meskipun realistis, perilaku dan pola bicara subjek masih dapat dibedakan dengan manusia sebenarnya.

Perlu dicatat bahwa Google Vlogger saat ini masih dalam tahap pratinjau dan bukan produk yang siap rilis. Namun, teknologi ini memiliki potensi untuk membuka pintu bagi berbagai aplikasi, termasuk dalam terjemahan video dan pembuatan konten visual yang menarik.

 

Sumber : tekno.kompas.com