Model AI apa pun yang baru dari Google sungguh liar

Tahun lalu saya memalsukan boneka binatang anak saya agar terlihat seperti rusa mewahnya sedang berlibur.

Itu adalah eksperimen untuk melihat apakah saya dapat menciptakan kembali peristiwa yang digambarkan dalam iklan Gemini yang dijalankan Google, dan saya tidak pernah menunjukkan video petualangan Buddy si rusa kepada anak saya yang berusia empat tahun. Tapi itu adalah latihan yang mengungkap banyak hal yang membuat saya berpikir banyak tentang perbedaan antara kesenangan yang tidak berbahaya dengan AI generatif dan air kotor total. Mungkin diagram Venn itu lingkaran sempurna! Mungkin tidak. Namun yang saya tahu pasti adalah bahwa alat untuk membuat video realistis ternyata sangat bagus, dan hanya memerlukan sedikit usaha dan pengetahuan. Dan tren itu terus berlanjut hingga era Omni Gemini.

Omni adalah keluarga model generatif baru yang suatu hari nanti diduga akan mampu mengubah segala jenis masukan – foto, video, teks – menjadi hal lain. Tapi sebagai permulaan, ini hanya membuat video. Omni Flash adalah model pertama yang dirilis Google, sekarang tersedia di platform pembuatan dan pengeditan video AI perusahaan, Flow. Anda masih dapat menggunakan model sebelumnya, Veo, jika Anda mau, tetapi Omni meningkatkan Veo dalam beberapa hal.

Dengan Omni, Anda dapat mengunggah video dan menggunakannya bersama dengan perintah teks sebagai titik awal untuk kreasi yang dihasilkan AI. Google juga mengklaim Omni menggabungkan lebih banyak pengetahuan dunia nyata saat memproduksi video dan sebagai hasilnya, dapat melakukan pekerjaan yang lebih baik dalam menjaga konsistensi karakter di seluruh video. Hanya ada satu cara untuk benar-benar mengetahui apakah klaim tersebut benar: Saya membawa kembali AI Buddy untuk mengemas tas kecil buatan AI untuk petualangan lainnya.

Hasilnya sangat beragam sehingga membingungkan. Beberapa di antaranya sangat bagus — jauh lebih konsisten dan sesuai dengan perintah saya dibandingkan saat saya menguji Veo lima bulan lalu. Namun bahkan klip terbaik yang dibuat Omni untuk saya masih memiliki ketakutan akan lompatan AI tertentu, seperti saat Buddy tiba-tiba berganti orientasi saat dia terjun payung.

Untuk video lainnya, saya memberi Omni kebebasan artistik. “Buatlah montase Buddy yang sedang berkemas untuk berlibur dan menaiki kapal pesiar untuk liburan tropis. Suasananya lucu dan ceria. Buddy mengemas sesuatu yang lucu ke dalam kopernya yang kemudian akan diputar di klip.” Di situ Buddy mengemas sebotol madu; kemudian di klip itu dia meraihnya seolah-olah itu adalah sebotol tabir surya. “Uh oh,” kata karakter tersebut sambil menyemprotkan madu ke kuku kakinya.

Sejujurnya, tidak sedikit buruk. Kecuali botol madu yang terus berubah sepanjang video, dari toples, menjadi botol semprot bening berisi air, lalu kembali ke botol peras berisi madu. Dan saya bahkan tidak dapat menjelaskan bagaimana model tersebut menghasilkan bingkai akhir video – seolah-olah model tersebut hanya memuntahkan sekumpulan elemen dari rangkaian yang baru saja dibuatnya.

Anda dapat menggunakan petunjuk berbasis teks untuk menyarankan pengeditan pada video Anda, dan saya akan memberikan penghargaan kepada Google: Ini bekerja lebih baik dengan Omni dibandingkan saat saya menguji Veo 3. Namun hasilnya adalah buruk dengan Veo — sangat buruk sehingga saya merasa lebih mudah untuk membuat video baru dari awal setiap kali saya ingin sesuatu diubah. Omni benar-benar akan menerima hasil edit Anda, tetapi hasilnya tidak selalu sesuai.

Saya telah menekankan reaksi wajah Buddy dalam klip liburannya, dan hasilnya tampak aneh. Itu juga akan memberi Sobat tanduk dari waktu ke waktu, yang tidak dia miliki. Teman adalah a SayangTerima kasih banyak. Ketika saya memintanya untuk menghilangkan tanduk yang muncul di satu adegan, ia wajib — dan kemudian menambahkan tanduk di semua adegan lainnya.

Masalahnya, semua ini tidak gratis. Pembuatan video membutuhkan kredit, bervariasi dari 15 hingga 40 kredit berdasarkan durasi adegan dan “bahan” yang Anda gunakan untuk memulai. Satu putaran pengeditan berharga 40 kredit. Saya memiliki paket AI Pro $20 per bulan yang dilengkapi dengan 1.000 kredit setiap bulan. Setelah sekitar 20 klip dihasilkan dengan beberapa pengeditan, saya turun menjadi 145. Jika Anda memiliki ide spesifik tentang video yang ingin dibuat oleh Omni, Anda mungkin harus mempertimbangkan banyak biaya bolak-balik dengan model untuk mendapatkan video yang mendekati visi Anda.

Saya dapat dengan jujur mengatakan bahwa saya tidak siap dengan apa yang saya lihat

Salah satu kekuatan Omni adalah menambahkan hal-hal yang dihasilkan AI ke video nyata, jadi saya memberi Buddy waktu istirahat dan memalsukan diri saya sendiri. Berawal dari video selfie dengan ekspresi netral, saya meminta Omni membuat video saya sedang makan sepiring spageti, duduk di kursi pesawat, dan berdiri di depan Menara Eiffel sambil menggigit baguette. Dan saya dapat dengan jujur mengatakan bahwa saya tidak siap dengan apa yang saya lihat.

Ada AI yang diceritakan dalam video deepfake saya. Dentingan garpu yang mengenai mangkuk pasta agak terlalu dibuat-buat. Ada seorang wanita di latar belakang video pesawat yang muncul dua kali. Namun terlepas dari gangguan-gangguan kecil dan perasaan aneh tentang hal-hal tersebut, hal-hal tersebut sangat meyakinkan.

Saya menunjukkan klip pasta kepada suami saya; dia tahu saya sedang menguji alat video AI, tetapi saya tidak memberi tahu dia adegan apa yang dihasilkan oleh AI. Tanpa mengetahui apa yang dihasilkan AI tentang hal itu, dia mengira saya sedang duduk di depan kamera sambil makan pasta, dan mengatakan bahwa satu-satunya petunjuk yang dia miliki adalah bahwa mangkuk itu tampak asing. Makan pasta itu sendiri tampak cukup nyata untuk meyakinkan suamiku. Seorang pria yang pada dasarnya telah melihatku di kehidupan nyata setiap hari selama dekade terakhir.

Deepfake saya yang lain memiliki berbagai tingkat “cukup baik untuk membodohi orang di media sosial.” Beberapa klip Menara Eiffel terlihat agak kartun, tetapi salah satunya cukup meyakinkan sehingga Anda mungkin perlu menonton ulang beberapa kali untuk mengetahui bahwa itu adalah AI. SAYA Aku tahu itu bukan aku ketika AI aku menoleh dan memperlihatkan rambutnya yang dikuncir kuda. Tapi saya tidak yakin orang lain mengetahui perbedaannya, dan itu membuat saya merasa aneh.

Kita pastinya berada jauh di dalam lembah yang luar biasa

Sejujurnya, aku sedikit lelah dengan itu semua. Saya terkejut ketika saya menguji Veo 3 pada realisme yang bisa dihasilkannya. Saya terkejut melihat betapa mudahnya berulang kali menampilkan orang palsu dalam foto palsu selama beberapa tahun terakhir. Saya mungkin seharusnya kaget dengan Omni juga, dan saya rasa memang begitu, tapi keunggulannya sudah memudar.

Membuat karya sinematik yang dihasilkan AI masih tidak semudah yang Google ingin Anda yakini. Namun Omni meningkatkan Veo dalam beberapa hal yang dapat dikenali. Jika Anda memiliki akun Google dan kartu kredit, Anda dapat merekam video diri Anda sedang duduk di rumah dan membuatnya terlihat seperti sedang dalam penerbangan ke Maui dengan sedikit usaha. Saya tidak berpikir kita berada di “kaki bukit singularitas” tepatnya, tapi kita pasti berada jauh di lembah yang luar biasa.

Semua gambar dan video dalam cerita ini dihasilkan oleh Google Gemini.

Ikuti topik dan penulis dari cerita ini untuk melihat lebih banyak hal serupa di feed beranda hasil personalisasi Anda dan untuk menerima pembaruan email.

Allison Johnson

Post Views: 5

Read Also