AI besar Perusahaan terus -menerus menjanjikan bahwa teknologi mereka akan menghemat waktu dan meningkatkan produktivitas kami – walaupun dengan pertanyaan besar tentang Penyalahgunaan Hak Cipta, konten ilegaldan meroket penggunaan energi Menggantung dengan agak tidak nyaman di latar belakang. Tetapi jika Anda ingin meletakkan lebih banyak waktu kembali ke jadwal sibuk Anda, AI bisa menjadi alat yang berguna, dan mungkin dalam beberapa hal yang bahkan belum Anda pikirkan.
Salah satunya mungkin merangkum video YouTube. AI telah menunjukkan bahwa itu bisa menjadi ringkasan yang cukup andal (walaupun tidak selalu), dan jika Anda hanya perlu mengekstrak beberapa poin penting dari serangkaian video yang panjangnya 15 atau 30 menit, waktu yang dihemat dapat dengan cepat bertambah.
Google Gemini memiliki model AI baru, Gemini 2.0 Flash Thinking Experimentalyang dapat terhubung ke Google Apps termasuk Google Search, Google Maps, dan YouTube. Model ini tersedia untuk semua pengguna Gemini, membayar atau tidak, dan kami mengujinya pada pilihan klip menggunakan antarmuka web Gemini.
Bagaimana menemukan fitur
Model baru ini tersedia untuk semua pengguna Gemini.
Jika Anda membuka Gemini di webmulai obrolan baru, dan pergi ke pemetik model di sudut kiri atas, Anda akan melihat satu berlabel 2.0 Flash Thinking (Eksperimental). Ini adalah yang dengan koneksi Google App built in, meskipun sebagian besar waktu Anda perlu menentukan aplikasi mana yang ingin Anda gunakan (saat mencari tempat di Google Maps, misalnya).
Model tidak sulit ditemukan di aplikasi Gemini Android atau iOS Baik: Jika Anda mengetuk menu tarik-turun di bagian atas percakapan baru (yang harus diberi label dengan model yang Anda gunakan saat ini), Anda akan melihat 2.0 Flash Thinking (Eksperimental) Opsi tersedia untuk pemilihan.
Anda mungkin akan menemukan fitur ini sedikit lebih mudah digunakan di web, di mana Anda dapat menyeret URL YouTube antara tab Browser untuk dianalisis, tetapi Anda juga bisa melakukannya di ponsel. Selain menganalisis video YouTube, Anda dapat mencari konten baru: Coba minta YouTube untuk video tentang sorotan baseball atau penjelasan sains, misalnya.
Ringkas sorotan pertandingan
Gemini tidak memperbaiki segalanya tentang Super Bowl Lix.
Untuk memulainya, kami menempatkan Gemini untuk mengerjakan paket highlight tahun lalu Super Bowl Lix Sorotan – hampir 20 menit aksi – untuk melihat apa yang akan dilakukan AI. Untuk mulai dengan kami hanya bertanya “Apa yang terjadi dalam game ini?” Dan dalam beberapa detik kami memiliki detail tim dan yang menang (yang AI benar), dan beberapa sorotan utama.
Pertanyaan tindak lanjut tentang skor akhir dijawab dengan benar, tetapi Gemini mendapatkan nama pencetak gol pertama yang salah: AI menyarankan itu adalah Johan Dotson. Dotson ditunjukkan mendapatkan touchdown di highlight dengan skor di 0-0, tetapi itu dikesampingkan-contoh nuansa yang tidak perlu diambil AI.
Gemini berhasil mengidentifikasi ketika Kepala Kota Kansas mendapatkan poin pertama mereka, dan bahkan memasukkan cap waktu yang terhubung langsung ke touchdown dalam klip YouTube. Itu juga mendapatkan nama pencetak gol yang benar. Tampaknya Gemini sangat bergantung pada komentar untuk klip olahraga, yang tidak mengejutkan.
Ringkas konten video
AI dapat memilih detail video – jika mereka disebutkan dalam audio.
Selanjutnya, kami mencoba menempatkan Gemini melawan a Fitur di belakang layar untuk Grand Budapest Hotel, disutradarai oleh Wes Anderson. Klip ini berjalan hingga empat setengah menit, dan Gemini menembakkan beberapa balasan hampir secara instan: itu mengidentifikasi nama film yang dibicarakan, dan ketukan utama narasi klip.
Namun, semuanya bergantung pada audio (atau transkrip) lagi – tampaknya tidak ada analisis dari konten video yang sebenarnya. AI tidak bisa mengatakan siapa kepala yang berbicara dalam video, meskipun nama mereka ditampilkan di layar, dan tidak dapat mengatakan siapa sutradara itu (meskipun ini juga disebutkan dalam deskripsi video).
Di sisi positifnya, Gemini melakukan pekerjaan yang mengesankan untuk menyimpulkan audio video. Ini dengan benar mengidentifikasi beberapa tantangan pembuatan film yang disebutkan di seluruh, dan memberikan cap waktu kepada mereka – dari mencari set untuk mewakili Grand Budapest, hingga mengisinya dengan ekstra.
Merangkum wawancara
Gemini dapat memberikan cap waktu untuk video yang ditentukan.
Akhirnya, kami mencoba Google Gemini dengan wawancara: Saluran 4 di Inggris berbicara dengan Charlie Brooker dan Siena Kelly tentang seri terbaru Cermin hitam (Mungkin sesuai untuk artikel tentang AI). Gemini membuktikan dirinya sangat mampu memilih poin pembicaraan, dan menambahkan cap waktu, meskipun tentu saja seluruh video sebagian besar berbicara.
Sekali lagi, tidak ada konteks tentang apa pun di luar audio atau transkrip. Gemini Ai tidak bisa mengatakan di mana wawancara berlangsung, atau bagaimana para peserta bertindak, atau apa pun tentang visual video – yang layak diingat jika Anda menggunakannya sendiri.
Untuk video di mana jawaban yang Anda inginkan ada di audio video YouTube, dan transkrip yang terkait, Gemini bekerja dengan sangat baik dalam meringkas dan memberikan jawaban yang akurat (asalkan para komentator menyebutkan kapan touchdown dikesampingkan, serta ketika seseorang dicetak). Untuk informasi visual apa pun, Anda masih harus menonton video sendiri.
