Scroll untuk baca artikel
Lifestyle

Gemini di Chrome terasa seperti langkah kecil menuju era agen Google

97
×

Gemini di Chrome terasa seperti langkah kecil menuju era agen Google

Share this article
gemini-di-chrome-terasa-seperti-langkah-kecil-menuju-era-agen-google
Gemini di Chrome terasa seperti langkah kecil menuju era agen Google

Saya menghabiskan pagi saya dengan Gemini di Chrome, integrasi baru yang menempatkan asisten bertenaga AI tepat di browser Anda. Alih-alih pergi ke aplikasi web chatbot, Anda dapat mengklik tombol Gemini baru di sudut kanan atas Chrome untuk memulai percakapan-tetapi perbedaan kuncinya adalah bahwa Asisten bawaan browser Dapat “melihat” apa yang ada di layar Anda saat Anda menavigasi web.

Bagi saya, integrasi Gemini di Chrome sepertinya hanya awal dari Google misi untuk membuat AI lebih “agen,” karena saya mendapati diri saya menginginkannya melakukan lebih dari yang sebenarnya. Untuk saat ini, Anda hanya dapat mencoba versi akses awal Gemini di Chrome jika Anda seorang pelanggan AI Pro atau AI Ultra, dan menggunakan versi beta, dev, atau Canary versi Chrome.

Example 300x600

Saya mulai dengan menggunakan Gemini untuk merangkum beberapa artikel The Vergeserta bahkan menemukan beberapa berita terkait game di beranda, di mana ia menunjukkan game Game Boy baru yang ditambahkan Nintendo ke layanan online Switch, yang akan datang Cincin Elden Adaptasi film, dan pembaruan deck uap besar -besaran Valve.

Tapi Gemini hanya bisa “melihat” apa yang ada di layar Anda, jadi saya menemukan bahwa jika Anda ingin merangkum elemen -elemen tertentu, seperti The VergeBagian komentar, Anda harus membuatnya terlihat sebelum chatbot dapat memberikan tanggapan. Gemini akan mengikuti Anda saat Anda beralih tab, tetapi hanya dapat menarik informasi dari satu per satu.

Jika Anda tidak ingin mengetik, Gemini di Chrome juga memungkinkan Anda beralih ke fitur “Live” dengan memilih tombol di sudut kanan bawah kotak dialog. Dari sana, Anda dapat dengan mudah mengajukan pertanyaan dengan keras, dan Gemini akan merespons dengan berbicara kepada Anda.

Ringkasan Gemini bisa menjadi sedikit panjang untuk jendela sekecil itu.

Saya menemukan ini sangat berguna untuk digunakan bersama video YouTube, di mana saya mengutip video renovasi kamar mandi dan bertanya, “Alat apa yang dia gunakan?” Gemini menjawab, “Sepertinya dia menggunakan senjata paku untuk mengencangkan beberapa potongan kayu bersama -sama.” Dalam video lain, Gemini dengan benar mengidentifikasi kapasitor di motherboard, bersama dengan pinset dan alat udara panas yang digunakan YouTuber untuk menghapusnya. Ini dapat meringkas video dan memberi tahu Anda tentang bagian -bagian tertentu yang belum Anda tonton juga, tetapi saya menemukan bahwa ini tidak selalu akurat jika video tidak memiliki bab berlabel yang dapat menarik informasi.

Mungkin kasus penggunaan favorit saya untuk integrasi adalah memiliki resep Gemini Pull dari video YouTube, jadi saya tidak perlu menulis resep sendiri atau mencari tautan dalam deskripsi. Itu juga berguna ketika saya memintanya untuk menunjukkan tas tahan air di halaman pencarian Amazon.

Gemini di Chrome juga dapat menarik resep dari video YouTube. Dan ya, itu cocok dengan resep yang sebenarnya.

Gemini tidak selalu konsisten. Ketika saya bertanya kepada Gemini di mana Mrbeast berada selama a video dia menjelajahi kota -kota kuno Mayatermasuk Chichén Itzá, menjawab, “Saya tidak memiliki akses ke informasi real-time, jadi saya tidak dapat menunjukkan lokasi saat ini yang tepat di Mrbeast.” Ketika saya menanyakannya lagi, itu merespons dengan lokasi yang tercantum dalam deskripsi video: Meksiko. Di lain waktu, saya meminta Gemini untuk tautan untuk membeli sepasang tang tertentu yang ditampilkan dalam sebuah video, tetapi Gemini lagi mengatakan kepada saya bahwa itu tidak “memiliki akses ke informasi waktu nyata, termasuk daftar produk atau inventaris toko.” Namun, Gemini memberi saya tautan ke produk lain saat diminta.

Kadang-kadang, saya merasa bahwa tanggapan Gemini terlalu lama hanya untuk jendela pop-up kecil di Chrome. Anda dapat memperpanjangnya, tetapi tidak meninggalkan banyak ruang di layar 13 inci MacBook Air saya. Plus, salah satu nilai jual utama AI adalah bahwa itu seharusnya membantu Anda menghemat waktu dengan memberikan jawaban yang cepat dan ringkas, yang tidak selalu dilakukan kecuali saya secara khusus meminta itu. Pertanyaan tindak lanjut Gemini, seperti apakah saya ingin tahu lebih banyak tentang topik tertentu, juga menjadi sedikit berulang.

Bahkan dengan cegukan ini, saya dapat dengan mudah melihat Google memperluas integrasi Gemini Chrome di luar hanya pertanyaan dan jawaban sederhana. Google ingin AI -nya menjadi “agen,” yang berarti dapat melakukan tugas atas nama Anda, dan Gemini di Chrome tampaknya siap untuk suatu hari mengadopsi fitur semacam ini. Setelah meminta Gemini untuk merangkum menu restoran, misalnya, saya bahkan berpikir untuk memintanya untuk melakukan pemesanan pickup – tugas agen yang belum bisa dilakukannya. Di masa depan, saya bahkan bisa melihatnya berguna dengan membuatnya menandai halaman yang terkait dengan penelitian perjalanan untuk saya, atau mungkin bahkan menemukan dan menyimpan video YouTube dari berbagai resep untuk menonton daftar putar saya kemudian.

Google sepertinya semakin dekat untuk mewujudkannya Dengan Project Mariner “Mode Agen” datang ke aplikasi Geminiyang akan memungkinkannya untuk mengelola hingga 10 tugas sekaligus dan mencari web untuk Anda – dan mungkin suatu hari, itu akan membawa kemampuan ini ke Gemini di Chrome juga.