Agen AI adalah fiksi ilmiah belum siap untuk primetime

Ini Stepbackbuletin mingguan memecah satu cerita penting dari dunia teknologi. Untuk lebih lanjut tentang semua hal AI, Ikuti Hayden Field. Stepback tiba di kotak masuk pelanggan kami pada jam 8 pagi ET. Memilih Stepback Di Sini.

Bagaimana itu dimulai

Semuanya dimulai dengan Jarvis ya, itu Jarvis yang dari film Marvel.

Yah, mungkin tidak awal Dengan asisten AI Iron Man, tetapi sistem fiksi jelas membantu konsep agen AI bersama. Setiap kali saya mewawancarai orang -orang industri AI tentang AI agen, mereka sering menunjuk Jarvis sebagai contoh alat AI yang ideal dalam banyak hal – yang tahu apa yang perlu Anda lakukan bahkan sebelum Anda bertanya, dapat menganalisis dan menemukan wawasan dalam petak besar data, dan dapat menawarkan saran strategis atau menjalankan titik pada aspek -aspek tertentu dari bisnis Anda. Orang-orang kadang-kadang tidak setuju pada definisi yang tepat dari agen AI, tetapi pada intinya, ini adalah langkah di luar chatbots karena itu adalah sistem yang dapat melakukan tugas-tugas multistep, kompleks atas nama Anda tanpa terus-menerus membutuhkan komunikasi bolak-balik dengan Anda. Ini pada dasarnya membuat daftar subtugas yang harus dilakukan sendiri yang perlu diselesaikan untuk mencapai tujuan akhir pilihan Anda. Fantasi itu lebih dekat untuk menjadi kenyataan dalam banyak hal, tetapi ketika datang ke kegunaan yang sebenarnya untuk pengguna sehari -hari, ada banyak hal yang tidak berhasil – dan mungkin tidak akan pernah berhasil.

Istilah “agen AI” telah ada sejak lama, tapi itu khususnya mulai tren di industri teknologi pada tahun 2023. Itu adalah tahun konsep agen AI; Istilah itu ada di bibir semua orang ketika orang -orang mencoba untuk menghilangkan ide itu dan bagaimana mewujudkannya, tetapi Anda tidak melihat banyak kasus penggunaan yang berhasil. Tahun berikutnya, 2024, adalah tahun penyebaran – Orang -orang benar -benar memasukkan kode ke lapangan dan melihat apa yang bisa dilakukannya. (Jawabannya, pada saat itu, adalah … tidak banyak. Dan diisi dengan banyak pesan kesalahan.)

Saya dapat menentukan hype di sekitar agen AI menjadi luas untuk satu pengumuman spesifik: pada bulan Februari 2024, Klarna, sebuah perusahaan fintech, dikatakan Setelah satu bulan, asisten AI-nya (didukung oleh teknologi Openai) telah berhasil melakukan pekerjaan 700 agen layanan pelanggan penuh waktu dan otomatis dua pertiga dari obrolan layanan pelanggan perusahaan. Selama berbulan -bulan, statistik itu muncul di hampir setiap percakapan industri AI yang saya lakukan.

Hype tidak pernah mereda, dan pada bulan -bulan berikutnya, setiap CEO teknologi besar tampaknya harpa dalam jangka waktu dalam setiap panggilan pendapatan. Eksekutif di Amazon, Meta, Google, Microsoft, dan sejumlah besar perusahaan lain mulai berbicara tentang komitmen mereka untuk membangun agen AI yang bermanfaat dan sukses – dan mencoba meletakkan uang mereka di mana mulut mereka mewujudkannya.

Bagaimana keadaannya

Visinya adalah bahwa suatu hari, agen AI dapat melakukan segalanya mulai dari buku Anda untuk menghasilkan visual untuk presentasi bisnis Anda. Alat yang ideal bahkan dapat, mengatakan, menemukan waktu dan tempat yang tepat untuk bergaul dengan sekelompok teman Anda yang bekerja dengan semua kalender, preferensi makanan, dan pembatasan diet Anda – dan kemudian memesan reservasi makan malam dan membuat acara kalender untuk semua orang.

Sekarang mari kita bicara tentang “pengkodean AI” dari semuanya: selama bertahun -tahun, pengkodean AI telah membawa Industri AI Agen. Jika Anda bertanya kepada siapa pun tentang kehidupan nyata, sukses, tidak ada kasus penggunaan untuk agen AI yang terjadi sekarang Dan tidak secara konseptual di masa depan yang tidak terlalu jauh, mereka akan menunjuk pada pengkodean AI-dan itu adalah satu-satunya hal konkret yang bisa mereka tunjukkan. Banyak insinyur menggunakan agen AI untuk pengkodean, dan mereka dipandang secara objektif cukup bagus. Cukup bagus, pada kenyataannya, di Microsoft dan Google, Hingga 30 persen Kode sekarang sedang ditulis oleh agen AI. Dan untuk startup seperti Openai dan Anthropic, yang membakar uang tunai dengan harga tinggi, salah satu generator pendapatan terbesar mereka adalah alat pengkodean AI untuk klien perusahaan.

Jadi hingga saat ini, pengkodean AI telah menjadi kasus penggunaan kehidupan nyata utama dari agen AI, tetapi jelas, itu tidak menjadi pandering bagi konsumen sehari-hari. Visi itu, ingat, selalu menjadi semacam agen AI jack-of-all-trade untuk “orang biasa.” Dan kami belum cukup di sana – tetapi pada tahun 2025, kami lebih dekat dari sebelumnya.

Oktober lalu, Anthropic memulai hal -hal dengan memperkenalkan “penggunaan komputer,” sebuah alat yang memungkinkan Claude menggunakan komputer seperti kekuatan manusia – menjelajah, mencari, mengakses platform yang berbeda, dan menyelesaikan tugas -tugas kompleks atas nama pengguna. Konsensus umum adalah bahwa alat itu adalah langkah maju untuk teknologi, tetapi ulasan mengatakan bahwa dalam praktiknya, itu meninggalkan banyak hal yang diinginkan. Maju cepat hingga Januari 2025, dan Openai merilis operator, versinya dari hal yang sama, dan menagihnya sebagai alat untuk mengisi formulir, memesan bahan makanan, memesan perjalanan, dan membuat meme. Sekali lagi, dalam praktiknya, banyak pengguna sepakat bahwa alat itu kereta, lambat, dan tidak selalu efisien. Tapi sekali lagi, itu adalah langkah yang signifikan. Bulan berikutnya, OpenAI merilis Deep Research, alat AI agen yang dapat menyusun laporan penelitian panjang tentang topik apa pun untuk pengguna, dan itu juga berputar ke depan. Beberapa orang mengatakan laporan penelitian lebih mengesankan daripada konten, tetapi yang lain sangat terkesan. Dan kemudian pada bulan Juli, Openai menggabungkan penelitian dan operator mendalam menjadi satu produk agen AI: agen chatgpt. Apakah lebih baik daripada kebanyakan alat AI agen yang menghadap konsumen yang datang sebelumnya? Sangat. Apakah masih sulit untuk berhasil dalam praktik? Sangat.

Apa yang terjadi selanjutnya

Jadi ada jalan panjang untuk mencapai visi agen AI yang ideal, tetapi pada saat yang sama, kami secara teknis lebih dekat dari sebelumnya. Itu sebabnya perusahaan teknologi memasukkan lebih banyak uang ke dalam AI agen, dengan cara berinvestasi dalam komputasi tambahan, penelitian dan pengembangan, atau bakat. Google baru -baru ini merekrut CEO Windsurf, cofounder, dan beberapa anggota tim R&D, khususnya untuk membantu Google mendorong proyek agen AI ke depan. Dan perusahaan -perusahaan seperti Anthropic dan Openai saling berlomba menaiki tangga, dibunyikan oleh Rung, untuk memperkenalkan fitur tambahan untuk menempatkan agen -agen ini di tangan konsumen. (Antropik, misalnya, baru saja diumumkan Ekstensi Chrome untuk Claude yang memungkinkannya bekerja di browser Anda.)

Jadi sungguh, apa yang terjadi selanjutnya adalah bahwa kita akan melihat pengkodean AI terus membaik (dan, sayangnya, berpotensi menggantikan pekerjaan banyak orang Insinyur Perangkat Lunak Entry-Level). Kami juga akan melihat produk agen yang menghadap konsumen membaik, kemungkinan perlahan tapi pasti. Dan kita akan melihat agen yang semakin banyak digunakan untuk aplikasi perusahaan dan pemerintah, terutama karena Anthropic, Openai, dan XAI semuanya memulai debutnya platform AI khusus pemerintah dalam beberapa bulan terakhir.

Secara keseluruhan, berharap untuk melihat lebih banyak awal yang salah, dimulai dan berhenti, dan merger dan akuisisi saat kompetisi agen AI meningkat (dan gelembung hype terus menggelembung). Satu pertanyaan yang harus kita semua tanyakan pada diri kita sendiri seiring berjalannya waktu: apa yang sebenarnya kita inginkan untuk dapat dilakukan oleh “agen AI” konseptual untuk kita? Apakah kita ingin mereka mengganti hanya logistik atau juga aspek kehidupan manusia yang lebih pribadi (yaitu, membantu menulis roti panggang pernikahan atau catatan untuk pengiriman bunga)? Dan seberapa baik mereka membantu logistik vs. hal -hal pribadi? (Jawaban untuk yang terakhir: tidak terlalu bagus saat ini.)

Omong-omong

Selain biaya lingkungan astronomi AI – terutama untuk model besar, yang merupakan upaya agen AI – ada gajah di ruangan itu. Dan itulah gagasan bahwa “AI yang lebih pintar yang dapat melakukan apa saja untuk Anda” tidak selalu baik, terutama ketika orang ingin menggunakannya untuk melakukan … hal -hal buruk. Hal -hal seperti menciptakan senjata kimia, biologis, radiologis, dan nuklir (CBRN). Perusahaan AI top mengatakan mereka semakin khawatir tentang risiko itu. (Tentu saja, mereka tidak cukup khawatir untuk berhenti membangun.)
Mari kita bicara tentang regulasi semua itu. Banyak orang memiliki kekhawatiran tentang implikasi AI, tetapi banyak yang tidak sepenuhnya menyadari bahaya potensial yang ditimbulkan oleh agen AI yang membantu uber, yang bertujuan untuk melakukan AI di tangan aktor buruk, baik di Amerika Serikat maupun di luar negeri (pikirkan: “Hacking getaran,” penipuan roman, dan banyak lagi). Perusahaan AI mengatakan mereka berada di depan risiko dengan perlindungan sukarela yang telah mereka terapkan. Tetapi banyak orang lain mengatakan ini mungkin merupakan kasus untuk pemeriksaan usus eksternal.

Baca ini

23 komentar

Ikuti topik dan penulis Dari cerita ini untuk melihat lebih banyak seperti ini di umpan beranda pribadi Anda dan untuk menerima pembaruan email.

Hayden Field

Post Views: 61

Bagaimana itu dimulai

Bagaimana keadaannya

Apa yang terjadi selanjutnya

Omong-omong

Baca ini

Read Also