Model baru Anthropic unggul dalam penalaran dan perencanaan - dan memiliki keterampilan Pokémon untuk membuktikannya

Antropik mengumumkan dua Model Baru, Claude 4 Opus dan Claude Sonnet 4, selama konferensi pengembang pertamanya di San Francisco pada hari Kamis. Claude 4 Opus akan segera tersedia untuk membayar pelanggan Claude, sementara Claude Sonnet 4 akan tersedia untuk pengguna gratis dan berbayar.

Model -model baru, yang melompat konvensi penamaan dari 3,7 langsung ke 4, memiliki sejumlah kekuatan, termasuk kemampuan mereka untuk bernalar, merencanakan, dan mengingat konteks percakapan selama periode waktu yang lama, kata perusahaan itu. Claude 4 Opus juga lebih baik dalam bermain Pokémon daripada pendahulunya.

“Itu dapat bekerja secara agen di Pokémon selama 24 jam,” kata kepala produk produk Anthropic Mike Krieger dalam sebuah wawancara dengan Wired. Sebelumnya, model terpanjang yang bisa dimainkan adalah 45 menit, juru bicara perusahaan menambahkan.

Beberapa bulan yang lalu, Anthropic meluncurkan aliran kedutan yang disebut “Claude Plays Pokémon” yang menampilkan kemampuan Claude 3.7 Sonnet di Pokémon Red Live. Demo ini dimaksudkan untuk menunjukkan bagaimana Claude dapat menganalisis permainan dan membuat keputusan langkah demi langkah, dengan arah minimal.

Atas perkenan Antropik

Pemimpin di balik penelitian Pokémon adalah David Hershey, anggota staf teknis di Anthropic. Dalam sebuah wawancara dengan Wired, Hershey mengatakan dia memilih Pokémon Red karena itu adalah “taman bermain yang sederhana,” yang berarti permainan berbasis giliran dan tidak memerlukan reaksi real-time, yang perjuangan model Anthropic saat ini. Itu juga merupakan video game pertama yang pernah ia mainkan, pada Game Boy asli, setelah mendapatkannya untuk Natal pada tahun 1997. “Ini memiliki tempat yang cukup istimewa di hati saya,” kata Hershey.

Tujuan menyeluruh Hershey dengan penelitian ini adalah mempelajari bagaimana Claude dapat digunakan sebagai agen – bekerja secara mandiri untuk melakukan tugas -tugas kompleks atas nama pengguna. Meskipun tidak jelas apa pengetahuan sebelumnya yang dimiliki Claude tentang Pokémon dari data pelatihannya, prompt sistemnya minimal berdasarkan desain: Anda adalah Claude, Anda bermain Pokémon, berikut adalah alat yang Anda miliki, dan Anda dapat menekan tombol di layar.

“Seiring waktu, saya telah melalui dan menghapus semua hal khusus Pokémon yang saya bisa, hanya karena saya pikir sangat menarik untuk melihat seberapa banyak model dapat mencari tahu sendiri,” kata Hershey, menambahkan bahwa ia berharap dapat membangun permainan yang belum pernah dilihat Claude sebelumnya untuk benar-benar menguji batasnya.

Ketika Claude 3.7 Sonnet memainkan permainan, itu mengalami beberapa tantangan: itu dihabiskan “puluhan jamTerjebak di satu kota dan mengalami kesulitan mengidentifikasi karakter non-pemain, yang secara drastis menghambat kemajuannya dalam permainan. Dengan Claude 4 Opus, Hershey memperhatikan peningkatan dalam memori jangka panjang Claude dan kemampuan perencanaan ketika ia menyaksikannya menavigasi dua hari yang kompleks. Umpan balik langsung, menunjukkan tingkat koherensi baru, yang berarti model memiliki kemampuan yang lebih baik tetap di jalur.

“Ini adalah salah satu cara favorit saya untuk mengenal model. Seperti, ini adalah bagaimana saya memahami apa kekuatannya, apa kelemahannya,” kata Hershey. “Ini cara saya hanya untuk memahami model baru ini yang akan kami keluarkan, dan bagaimana cara mengatasinya.”

Semua orang menginginkan agen

Penelitian Pokémon Anthropic adalah pendekatan baru untuk mengatasi masalah yang sudah ada sebelumnya – bagaimana kita memahami keputusan apa yang dibuat AI ketika mendekati tugas -tugas rumit, dan mendorongnya ke arah yang benar?

Jawaban atas pertanyaan itu merupakan bagian integral dari memajukan agen AI yang sangat banyak di industri-AI yang dapat menangani tugas-tugas rumit dengan kemandirian relatif. Di Pokémon, penting bahwa model itu tidak kehilangan konteks atau “melupakan” tugas yang dihadapi. Itu juga berlaku untuk agen AI yang diminta untuk mengotomatisasi alur kerja – bahkan yang membutuhkan ratusan jam.

“Sebagai tugas berubah dari menjadi tugas lima menit menjadi tugas 30 menit, Anda dapat melihat kemampuan model untuk tetap koheren, untuk mengingat semua hal yang perlu dicapai [the task] Berhasil lebih buruk dari waktu ke waktu, ”kata Hershey.

Antropik, Seperti banyak laboratorium AI lainnyaberharap untuk menciptakan agen yang kuat untuk dijual sebagai produk bagi konsumen. Krieger mengatakan bahwa “tujuan teratas” Anthropic tahun ini adalah Claude “Melakukan Jam kerja untuk Anda.”

“Model ini sekarang memberikannya-kami melihat salah satu pelanggan akses awal kami memiliki model yang meledak selama tujuh jam dan melakukan refactor besar,” kata Krieger, merujuk pada proses merestrukturisasi sejumlah besar kode, seringkali untuk membuatnya lebih efisien dan terorganisir.

Ini adalah masa depan yang sedang dikerjakan perusahaan seperti Google dan Openai. Awal minggu ini, Google merilis Mariner, agen AI yang dibangun di Chrome Itu bisa melakukan tugas seperti membeli bahan makanan (seharga $ 249,99 per bulan). Openai baru -baru ini merilis agen pengkodedan beberapa bulan yang lalu itu meluncurkan operatoragen yang dapat menelusuri web atas nama pengguna.

Dibandingkan dengan para pesaingnya, antropik sering dipandang sebagai penggerak yang lebih hati -hati, dengan cepat dalam penelitian tetapi lebih lambat pada penyebaran. Dan dengan AI yang kuat, itu kemungkinan positif: ada banyak yang bisa salah dengan agen yang memiliki akses ke informasi sensitif seperti kotak masuk pengguna atau login bank. Dalam sebuah posting blog pada hari Kamis, Anthropic mengatakan, “Kami telah secara signifikan mengurangi perilaku di mana model menggunakan pintasan atau celah untuk menyelesaikan tugas.” Perusahaan juga mengatakan bahwa baik Claude 4 Opus dan Claude Sonnet 4 adalah 65 persen lebih kecil kemungkinannya untuk terlibat dalam perilaku ini, yang dikenal sebagai peretasan hadiah, daripada model sebelumnya – setidaknya pada tugas pengkodean tertentu.

Kepala Ilmuwan Antropik, Jared Kaplan, memberi tahu WIRED bahwa Claude 4 Opus adalah model pertama perusahaan yang diklasifikasikan sebagai ASL-3-A tingkat keamanan yang digunakan perusahaan untuk mengevaluasi risiko model.

“ASL-3 mengacu pada sistem yang secara substansial meningkatkan risiko penyalahgunaan bencana dibandingkan dengan baseline non-AI,” perusahaan itu dikatakan Dalam posting blog yang menguraikan kebijakan.

Kaplan mengatakan Tim Merah Perbatasan, kelompok keselamatan yang bertanggung jawab atas model antropik pengujian stres untuk kerentanan, melakukan evaluasi luas pada Opus Claude 4 dan mengembangkan langkah-langkah baru untuk mengurangi risiko bencana. Dalam sebuah pernyataan yang disediakan oleh perusahaan, seorang juru bicara mengatakan Sonnet 4 sedang dirilis di bawah ASL-2, klasifikasi keselamatan dasar untuk semua model antropik. Model yang lebih besar, Opus 4, diperlakukan lebih hati-hati di bawah aturan ASL-3 yang lebih ketat kecuali jika lebih banyak pengujian menunjukkan bahwa itu dapat direklasifikasi sebagai ASL-2.

Tujuannya adalah untuk membangun AI yang dapat menangani tugas-tugas jangka panjang yang semakin kompleks dengan aman dan andal, kata Kaplan, menambahkan bahwa lapangan bergerak cepat, melewati chatbots sederhana dan menuju AI yang bertindak sebagai “kolaborator virtual.” Ini belum ada, dan tantangan utama untuk setiap laboratorium AI adalah meningkatkan keandalan jangka panjang. “Tidak ada gunanya jika di tengah jalannya membuat kesalahan dan semacam itu,” kata Kaplan.

UPDATE 5/22/25 1:35 ET: Kisah ini telah diperbarui untuk menyertakan detail baru tentang ketersediaan Claude 4 Opus dan Claude Sonnet 4.

Post Views: 101

Semua orang menginginkan agen

Read Also