Anthropic meluncurkan model baru dengan harapan dapat memojokkan pasar di luar coding

“Model terpintar” Anthropic mendapat dorongan besar, kata perusahaan itu dalam postingan blog yang mengumumkan Claude Opus 4.6.

Mereka menyebut model baru ini sebagai “peningkatan langsung” dari pendahulunya dalam rilisnya, dengan menyatakan bahwa model tersebut dapat menangani tugas-tugas kompleks dan multi-langkah dengan lebih baik dan “lebih mendekati kualitas siap produksi pada percobaan pertama dibandingkan apa yang telah kita lihat dengan model apa pun — dokumen, spreadsheet, dan presentasi tidak memerlukan banyak pengulangan.” Ini tersedia mulai hari ini dengan harga yang sama seperti pendahulunya, dan menurut perusahaan, kekuatan khususnya terletak pada pengkodean agen, penggunaan alat, pencarian, dan analisis keuangan.

Namun yang terpenting, tampaknya dengan rilis ini, Anthropic ingin memperluas sensasi Claude saat ini lebih dari sekadar coding dan mengarahkan pasar pada jenis pekerjaan pengetahuan lainnya. Dengan Opus 4.6, Opus 4.6 berinvestasi dalam membuat model lebih baik dalam membuat presentasi di PowerPoint dan dokumen di Excel. Postingan blog tersebut menyertakan plug untuk Cowork, rilis terbaru Anthropic yang merupakan versi Claude Code yang tidak ramah pekerja teknologi, dengan harapan bahwa pengguna di industri non-teknis akan menjelajahi kasus penggunaan untuk penelitian, pemasaran, dan banyak lagi.

Dalam hal pengkodean, Anthropic mengatakan dalam rilisnya bahwa Opus 4.6 dibuat untuk meningkatkan pengalaman pengembang dengan Claude Code lebih jauh lagi, karena ia berspesialisasi dalam tugas-tugas jangka panjang dan dapat “mengambil proyek pengembangan yang biasanya memakan waktu berhari-hari dan menyelesaikannya dalam hitungan jam, menangani semuanya mulai dari arsitektur hingga penerapan.”

Perusahaan juga mengumumkan fitur yang sedang dalam pratinjau penelitian yang disebut “tim agen,” yang memungkinkan model baru untuk bekerja dalam Claude Code “seperti yang dilakukan tim teknik sebenarnya,” yang berarti dimungkinkan untuk membagi pekerjaan satu proyek ke seluruh agen yang masing-masing memiliki bagian dari proyek dan berkoordinasi satu sama lain.

Dianne Na Penn, kepala manajemen produk penelitian Anthropic, mengatakan Tepi bahwa perusahaan berfokus untuk meningkatkan pengalaman “multi-agen” bagi pengembang melalui peluncuran ini, berinvestasi pada kualitas dan kecepatan keluaran, serta menjadikan model lebih baik dalam jenis pekerjaan pengetahuan lain selain sekadar pengkodean — yaitu, Excel, PowerPoint, dan fungsi pencarian.

“Ini adalah versi pertama dari model Opus di mana kami memiliki satu juta jendela konteks yang ditawarkan dalam versi beta,” kata Penn. “Kami baru saja mendapat tanggapan positif tentang Opus 4.5 sehingga salah satu fitur utama yang diinginkan orang adalah jendela konteks yang lebih panjang sehingga mereka dapat bekerja dengan Claude di lebih banyak dokumen.”

Anthropic mengatakan dalam postingan blognya bahwa mereka menjalankan serangkaian uji keamanan “paling komprehensif” untuk Opus 4.6 dari semua modelnya hingga saat ini. Evaluasi baru mencakup evaluasi untuk kesejahteraan pengguna, pengujian yang lebih kompleks mengenai apakah Opus 4.6 dapat menolak “permintaan yang berpotensi berbahaya”, dan pengujian yang diperbarui untuk mengetahui seberapa baik model dapat secara diam-diam melakukan tindakan berbahaya. Menurut perusahaan, model ini juga menunjukkan kemampuan keamanan siber yang lebih tinggi, sehingga model ini menyertakan enam penyelidikan keamanan siber baru untuk melacak potensi penyalahgunaan.

Ikuti topik dan penulis dari cerita ini untuk melihat lebih banyak hal serupa di feed beranda hasil personalisasi Anda dan untuk menerima pembaruan email.

Lapangan Hayden

Post Views: 24

Read Also