Model baru Claude lebih 'jujur' ketika membuat kekacauan

Jay Peters

adalah reporter senior yang meliput teknologi, game, dan banyak lagi. Dia bergabung dengan The Verge pada tahun 2019 setelah hampir dua tahun di Techmeme.

Anthropic merilis Claude Opus 4.8 pada hari Kamis, dan perusahaan menggembar-gemborkan “kejujuran” model tersebut.

Menurut ke Antropisitu melatih “semua [its] sejujurnya — misalnya, untuk menghindari membuat klaim yang tidak dapat mereka dukung.” Namun laporan tersebut mencatat bahwa “masalah umum dengan model AI adalah mereka terkadang langsung mengambil kesimpulan, dan dengan percaya diri menampilkan pekerjaan mereka sebagai kemajuan meskipun hanya ada sedikit bukti.”

Laboratorium AI mengklaim bahwa para penguji awal telah menemukan bahwa Opus 4.8 “lebih cenderung menunjukkan ketidakpastian mengenai kinerjanya dan kecil kemungkinannya untuk membuat klaim yang tidak didukung.” Dalam evaluasi perusahaan, Opus 4.8 “sekitar 4x lebih kecil kemungkinannya dibandingkan pendahulunya untuk membiarkan kelemahan dalam kode yang ditulisnya diabaikan begitu saja.”

Selain peningkatan kejujuran, dengan Opus 4.8, pengguna dapat mengarahkan jumlah upaya yang dilakukan Claude dalam suatu tugas. Respons dengan upaya yang lebih tinggi akan menggunakan lebih banyak token, sehingga memberi pengguna opsi untuk respons dengan upaya yang lebih rendah jika mereka tidak ingin melampaui batas kecepatan mereka dengan cepat.

Anthropic juga meluncurkan fitur yang disebut “alur kerja dinamis” dalam pratinjau penelitian, yang menurut perusahaan akan memungkinkan Claude “mengambil tugas yang lebih besar.” Dengan alur kerja yang dinamis, “Claude dapat merencanakan pekerjaan dan kemudian menjalankan ratusan subagen paralel dalam satu sesi (dan dengan Opus 4.8, agen dapat berjalan lebih lama lagi). Ia kemudian memverifikasi keluarannya sebelum melaporkan kembali ke pengguna.”

Ikuti topik dan penulis dari cerita ini untuk melihat lebih banyak hal serupa di feed beranda hasil personalisasi Anda dan untuk menerima pembaruan email.

Jay Peters

Post Views: 11

Read Also