Home Networking Antropik: Claude sekarang dapat mengakhiri percakapan untuk mencegah penggunaan berbahaya

Antropik: Claude sekarang dapat mengakhiri percakapan untuk mencegah penggunaan berbahaya

August 17, 2025

Claude

Openai Rival Anthropic mengatakan Claude telah diperbarui dengan fitur baru yang langka yang memungkinkan model AI untuk mengakhiri percakapan ketika rasanya membahayakan atau sedang dilecehkan.

Ini hanya berlaku untuk Claude Opus 4 dan 4.1, dua model paling kuat yang tersedia melalui paket berbayar dan API. Di sisi lain, Claude Sonnet 4, yang merupakan model perusahaan yang paling banyak digunakan, tidak akan mendapatkan fitur ini.

Antropik menggambarkan langkah ini sebagai “model kesejahteraan.”

“Di dalam Pengujian pra-penempatan dari Claude Opus 4kami memasukkan penilaian kesejahteraan model awal, “kata antropik.

“Sebagai bagian dari penilaian itu, kami menyelidiki preferensi Claude yang dilaporkan sendiri dan perilaku, dan menemukan keengganan yang kuat dan konsisten untuk membahayakan.”

Claude tidak berencana untuk menyerah pada percakapan ketika tidak dapat menangani kueri. Mengakhiri percakapan akan menjadi pilihan terakhir ketika upaya Claude untuk mengarahkan pengguna ke sumber daya yang bermanfaat telah gagal.

“Skenario di mana ini akan terjadi adalah kasus tepi ekstrem – sebagian besar pengguna tidak akan memperhatikan atau dipengaruhi oleh fitur ini dalam penggunaan produk normal apa pun, bahkan ketika membahas masalah yang sangat kontroversial dengan Claude,” tambah perusahaan.

Claude ai — **Sumber: BleepingComputer**

Seperti yang dapat Anda lihat di tangkapan layar di atas, Anda juga dapat secara eksplisit meminta Claude untuk mengakhiri obrolan. Claude menggunakan alat end_conversation untuk mengakhiri obrolan.

Fitur ini sekarang diluncurkan.

Post Views: 59

Read Also