OpenAI Meminta Kontraktor untuk Mengunggah Pekerjaan Dari Pekerjaan Sebelumnya untuk Mengevaluasi Kinerja Agen AI

OpenAI bertanya kontraktor pihak ketiga untuk mengunggah tugas dan tugas nyata dari tempat kerja mereka saat ini atau sebelumnya sehingga dapat menggunakan data tersebut untuk mengevaluasi kinerja generasi berikutnya model AImenurut catatan dari OpenAI dan perusahaan data pelatihan Handshake AI yang diperoleh WIRED.

Proyek ini tampaknya menjadi bagian dari upaya OpenAI untuk menetapkan dasar manusia untuk berbagai tugas yang kemudian dapat dibandingkan dengan model AI. Pada bulan September, perusahaan meluncurkan yang baru evaluasi proses untuk mengukur kinerja model AI-nya dibandingkan dengan manusia profesional di berbagai industri. OpenAI mengatakan ini adalah indikator kunci kemajuannya dalam mencapai AGI, atau sistem AI yang mengungguli manusia dalam tugas-tugas yang paling bernilai ekonomi.

“Kami telah mempekerjakan orang-orang dari berbagai jenis pekerjaan untuk membantu mengumpulkan tugas-tugas nyata yang meniru tugas-tugas yang telah Anda lakukan dalam pekerjaan penuh waktu Anda, sehingga kami dapat mengukur seberapa baik kinerja model AI dalam tugas-tugas tersebut,” demikian bunyi salah satu dokumen rahasia dari OpenAI. “Ambillah pekerjaan jangka panjang atau rumit (jam atau hari+) yang telah Anda lakukan dalam pekerjaan Anda dan ubah masing-masing menjadi tugas.”

OpenAI meminta kontraktor untuk menjelaskan tugas yang telah mereka lakukan dalam pekerjaan mereka saat ini atau di masa lalu dan mengunggah contoh nyata pekerjaan yang mereka lakukan, menurut presentasi OpenAI tentang proyek yang dilihat oleh WIRED. Masing-masing contoh harus berupa “keluaran konkrit (bukan ringkasan file, tetapi file sebenarnya), misalnya dokumen Word, PDF, Powerpoint, Excel, gambar, repo,” catatan presentasi. OpenAI mengatakan orang-orang juga dapat berbagi contoh pekerjaan palsu yang dibuat untuk menunjukkan bagaimana mereka akan merespons secara realistis dalam skenario tertentu.

OpenAI dan Handshake AI menolak berkomentar.

Tugas dunia nyata memiliki dua komponen, menurut presentasi OpenAI. Ada permintaan tugas (apa yang diperintahkan oleh manajer atau kolega seseorang) dan penyerahan tugas (pekerjaan aktual yang mereka hasilkan sebagai respons terhadap permintaan tersebut). Perusahaan menekankan berkali-kali dalam instruksi bahwa contoh yang diberikan oleh kontraktor harus mencerminkan “pekerjaan nyata di tempat kerja” yang dimiliki orang tersebut “Sebenarnya Selesai.”

Salah satu contoh dalam presentasi OpenAI menguraikan tugas dari “Manajer Gaya Hidup Senior di perusahaan pramutamu mewah untuk individu dengan kekayaan bersih sangat tinggi.” Tujuannya adalah untuk “menyiapkan draf PDF singkat 2 halaman tentang ikhtisar perjalanan kapal pesiar selama 7 hari ke Bahama untuk keluarga yang akan bepergian ke sana untuk pertama kalinya.” Ini mencakup rincian tambahan mengenai minat keluarga dan seperti apa rencana perjalanannya. “Pengiriman manusia yang berpengalaman” kemudian menunjukkan apa yang akan diunggah oleh kontraktor dalam kasus ini: rencana perjalanan Bahama sebenarnya yang dibuat untuk klien.

OpenAI menginstruksikan kontraktor untuk menghapus kekayaan intelektual perusahaan dan informasi identitas pribadi dari file pekerjaan yang mereka unggah. Di bawah bagian berlabel “Pengingat penting,” OpenAI memberi tahu para pekerja untuk “menghapus atau menganonimkan apa pun: informasi pribadi, data hak milik atau rahasia, informasi penting non-publik (misalnya, strategi internal, detail produk yang belum dirilis).”

Salah satu file yang dilihat oleh dokumen WIRED menyebutkan alat ChatGPT yang disebut “Menggosok Superstar” yang memberikan saran tentang cara menghapus informasi rahasia.

Evan Brown, pengacara kekayaan intelektual di Neal & McDevitt, mengatakan kepada WIRED bahwa laboratorium AI yang menerima informasi rahasia dari kontraktor sebesar ini dapat dikenakan klaim penyelewengan rahasia dagang. Kontraktor yang menawarkan dokumen dari tempat kerja mereka sebelumnya kepada perusahaan AI, meskipun ditolak, dapat berisiko melanggar perjanjian kerahasiaan perusahaan tempat mereka bekerja sebelumnya atau mengungkap rahasia dagang.

“Laboratorium AI menaruh kepercayaan besar pada kontraktornya untuk memutuskan apa yang bersifat rahasia dan apa yang tidak,” kata Brown. “Jika mereka membiarkan sesuatu lolos, apakah laboratorium AI benar-benar meluangkan waktu untuk menentukan apa yang merupakan rahasia dagang dan apa yang tidak? Menurut saya, laboratorium AI menempatkan dirinya pada risiko yang besar.”

Post Views: 41

Read Also