Baru-baru ini, mantan presiden dan penjahat yang dihukum Donald Trump mengunggah serangkaian foto yang memperlihatkan penggemar bintang pop Taylor Swift mendukung upayanya untuk menjadi presiden AS. Foto-foto tersebut tampak dibuat dengan kecerdasan buatan, dan WIRED dapat memastikan bahwa hal itu mungkin terjadi dengan menjalankannya alat deteksi milik lembaga nirlaba True Media untuk mengonfirmasi bahwa mereka menunjukkan “bukti kuat adanya manipulasi.”
Segalanya tidak selalu semudah itu. Penggunaan AI generatif, termasuk untuk tujuan politik, telah menjadi semakin umum, dan WIRED telah pelacakan penggunaannya dalam pemilihan umum di seluruh dunia. Namun, di sebagian besar dunia di luar AS dan beberapa bagian Eropa, mendeteksi konten yang dihasilkan AI sulit dilakukan karena adanya bias dalam pelatihan sistem, sehingga jurnalis dan peneliti hanya memiliki sedikit sumber daya untuk mengatasi banjir disinformasi yang menghampiri mereka.
Mendeteksi media yang dihasilkan atau dimanipulasi menggunakan AI masih merupakan bidang yang sedang berkembang, sebagai respons terhadap ledakan tiba-tiba perusahaan AI generatif. (Perusahaan rintisan AI bergabung $21 miliar dalam investasi pada tahun 2023 saja.) “Ada banyak alat dan teknologi yang lebih mudah diakses yang benar-benar memungkinkan seseorang untuk membuat media sintetis daripada yang tersedia untuk benar-benar mendeteksinya,” kata Sabhanaz Rashid Diya, pendiri Tech Global Institute, sebuah lembaga pemikir yang berfokus pada kebijakan teknologi di Global Selatan.
Sebagian besar alat yang saat ini beredar di pasaran hanya dapat menawarkan tingkat keyakinan antara 85 dan 90 persen dalam hal menentukan apakah sesuatu dibuat dengan AI, menurut Sam Gregory, direktur program lembaga nirlaba Witness, yang membantu orang menggunakan teknologi untuk mendukung hak asasi manusia. Namun, ketika berhadapan dengan konten dari suatu tempat seperti Bangladesh atau Senegal, di mana subjeknya bukan orang kulit putih atau mereka tidak berbicara bahasa Inggris, tingkat keyakinan itu anjlok. “Seiring alat dikembangkan, mereka diprioritaskan untuk pasar tertentu,” kata Gregory. Dalam data yang digunakan untuk melatih model, “mereka memprioritaskan bahasa Inggris—bahasa Inggris beraksen AS—atau wajah yang dominan di dunia Barat.”
Ini berarti bahwa model AI sebagian besar dilatih pada data dari dan untuk pasar Barat, dan karena itu tidak dapat benar-benar mengenali apa pun yang berada di luar parameter tersebut. Dalam beberapa kasus, hal itu terjadi karena perusahaan melatih model menggunakan data yang paling mudah tersedia di internet, di mana Bahasa Inggris adalah bahasa yang paling dominan“Sebagian besar data kami, sebenarnya, dari [Africa] “dalam bentuk cetak,” kata Richard Ngamita, pendiri Thraets, organisasi teknologi sipil nirlaba yang berfokus pada ancaman digital di Afrika dan wilayah lain di belahan bumi selatan. Ini berarti bahwa kecuali data tersebut didigitalkan, model AI tidak dapat dilatih berdasarkan data tersebut.
Tanpa sejumlah besar data yang dibutuhkan untuk melatih model AI dengan cukup baik untuk mendeteksi konten yang dihasilkan atau dimanipulasi AI secara akurat, model akan sering mengembalikan positif palsu, menandai konten asli sebagai konten yang dihasilkan AI, atau negatif palsu, mengidentifikasi konten yang dihasilkan AI sebagai konten asli. “Jika Anda menggunakan salah satu alat yang tersedia untuk mendeteksi teks yang dihasilkan AI, alat tersebut cenderung mendeteksi bahasa Inggris yang ditulis oleh penutur non-asli bahasa Inggris, dan berasumsi bahwa tulisan penutur non-asli bahasa Inggris sebenarnya adalah AI,” kata Diya. “Ada banyak positif palsu karena alat tersebut tidak dilatih pada data tertentu.”
Namun, bukan hanya model yang tidak dapat mengenali aksen, bahasa, sintaksis, atau wajah yang kurang umum di negara-negara Barat. “Banyak alat deteksi deepfake awal dilatih pada media berkualitas tinggi,” kata Gregory. Namun, di sebagian besar dunia, termasuk Afrika, Merek telepon pintar Tiongkok yang menawarkan fitur-fitur yang sederhana mendominasi pasar. Foto-foto dan video yang dapat dihasilkan oleh ponsel-ponsel ini memiliki kualitas yang jauh lebih rendah, sehingga semakin membingungkan model deteksi, kata Ngamita.
Gregory mengatakan bahwa beberapa model sangat sensitif sehingga bahkan kebisingan latar belakang dalam sepotong audio, atau mengompresi video untuk media sosial, dapat mengakibatkan hasil positif atau negatif yang salah. “Tetapi itulah keadaan yang Anda hadapi di dunia nyata, deteksi yang kasar dan tidak hati-hati,” katanya. Alat gratis yang dapat diakses publik yang kemungkinan besar dapat diakses oleh sebagian besar jurnalis, pemeriksa fakta, dan anggota masyarakat sipil juga “sangat tidak akurat, dalam hal menangani ketidakadilan siapa yang terwakili dalam data pelatihan dan tantangan dalam menangani materi berkualitas rendah ini.”
AI generatif bukanlah satu-satunya cara untuk membuat media yang dimanipulasi. Apa yang disebut palsu murahanatau media yang dimanipulasi dengan menambahkan label yang menyesatkan atau sekadar memperlambat atau mengedit audio dan video, juga sangat umum di Negara-negara Berkembang, tetapi dapat secara keliru ditandai sebagai hasil manipulasi AI oleh model yang salah atau peneliti yang tidak terlatih.
Diya khawatir bahwa kelompok yang menggunakan alat yang lebih cenderung menandai konten dari luar AS dan Eropa sebagai hasil AI dapat menimbulkan dampak serius pada tingkat kebijakan, yang mendorong legislator untuk menindak masalah imajiner. “Ada risiko besar dalam hal membesar-besarkan angka seperti itu,” katanya. Dan mengembangkan alat baru bukanlah masalah menekan tombol.
Sama seperti bentuk AI lainnya, membangun, menguji, dan menjalankan model deteksi memerlukan akses ke pusat energi dan data yang tidak tersedia di sebagian besar dunia. “Jika Anda berbicara tentang AI dan solusi lokal di sini, hampir mustahil tanpa sisi komputasi bagi kami untuk menjalankan model apa pun yang ingin kami buat,” kata Ngamita, yang berbasis di Ghana. Tanpa alternatif lokal, peneliti seperti Ngamita hanya punya sedikit pilihan: membayar akses ke alat siap pakai seperti yang ditawarkan oleh Reality Defender, yang biayanya bisa jadi mahal; menggunakan alat gratis yang tidak akurat; atau mencoba mendapatkan akses melalui lembaga akademis.
Untuk saat ini, Ngamita mengatakan bahwa timnya harus bermitra dengan universitas Eropa tempat mereka dapat mengirimkan beberapa konten untuk verifikasi. Tim Ngamita telah menyusun kumpulan data dari kemungkinan contoh deepfake dari seluruh benua, yang menurutnya berharga bagi akademisi dan peneliti yang mencoba mendiversifikasi kumpulan data model mereka.
Namun, pengiriman data ke orang lain juga memiliki kekurangan. “Waktu jedanya cukup lama,” kata Diya. “Butuh waktu setidaknya beberapa minggu sebelum seseorang dapat dengan yakin mengatakan bahwa ini adalah hasil karya AI, dan pada saat itu, konten tersebut, kerusakannya sudah terjadi.”
Gregory mengatakan bahwa Witness, yang menjalankan program deteksi respons cepatnya sendiri, menerima “jumlah besar” kasus. “Sudah sulit untuk menangani kasus-kasus tersebut dalam jangka waktu yang dibutuhkan jurnalis garis depan, dan pada volume yang mulai mereka hadapi,” katanya.
Namun, Diya mengatakan bahwa terlalu berfokus pada deteksi dapat mengalihkan pendanaan dan dukungan dari organisasi dan lembaga yang menciptakan ekosistem informasi yang lebih tangguh secara keseluruhan. Sebaliknya, katanya, pendanaan perlu disalurkan ke kantor berita dan organisasi masyarakat sipil yang dapat menumbuhkan rasa percaya publik. “Saya kira bukan ke sanalah uang itu digunakan,” katanya. “Saya kira lebih banyak digunakan untuk deteksi.”



