Teori Permainan Menjelaskan Bagaimana Algoritma Dapat Menaikkan Harga

Versi aslinya dari cerita ini muncul di Majalah Kuanta.

Bayangkan sebuah kota dengan dua pedagang widget. Pelanggan lebih memilih widget yang lebih murah, sehingga pedagang harus bersaing untuk menetapkan harga terendah. Tidak senang dengan keuntungan mereka yang sedikit, suatu malam mereka bertemu di sebuah kedai yang dipenuhi asap untuk mendiskusikan rencana rahasia: Jika mereka menaikkan harga bersama-sama alih-alih bersaing, mereka berdua dapat menghasilkan lebih banyak uang. Namun penetapan harga yang disengaja, yang disebut kolusi, sudah lama dianggap ilegal. Pedagang widget memutuskan untuk tidak mengambil risiko, dan semua orang dapat menikmati widget murah.

Selama lebih dari satu abad, undang-undang AS telah mengikuti pola dasar ini: Melarang transaksi rahasia tersebut, dan harga yang wajar harus dipertahankan. Saat ini, semuanya tidak sesederhana itu. Di sebagian besar perekonomian, penjual semakin bergantung pada program komputer yang disebut algoritma pembelajaran, yang berulang kali menyesuaikan harga sebagai respons terhadap data baru tentang keadaan pasar. Algoritme ini sering kali jauh lebih sederhana dibandingkan algoritme “pembelajaran mendalam” yang mendukung kecerdasan buatan modern, namun algoritme ini masih rentan terhadap perilaku yang tidak terduga.

Jadi bagaimana regulator dapat memastikan bahwa algoritma menetapkan harga yang adil? Pendekatan tradisional mereka tidak akan berhasil karena bergantung pada kolusi yang jelas. “Algoritmenya pasti tidak minum-minum satu sama lain,” katanya Harun Rothseorang ilmuwan komputer di University of Pennsylvania.

Namun a makalah tahun 2019 yang banyak dikutip menunjukkan bahwa algoritma dapat belajar berkolusi secara diam-diam, bahkan ketika algoritma tersebut tidak diprogram untuk melakukannya. Sebuah tim peneliti mengadu dua salinan algoritme pembelajaran sederhana satu sama lain dalam simulasi pasar, lalu membiarkan mereka mengeksplorasi strategi berbeda untuk meningkatkan keuntungan. Seiring berjalannya waktu, masing-masing algoritma belajar melalui trial and error untuk membalas ketika algoritma lain memotong harga—menurunkan harganya dalam jumlah yang sangat besar dan tidak proporsional. Hasil akhirnya adalah harga yang tinggi, yang didukung oleh ancaman perang harga.

Ancaman tersirat seperti ini juga mendasari banyak kasus kolusi manusia. Jadi, jika Anda ingin menjamin harga yang wajar, mengapa tidak mewajibkan penjual menggunakan algoritme yang secara inheren tidak mampu mengungkapkan ancaman?

Di dalam sebuah makalah baru-baru iniRoth dan empat ilmuwan komputer lainnya menunjukkan mengapa hal ini mungkin tidak cukup. Mereka membuktikan bahwa algoritme yang tampaknya tidak berbahaya dan mengoptimalkan keuntungan mereka sendiri terkadang dapat memberikan hasil yang buruk bagi pembeli. “Anda masih bisa mendapatkan harga tinggi dengan cara yang terlihat masuk akal dari luar,” katanya Natalie Collinaseorang mahasiswa pascasarjana yang bekerja dengan Roth yang ikut menulis studi baru ini.

Tidak semua peneliti sepakat mengenai implikasi temuan ini—kebanyakan bergantung pada cara Anda mendefinisikan “masuk akal”. Namun hal ini mengungkapkan betapa halusnya pertanyaan seputar penetapan harga algoritmik, dan betapa sulitnya mengaturnya.

“Tanpa adanya ancaman atau kesepakatan, sangat sulit bagi regulator untuk bertindak dan berkata, ‘Harga-harga ini terasa salah,’” kata Mallesh Paiseorang ekonom di Rice University. “Itulah salah satu alasan mengapa saya menganggap makalah ini penting.”

Tidak Ada Penyesalan

Makalah terbaru ini mempelajari penetapan harga algoritmik melalui lensa teori permainan, sebuah bidang interdisipliner di perbatasan ilmu ekonomi dan ilmu komputer yang menganalisis matematika persaingan strategis. Ini adalah salah satu cara untuk mengeksplorasi kegagalan algoritma penetapan harga dalam lingkungan yang terkendali.

“Apa yang kami coba lakukan adalah menciptakan kolusi di laboratorium,” katanya Joseph Harringtonseorang ekonom Universitas Pennsylvania yang menulis sebuah makalah ulasan yang berpengaruh tentang pengaturan kolusi algoritmik dan tidak terlibat dalam penelitian baru. “Setelah kami melakukannya, kami ingin mencari cara untuk menghancurkan kolusi.”

Untuk memahami ide-ide kuncinya, ada baiknya memulai dengan permainan sederhana batu-gunting-kertas. Algoritma pembelajaran, dalam konteks ini, dapat berupa strategi apa pun yang digunakan pemain untuk memilih langkah di setiap babak berdasarkan data dari babak sebelumnya. Pemain mungkin mencoba strategi yang berbeda selama permainan. Namun jika mereka bermain dengan baik, mereka pada akhirnya akan menyatu pada keadaan yang disebut oleh para ahli teori permainan sebagai keseimbangan. Dalam keseimbangan, strategi masing-masing pemain merupakan respons terbaik terhadap strategi pemain lain, sehingga tidak ada pemain yang mempunyai insentif untuk berubah.

Dalam permainan batu-kertas-gunting, strategi idealnya sederhana: Anda harus memainkan gerakan acak setiap putaran, memilih ketiga kemungkinan dengan frekuensi yang sama. Algoritme pembelajaran akan bersinar jika satu pemain mengambil pendekatan yang berbeda. Dalam hal ini, memilih gerakan berdasarkan putaran sebelumnya dapat membantu pemain lain menang lebih sering dibandingkan jika mereka hanya bermain secara acak.

Misalkan, misalnya, setelah beberapa putaran Anda menyadari bahwa lawan Anda, seorang ahli geologi, lebih dari 50 persen memilih batuan. Jika Anda bermain kertas setiap putaran, Anda akan lebih sering menang. Para ahli teori permainan menyebut realisasi menyakitkan ini sebagai penyesalan.

Para peneliti telah merancang algoritma pembelajaran sederhana yang selalu dijamin tidak akan membuat Anda menyesal. Algoritme pembelajaran yang sedikit lebih canggih yang disebut algoritma “no-swap-regret” juga menjamin bahwa apa pun yang dilakukan lawan Anda, Anda tidak akan bisa melakukannya lebih baik jika Anda menukar semua gerakan apa pun dengan gerakan lainnya (misalnya, dengan bermain kertas setiap kali Anda benar-benar bermain gunting). Pada tahun 2000, ahli teori permainan terbukti bahwa jika Anda mengadu dua algoritma tanpa-swap-penyesalan satu sama lain dalam permainan apa pun, keduanya akan berakhir pada jenis keseimbangan tertentu—kesetimbangan yang akan menjadi keseimbangan optimal jika keduanya hanya memainkan satu putaran. Itu adalah properti yang menarik, karena permainan satu putaran jauh lebih sederhana daripada permainan multi-putaran. Secara khusus, ancaman tidak berhasil karena pemain tidak dapat menindaklanjutinya.

Di sebuah makalah 2024, Jason Hartlineseorang ilmuwan komputer di Universitas Northwestern, dan dua mahasiswa pascasarjana menerjemahkan hasil klasik dari makalah tahun 2000 ke dalam model pasar yang kompetitif, di mana pemain dapat menetapkan harga baru setiap putaran. Dalam konteks tersebut, hasil yang diperoleh menyiratkan bahwa duel algoritma tanpa-swap-penyesalan akan selalu menghasilkan harga yang kompetitif ketika mencapai keseimbangan. Kolusi tidak mungkin terjadi.

Namun, algoritma tanpa-swap-penyesalan bukanlah satu-satunya strategi permainan penetapan harga di dunia pasar online. Jadi apa yang terjadi ketika algoritma tanpa-swap-penyesalan menghadapi lawan lain yang tampak ramah?

Harganya Salah

Menurut ahli teori permainan, strategi terbaik untuk bermain melawan algoritma tanpa-swap-penyesalan adalah sederhana: Mulailah dengan probabilitas tertentu untuk setiap kemungkinan gerakan, lalu pilih satu gerakan secara acak setiap putaran, tidak peduli apa yang dilakukan lawan Anda. Penetapan probabilitas yang ideal untuk pendekatan “tidak responsif” ini bergantung pada game spesifik yang Anda mainkan.

Pada musim panas 2024, Collina dan rekannya Eshwar Arunachaleswaran berangkat untuk menemukan probabilitas optimal untuk permainan penetapan harga dua pemain. Mereka menemukan bahwa strategi terbaik memberikan probabilitas yang sangat tinggi pada harga yang sangat tinggi, serta probabilitas yang lebih rendah untuk rentang harga yang lebih rendah. Jika Anda bermain melawan algoritma tanpa-swap-penyesalan, strategi aneh ini akan memaksimalkan keuntungan Anda. “Bagi saya, ini benar-benar kejutan,” kata Arunachaleswaran.

Strategi nonresponsif tampaknya tidak berbahaya. Mereka tidak bisa menyampaikan ancaman, karena sama sekali tidak bereaksi terhadap gerak-gerik lawannya. Namun mereka dapat membujuk pembelajaran algoritma untuk menaikkan harga, dan kemudian meraup keuntungan dengan sesekali meremehkan pesaing mereka.

Awalnya, Collina dan Arunachaleswaran mengira skenario buatan ini tidak relevan dengan dunia nyata. Tentunya pemain yang menggunakan algoritma no-swap-regret akan beralih ke algoritma lain setelah menyadari bahwa pesaingnya mendapat untung dengan mengorbankan mereka.

Namun ketika mereka mempelajari masalah tersebut lebih lanjut dan mendiskusikannya dengan Roth dan dua rekan lainnya, mereka menyadari bahwa intuisi mereka salah. Kedua pemain dalam skenario mereka sudah berada dalam kondisi seimbang. Keuntungan mereka hampir sama, dan keduanya setinggi mungkin selama tidak ada pemain yang beralih ke algoritma yang berbeda. Tidak ada pemain yang memiliki insentif untuk mengubah strategi, sehingga pembeli akan terjebak dengan harga yang tinggi. Terlebih lagi, probabilitas pastinya tidak terlalu penting. Banyaknya pilihan berbeda menghasilkan harga tinggi jika dibandingkan dengan algoritma tanpa pertukaran dan penyesalan. Ini adalah hasil yang Anda harapkan dari kolusi, tetapi tanpa terlihat adanya perilaku kolusi.

Menjadi Bodoh Ada Manfaatnya

Lalu, apa yang bisa dilakukan regulator? Roth mengaku dia tidak punya jawaban. Tidak masuk akal untuk melarang algoritma tanpa pertukaran dan penyesalan: Jika semua orang menggunakannya, harga akan turun. Namun strategi sederhana yang tidak responsif mungkin merupakan pilihan yang wajar bagi penjual di pasar online seperti Amazon, meskipun hal tersebut menimbulkan risiko penyesalan.

“Salah satu cara untuk menyesal adalah dengan bersikap bodoh,” kata Roth. “Secara historis, hal itu tidak ilegal.”

Seperti yang dilihat Hartline, masalah kolusi algoritmik memiliki solusi sederhana: Larang semua algoritme penetapan harga kecuali algoritme tanpa pertukaran dan penyesalan yang telah lama disukai oleh para ahli teori permainan. Mungkin ada cara praktis untuk melakukan hal ini: Dalam pekerjaan mereka pada tahun 2024, Hartline dan rekan-rekannya merancang metode untuk memeriksa apakah suatu algoritma memiliki properti no-swap-regret tanpa melihat kodenya.

Hartline mengakui bahwa solusi pilihannya tidak akan mencegah semua hasil buruk ketika algoritma tanpa-swap-penyesalan bersaing dengan manusia. Namun dia berpendapat bahwa skenario seperti yang ada di makalah Roth bukanlah kasus kolusi algoritmik.

“Kolusi adalah hal dua arah,” katanya. “Pada dasarnya harus ada tindakan yang dapat dilakukan oleh satu pemain untuk tidak berkolusi.”

Apa pun yang terjadi, penelitian baru ini masih menyisakan banyak pertanyaan terbuka tentang bagaimana penetapan harga algoritmik bisa salah di dunia nyata.

“Kami masih belum memahami sebanyak yang kami inginkan,” kata Pai. “Ini adalah pertanyaan penting di zaman kita.”

Cerita asli dicetak ulang dengan izin dari Majalah Kuanta, publikasi editorial independen dari Yayasan Simons yang misinya adalah untuk meningkatkan pemahaman masyarakat terhadap sains dengan meliput perkembangan dan tren penelitian di bidang matematika serta ilmu fisika dan kehidupan.

Post Views: 38

Tidak Ada Penyesalan

Harganya Salah

Menjadi Bodoh Ada Manfaatnya

Read Also