Scroll untuk baca artikel
Edukasi

Reddit Memutus Layanan Scraper Mesin Pencari, Termasuk Bing

153
×

Reddit Memutus Layanan Scraper Mesin Pencari, Termasuk Bing

Share this article
reddit-memutus-layanan-scraper-mesin-pencari,-termasuk-bing
Reddit Memutus Layanan Scraper Mesin Pencari, Termasuk Bing

Ini menarik.

Minggu ini, Reddit mas pindah ke blokir mesin pencari selain Google dari merayapi situsnya, melalui pembaruan pada file robot.txt yang memblokir perayapnya.

Example 300x600

Bing milik Microsoft kini telah berhenti merayapi Reddit, setelah pembaruan pada file robots.txt platform tersebut pada tanggal 1 Juli, yang pada dasarnya menolak akses ke semua mesin pencari yang tidak disetujui, artinya hasil Reddit tidak akan ditampilkan di mesin pencari lain.

Kecuali, tentu saja, Google.

Reddit menandatangani kesepakatan data senilai $60 juta per tahun dengan Google kembali pada bulan Februariyang telah melihat Google merujuk lebih banyak lalu lintas ke halamannyadan tampaknya kesepakatan ini kini telah memberdayakan Reddit untuk menetapkan preseden dalam akses data, karena berupaya memperluas potensi pendapatannya.

Meskipun Reddit mengatakan bahwa hal itu tidak secara khusus terkait dengan kesepakatan Google.

Sesuai Reddit:

“Hal ini sama sekali tidak terkait dengan kemitraan terkini kami dengan Google. Kami telah berdiskusi dengan beberapa mesin pencari. Kami belum dapat mencapai kesepakatan dengan semuanya, karena beberapa tidak dapat atau tidak mau membuat janji yang dapat diberlakukan terkait penggunaan konten Reddit, termasuk penggunaan mereka untuk AI.”

Pelatihan AI telah menjadi fokus besar bagi Reddit dan X (sebelumnya Twitter), dengan banyak proyek AI awal yang menggunakan kedua platform mereka untuk mendapatkan masukan yang dibuat manusia untuk LLM mereka. X Dan Bahasa Indonesia: Reddit kini telah menaikkan harga akses API mereka, dalam rangka memastikan bahwa proyek AI tidak mengambil untung dari wawasan mereka, yang juga memberi mereka kontrol lebih besar atas proyek AI mana yang mereka izinkan untuk menggunakannya dalam inisiatif mereka.

Langkah Reddit untuk membatasi akses scraper pencarian sejalan dengan hal yang sama, dengan Reddit yang ingin menerapkan lebih banyak kontrol atas datanya, untuk memaksimalkan keuntungannya.

Itu masuk akal. Reddit, yang sekarang menjadi entitas yang terdaftar secara publikberupaya meningkatkan nilai bagi pemegang sahamnya, apa pun yang mereka bisa, dan membangun bisnisnya, melalui berbagai cara, merupakan kunci bagi kelangsungan jangka panjangnya.

Data Reddit sangat berharga, karena komunitasnya mencakup berbagai topik khusus, yang memberikan wawasan dan jawaban manusiawi untuk pertanyaan web umum. Itu dapat membantu meningkatkan chatbot dan sistem AI, itulah sebabnya Google memilih membayar Reddit untuk akses.

Tampaknya Reddit kini tengah mencari kesepakatan serupa dengan mesin pencari lain, dan jika mereka tidak menyediakannya, maka Reddit akan memutusnya. Hal ini akan merugikan lalu lintas Reddit sampai taraf tertentu, dengan mengurangi tautan rujukan, tetapi Reddit jelas telah memutuskan bahwa dampak seperti itu sepadan dengan risikonya, untuk memberi nilai lebih tinggi pada datanya.

Akan menarik untuk melihat apakah platform lain akan mengikuti langkah yang sama, dan apakah Google dan yang lainnya dipaksa untuk membuat kesepakatan data untuk mempertahankan akses scraper. Perusahaan dengan data paling berharga akan menang dalam perlombaan AI, dan Reddit jelas memiliki beberapa masukan data berkualitas terbaik yang tersedia, dan akan menarik untuk melihat apakah lebih banyak platform dan penerbit berusaha untuk menghargai akses mereka dengan cara yang sama.

Jika itu yang terjadi, banyak proyek AI skala kecil akan tersingkir dari pasar, karena pemain besar mengamankan kemitraan data yang berharga, dan yang lain berpotensi dipaksa melatih dan melatih ulang model mereka pada keluaran yang dihasilkan AI.

Yang akan mengarah pada hasil dengan kualitas lebih buruk, dan penggunaan lebih sedikit, dan akhirnya, tampaknya platform seperti Reddit, dan juga Meta dan X, yang memiliki aliran masukan pengguna yang stabil, memang memegang kendali dalam perlombaan ini.

Kita lihat saja bagaimana hasilnya.