Scroll untuk baca artikel
Financial

China Deepseek baru saja menunjukkan kepada setiap perusahaan teknologi Amerika seberapa cepat mengejar ketinggalan di AI

339
×

China Deepseek baru saja menunjukkan kepada setiap perusahaan teknologi Amerika seberapa cepat mengejar ketinggalan di AI

Share this article
china-deepseek-baru-saja-menunjukkan-kepada-setiap-perusahaan-teknologi-amerika-seberapa-cepat-mengejar-ketinggalan-di-ai
China Deepseek baru saja menunjukkan kepada setiap perusahaan teknologi Amerika seberapa cepat mengejar ketinggalan di AI
  • Sebuah startup AI di Tiongkok baru saja menunjukkan cara mereka menutup kesenjangan dengan laboratorium AI terkemuka di Amerika.
  • Startup Tiongkok DeepSeek merilis model AI baru Senin lalu yang tampaknya menyaingi o1 OpenAI.
  • Kemampuan penalarannya telah mengejutkan para peneliti AI terkemuka di Amerika.

Donald Trump memulai kepresidenan barunya dengan menyatakan Amerika harus memimpin dunia. Dia baru saja mendapat peringatan dari tim peretas AI di Tiongkok yang siap menunjukkan bahwa supremasi teknologi AS tidak bisa diberikan begitu saja.

Temui DeepSeek, startup Tiongkok yang merupakan hasil dari hedge fund berusia satu dekade yang menghitung perdagangan cerdas dengan AI dan algoritme. Rilis terbarunya, yang dirilis pada hari pelantikan Trump, telah membuat banyak peneliti industri terkemuka Amerika tercengang.

Example 300x600

Dalam sebuah makalah yang dirilis Senin lalu, DeepSeek meluncurkan produk andalan baru Anda punya model disebut R1 yang menunjukkan tingkat “penalaran” yang baru. Alasan mengapa hal ini meninggalkan kesan yang sangat besar bagi para pakar AI di AS adalah hal yang penting.

Beberapa laboratorium AI dengan sumber daya terbaik di Silicon Valley semakin beralih ke “pemikiran” sebagai garda depan penelitian yang dapat mengembangkan teknologi mereka dari tingkat kecerdasan seperti siswa menjadi sesuatu yang melampaui kecerdasan manusia sepenuhnya.

Untuk mencapai hal ini, OpenAI, GoogleAnthropic, dan lainnya berfokus untuk memastikan model menghabiskan lebih banyak waktu untuk berpikir sebelum merespons permintaan pengguna. Ini adalah proses yang mahal dan intensif yang menuntut banyak daya komputasi yang ada di bawahnya.

Sebagai pengingat, OpenAI merilis o1 sepenuhnya — “model yang dirancang untuk menghabiskan lebih banyak waktu untuk berpikir sebelum merespons” — dan mendapat sambutan hangat di bulan Desember setelah rilis awal di bulan September. R1 DeepSeek menunjukkan seberapa cepat ia dapat menutup kesenjangan.

DeepSeek mempersempit kesenjangan

Apa sebenarnya yang dilakukan R1? DeepSeek mengatakan R1 mencapai “kinerja yang sebanding dengan OpenAI o1 melintasi tugas matematika, kode, dan penalaran.”

Dia makalah penelitian mengatakan hal ini dimungkinkan berkat “pembelajaran penguatan murni”, sebuah teknik yang menurut Jim Fan, manajer riset senior di Nvidia, mengingatkan akan rahasia di balik pembuatannya. Google DeepMind AlphaZero ahli dalam permainan seperti go dan catur dari awal, “tanpa meniru gerakan grandmaster manusia terlebih dahulu.” Dia menulis di X bahwa ini adalah “hal yang paling signifikan dari makalah ini.”

Kita hidup di masa ketika sebuah perusahaan non-AS menjaga misi awal OpenAI tetap hidup – penelitian yang benar-benar terbuka dan terdepan yang memberdayakan semua pihak. Itu tidak masuk akal. Hasil yang paling menghibur adalah yang paling mungkin terjadi.

DeepSeek-R1 tidak hanya menjadi sumber terbuka untuk berbagai model tetapi… pic.twitter.com/M7eZnEmCOY

— Jim Fan (@DrJimFan) 20 Januari 2025

DeepSeek, yang diluncurkan pada tahun 2023, mengatakan dalam makalahnya bahwa mereka melakukan hal ini karena tujuannya adalah untuk mengeksplorasi potensi AI untuk “mengembangkan kemampuan penalaran tanpa data yang diawasi.” Ini adalah teknik umum yang digunakan oleh peneliti AI. Perusahaan juga mengatakan bahwa versi R1 sebelumnya yang disebut R1-Zero memberi mereka “momen aha” di mana AI “belajar mengalokasikan lebih banyak waktu berpikir untuk suatu masalah dengan mengevaluasi kembali pendekatan awalnya.”

Hasil akhirnya menawarkan apa yang dikatakan profesor Wharton Ethan Mollick digambarkan sebagai tanggapan dari R1 yang berbunyi “seperti manusia yang berpikir keras”.

Khususnya, tingkat transparansi dalam pengembangan AI sulit didapat dalam catatan yang diterbitkan oleh perusahaan seperti OpenAI ketika merilis model dengan kemampuan serupa.

Nathan Lambert, seorang ilmuwan peneliti di Allen Institute for AI, mengatakan Subtumpukan bahwa makalah R1 “merupakan titik transisi utama dalam ketidakpastian dalam penelitian model penalaran” karena “hingga saat ini, model penalaran telah menjadi bidang utama penelitian industri tanpa makalah yang jelas.”

Tetap setia pada semangat keterbukaan, model R1 DeepSeek, secara kritis, telah sepenuhnya bersumber terbuka, setelah memperoleh lisensi MIT — standar industri untuk lisensi perangkat lunak.

Bersama-sama, elemen-elemen R1 ini memberikan komplikasi kepada para pemain AS yang terjebak dalam sebuah Perlombaan senjata AI dengan Tiongkok – Saingan geopolitik utama Trump – karena beberapa alasan.

Pertama, hal ini menunjukkan bahwa Tiongkok dapat menyaingi beberapa model AI terkemuka di industri dan mengimbangi perkembangan mutakhir yang dihasilkan oleh Silicon Valley.

Kedua, AI yang sangat canggih dan bersumber terbuka juga dapat menantang perusahaan yang ingin memperoleh keuntungan besar dengan menjual teknologi mereka.

OpenAI, misalnya, memperkenalkan a Paket ChatGPT Pro pada bulan Desember biayanya $200 per bulan. Nilai jualnya adalah ia menyertakan “akses tak terbatas” ke model terpintarnya saat itu, o1. Jika model sumber terbuka menawarkan kemampuan serupa secara gratis, insentif untuk membeli langganan berbayar yang mahal bisa berkurang.

Penggemar Nvidia menggambarkan situasi seperti ini di X: “Kita hidup di masa di mana perusahaan non-AS menjaga misi awal OpenAI tetap hidup — penelitian terdepan yang benar-benar terbuka dan memberdayakan semua orang.”

DeepSeek telah memamerkan pengetahuan penalarannya sebelumnya. Pada bulan November, perusahaan merilis “pratinjau R1-lite” yang menunjukkan “proses berpikir transparan dalam waktu nyata”. Pada bulan Desember, itu merilis model bernama V3 untuk berfungsi sebagai landasan baru yang lebih besar untuk penalaran model di masa depan.

Ini adalah alasan utama para peneliti Amerika melihat peningkatan yang berarti pada model terbaru, R1.

Theo Brownepengembang perangkat lunak di balik saluran YouTube populer untuk komunitas teknologi, mengatakan bahwa “model DeepSeek R1 baru sungguh luar biasa.” Tanay Jaipuria, mitra investasi AI di Wing VC Silicon Valley, juga menggambarkannya sebagai hal yang “luar biasa”.

DeepSeek R-1 luar biasa.

– Alasan level OpenAI o-1 dengan biaya 1/25
– Sepenuhnya open source dengan lisensi MIT
– Keluaran API dapat digunakan untuk distilasi pic.twitter.com/YjHbylNuH8

— Tanay Jaipuria (@tanayj) 20 Januari 2025

Awni Hannunseorang peneliti pembelajaran mesin di Apelmengatakan bahwa keunggulan utama R1 adalah tidak terlalu intensif, sehingga menunjukkan bahwa industri ini “mendekati sumber terbuka o1, di rumah, pada perangkat keras konsumen,” mengacu pada model penalaran OpenAI yang diperkenalkan tahun lalu.

Model ini dapat “disuling”, yang berarti versi yang lebih kecil namun kuat dapat berjalan pada perangkat keras yang jauh lebih intensif dibandingkan daya komputasi yang dimuat ke server di pusat data yang menjadi andalan banyak perusahaan teknologi untuk menjalankan model AI mereka.

Hannun menunjukkan hal ini dengan membagikan klip di X dari versi R1 dengan 671 miliar parameter yang berjalan pada dua chip Apple M2 Ultra, menanggapi pertanyaan yang menanyakan apakah straight atau flush lebih baik dalam permainan Texas Hold’em. Hannun mengatakan tanggapannya datang “lebih cepat dari kecepatan membaca.”

Sensor AI

R1 tampaknya memiliki satu masalah utama. Mantan anggota dewan OpenAI Helen Toner ditunjukkan pada X bahwa ada demo R1 yang “menutup dirinya sendiri ketika ditanya tentang topik yang tidak disukai PKC.”

Namun, Toner menyatakan bahwa “penyensoran jelas dilakukan oleh lapisan di atas, bukan model itu sendiri.” DeepSeek tidak segera menanggapi permintaan komentar.

Tentu saja perlu dicatat bahwa OpenAI telah memperkenalkan model baru bernama o3 yang dimaksudkan untuk menjadi penerus model o1 yang disaingi DeepSeek. Lambert mengatakan dalam posting blognya bahwa OpenAI “kemungkinan besar secara teknis lebih maju,” namun ia menambahkan peringatan utama bahwa model o3 “tidak tersedia secara umum”, dan informasi dasar seperti “bobot” tidak akan tersedia dalam waktu dekat.

Mengingat rekam jejak DeepSeek sejauh ini, jangan heran jika model berikutnya menunjukkan paritas dengan o3. Para pemimpin teknologi Amerika mungkin menemukan tandingannya di Tiongkok.