CUDA Membuktikan Nvidia Adalah Perusahaan Perangkat Lunak

Maafkan saya untuk dimulai dengan sebuah klise, sebuah jargon keuangan yang baru-baru ini masuk ke dalam leksikon teknologi, namun saya khawatir saya harus berbicara tentang “parit.” Dipopulerkan beberapa dekade yang lalu oleh Warren Buffett untuk merujuk pada keunggulan kompetitif perusahaan, kata tersebut sampai ke dalam diskusi singkat di Silicon Valley ketika sebuah memo konon bocor dari Googleberjudul “Kami Tidak Memiliki Parit, dan OpenAI juga Tidak,” khawatir bahwa AI sumber terbuka akan menjarah benteng Big Tech.

Beberapa tahun kemudian, tembok kastil tetap aman. Terlepas dari kepanikan singkat ketika Pencarian Mendalam pertama kali muncul, model AI sumber terbuka belum jauh mengungguli model berpemilik. Namun, tidak ada laboratorium terdepan—OpenAI, Anthropic, Google—yang memiliki parit untuk dibicarakan.

Perusahaan yang memang memiliki parit adalah Nvidia. CEO Jensen Huang menyebutnya sebagai “harta” paling berharga. Hal ini tidak terjadi, seperti yang mungkin Anda asumsikan pada a perusahaan chipsebuah perangkat keras. Itu adalah sesuatu yang disebut CUDA. Apa yang terdengar seperti senyawa kimia yang dilarang oleh FDA mungkin merupakan salah satu penyebab utama AI.

CUDA secara teknis berdiri untuk Menghitung Arsitektur Perangkat Terpadu, tetapi sangat mirip laser atau scubatidak ada yang mau memperluas akronimnya; kami hanya mengatakan “KOO-duh.” Jadi apa gunanya harta yang sangat penting ini? Jika terpaksa memberikan jawaban satu kata: paralelisasi.

Berikut ini contoh sederhananya. Katakanlah kita menugaskan sebuah mesin untuk mengisi tabel perkalian 9×9. Menggunakan komputer dengan satu inti, seluruh 81 operasi dijalankan dengan patuh satu per satu. Namun GPU dengan sembilan inti dapat menetapkan tugas sehingga setiap inti mengambil kolom yang berbeda—satu dari 1×1 hingga 1×9, satu lagi dari 2×1 hingga 2×9, dan seterusnya—untuk peningkatan kecepatan sembilan kali lipat. GPU modern bisa lebih pintar lagi. Misalnya, jika diprogram untuk mengenali komutatifitas—7×9 = 9×7—mereka dapat menghindari pekerjaan duplikat, mengurangi 81 operasi menjadi 45, dan mengurangi beban kerja hampir separuhnya. Ketika satu kali pelatihan menghabiskan biaya seratus juta dolar, setiap pengoptimalan berarti.

GPU Nvidia awalnya dibuat untuk merender grafis untuk video game. Pada awal tahun 2000-an, seorang mahasiswa PhD Stanford bernama Ian Buck, yang pertama kali mendalami GPU sebagai seorang gamer, menyadari bahwa arsitektur mereka dapat digunakan untuk komputasi berkinerja tinggi secara umum. Dia menciptakan bahasa pemrograman bernama Brook, dipekerjakan oleh Nvidia, dan, bersama John Nickolls, memimpin pengembangan CUDA. Jika AI mengantarkan era kelas bawah kerah putih permanen dan senjata otonom, ketahuilah bahwa itu semua terjadi karena seseorang di suatu tempat bermain-main. Malapetaka mengira skrotum setan akan bergoyang dengan kecepatan 60 frame per detik.

CUDA bukanlah bahasa pemrograman itu sendiri melainkan sebuah “platform.” Saya menggunakan kata musang itu karena, tidak seperti The New York Times yang merupakan surat kabar yang juga merupakan perusahaan game, CUDA, selama bertahun-tahun, telah menjadi kumpulan perpustakaan perangkat lunak untuk AI. Setiap fungsi menghemat nanodetik dari operasi matematika tunggal—jika dijumlahkan, fungsi tersebut membuat GPU, dalam istilah industri, berjalan lancar brrr.

Grafik modern kartu bukan sekadar papan sirkuit yang penuh dengan chip, memori, dan kipas. Ini adalah gabungan rumit dari hierarki cache dan unit khusus yang disebut “tensor core” dan “streaming multiprocessors.” Dalam hal ini, apa yang dijual oleh perusahaan chip seperti dapur profesional, dan lebih banyak inti sama dengan lebih banyak tempat pemanggangan. Namun bahkan dapur dengan 30 stasiun pemanggang tidak akan berjalan lebih cepat tanpa kepala koki yang mampu dengan cekatan menugaskan tugas—seperti yang dilakukan CUDA untuk inti GPU.

Untuk memperluas metafora tersebut, perpustakaan CUDA yang disetel dengan tangan dan dioptimalkan untuk satu operasi matriks setara dengan peralatan dapur yang dirancang untuk satu pekerjaan dan tidak lebih dari itu—pengering ceri, pengupas udang—yang merupakan kesenangan bagi juru masak rumahan, tetapi tidak jika Anda memiliki 10.000 isi perut udang untuk diambil. Yang membawa kita kembali ke DeepSeek. Para insinyurnya bekerja di bawah lapisan abstraksi yang sudah dalam ini untuk bekerja langsung di PTX, sejenis bahasa rakitan untuk GPU Nvidia. Katakanlah tugasnya adalah mengupas bawang putih. GPU yang tidak dioptimalkan akan berbunyi: “Kupas kulitnya dengan kuku Anda.” CUDA dapat menginstruksikan: “Hancurkan cengkeh dengan bagian datar pisau.” PTX memungkinkan Anda mendiktekan setiap sub-instruksi: “Angkat pisau 2,35 inci di atas talenan, buat sejajar dengan ekuator cengkeh, dan pukul ke bawah dengan telapak tangan Anda dengan gaya 36,2 newton.”

Anda dapat mulai memahami mengapa CUDA sangat berharga bagi Nvidia—dan sangat sulit untuk disentuh oleh orang lain. Menyetel kinerja GPU adalah masalah yang sulit. Anda tidak bisa begitu saja merekrut mahasiswa baru di Market Street, memberikan mereka paket Claude Max, dan mengharapkan mereka meretas kernel GPU. Menulis pada tingkat ini adalah pekerjaan yang berat—kecuali jika Anda seorang programmer yang hebat di DeepSeek.

Pengungkapan: Dalam kolom yang Dapat Dibaca Mesin sebelumnyasaya sudah paham dengan bahasa yang saya analisis. Tidak demikian halnya di sini. Demi mempertahankan standar ini, saya memutuskan untuk menghabiskan satu hari bersama CUDA. Itu merusak soreku.

Perkalian matriks sederhana yang biasanya membutuhkan tiga baris di PyTorch—kerangka kerja pembelajaran mesin yang populer—membuat saya membutuhkan lebih dari 50 baris di CUDA. Ternyata, memeras kinerja hingga titik terakhir adalah hal yang mengagumkan namun membosankan. Setelah mencelupkan kaki saya ke dalam parit, saya dapat melaporkan bahwa parit tersebut memang dalam dan menakutkan.

Dominasi CUDA tidak hanya dibangun berdasarkan kualitas ekosistemnya namun juga pada efek lock-in. Karena kerangka pembelajaran mesin modern dibangun di atas CUDA, yang terutama berjalan pada chip Nvidia, kinerja chip AMD buruk meskipun mereka memiliki lebih banyak inti dan memori. Membandingkan chip berdasarkan lembar spesifikasi seperti membandingkan mobil balap berdasarkan jumlah silinder, sedangkan performa sebenarnya hanya dapat diukur di lintasan.

Pengungkapan kedua: Saya bermaksud melakukan benchmark pada dua chip, tetapi tidak ada cara untuk menghabiskan Nvidia H100 dan AMD MI300X tanpa masuk dalam daftar hitam Condé Nast. Sebaliknya, Anda harus mengikuti kata-kata peneliti independen yang menemukan bahwa meskipun dengan spesifikasi yang lebih baik di atas kertas, AMD masih kalah dengan Nvidia.

Keunggulan Nvidia dalam bidang perangkat lunak mungkin adalah, hal yang tidak biasa bagi perusahaan chip, karena ia mempekerjakan lebih banyak insinyur perangkat lunak daripada insinyur perangkat keras. Jika saya menjalankan AMDsaya mungkin akan mengikutinya. (Tapi siapa yang bertanya padaku?)

Setiap tahun, di sana adalah calon baru yang mencoba menguras parit Nvidia, hanya untuk tenggelam di dalamnya. OpenCL, sebuah standar terbuka yang didukung oleh konsorsium yang mencakup Apple, AMD, dan Qualcomm, adalah semacam manqué Android untuk iOS CUDA. Ini hampir tidak mendapatkan daya tarik.

Sementara itu, jawaban AMD terhadap CUDA, ROCm, adalah nama yang lebih buruk daripada CUDA—apakah diucapkan “rock cum”? (Lupakan tentang mempekerjakan lebih banyak pemrogram—dapatkan tim pemasaran baru.) Perusahaan ini juga telah dilanda banyak bug dan masalah kompatibilitas sehingga subredditnya terlihat seperti kelompok pendukung.

Jangan lupa Intel. Meskipun mudah untuk mengabaikannya sebagai pembuat chip yang gagal, sejarah terkini menunjukkan bahwa mereka juga merupakan perusahaan perangkat lunak yang gagal. Dalam krisis relevansi terakhir, mereka meluncurkan oneAPI, tetapi pada tahun 2026, kita tahu pasti bahwa CUDA masih berkuasa. Jika ada penantang, itu dia Modulardipimpin oleh Chris Lattner, perancang bahasa legendaris yang termasuk di antara kreasinya, Swift dan LLVM dari Apple.

Namun rahasia umum adalah, meskipun fisikawan teoritis tidak dapat mengganti ban untuk menyelamatkan nyawa mereka, sebagian besar peneliti AI tidak dapat menulis satu baris pun dari C++. Hanya ada sedikit insinyur kernel GPU bagus yang masih hidup, dan banyak dari mereka dipekerjakan oleh Nvidia. Jauh sebelum peneliti AI mulai memperdagangkan pengaruh, para insinyur ini dengan rajin mengerjakan CUDA tanpa pujian. Bahkan agen pengkodean yang tepercaya masih tertatih-tatih dalam memahami kode kernel.

Nvidia, pada akhirnya, mungkin lebih dekat dengan Apple dibandingkan dengan AMD atau Intel. Ini adalah perusahaan perangkat keras yang hebat karena merupakan perusahaan perangkat lunak. Parit Apple melawan Android bukan hanya iPhone tetapi ekosistemnya: iOS, App Store, dan pengembangnya. Tentu, Anda bisa melipat Samsung Galaxy menjadi dua, tetapi apakah Anda benar-benar ingin menggunakan Samsung Pay? Sementara itu, industri harus menghadapi label harga Nvidia yang mahal.

Ini adalah bagian pertama dari tiga bagian Dapat Dibaca Mesin seri tentang bahasa yang mendukung AI.

Post Views: 13

Read Also