Scroll untuk baca artikel
Networking

NVIDIA membagikan panduan untuk membela GDDR6 GPU terhadap serangan Rowhammer

71
×

NVIDIA membagikan panduan untuk membela GDDR6 GPU terhadap serangan Rowhammer

Share this article
nvidia-membagikan-panduan-untuk-membela-gddr6-gpu-terhadap-serangan-rowhammer
NVIDIA membagikan panduan untuk membela GDDR6 GPU terhadap serangan Rowhammer

NVIDIA membagikan panduan untuk membela GDDR6 GPU terhadap serangan Rowhammer

NVIDIA memperingatkan pengguna untuk mengaktifkan mitigasi kode yang mengoreksi kesalahan tingkat sistem untuk melindungi terhadap serangan Rowhammer pada prosesor grafis dengan memori GDDR6.

Example 300x600

Perusahaan memperkuat rekomendasi sebagai penelitian baru Diterbitkan oleh University of Toronto menunjukkan kepraktisan serangan Rowhammer terhadap GPU NVIDIA A6000 (Unit Pemrosesan Grafis).

“Kami menjalankan Gpuhammer pada NVIDIA RTX A6000 (48 GB GDDR6) di empat bank DRAM dan mengamati 8 flip tunggal-bit yang berbeda, dan bit-flip di semua bank yang diuji,” jelas para peneliti.

“Jumlah aktivasi minimum (TRH) untuk menginduksi flip adalah ~ 12k, konsisten dengan temuan DDR4 sebelumnya.”

“Menggunakan flips ini, kami melakukan serangan degradasi akurasi ML pertama menggunakan Rowhammer pada GPU.”

RowHammer adalah kesalahan perangkat keras yang dapat dipicu melalui proses perangkat lunak dan berasal dari sel memori yang terlalu dekat satu sama lain. Serangan itu ditunjukkan pada sel DRAM tetapi juga dapat mempengaruhi memori GPU.

Ia bekerja dengan mengakses baris memori dengan operasi baca-tulis yang cukup, yang menyebabkan nilai bit data yang berdekatan membalik dari satu ke nol dan sebaliknya, menyebabkan informasi dalam memori berubah.

Efeknya bisa menjadi kondisi penolakan layanan, korupsi data, atau bahkan eskalasi hak istimewa.

Kode Koreksi Kesalahan Level Sistem (ECC) dapat mempertahankan integritas data dengan menambahkan bit yang berlebihan dan memperbaiki kesalahan bit tunggal untuk mempertahankan keandalan dan akurasi data.

Di WorkStation dan Data Center GPU di mana VRAM menangani kumpulan data besar dan perhitungan yang tepat terkait dengan beban kerja AI, ECC harus diaktifkan untuk mencegah kesalahan penting dalam operasi mereka.

Pemberitahuan keamanan NVIDIA mencatat bahwa para peneliti di University of Toronto menunjukkan “serangan potensial Rowhammer terhadap GPU NVIDIA A6000 dengan memori GDDR6” di mana ECC tingkat sistem tidak diaktifkan.

Para peneliti akademis mengembangkan Gpuhammer, metode serangan untuk membalikkan bit pada ingatan GPU.

Meskipun palu lebih sulit pada GDDR6 karena latensi yang lebih tinggi dan penyegaran lebih cepat dibandingkan dengan DDR4 berbasis CPU, para peneliti dapat menunjukkan hal itu Serangan Rowhammer pada GPU Bank memori dimungkinkan.

Peneliti Gururaj Saileshwar menyoroti ke BleepingComputer bahwa Gpuhammer dapat menurunkan akurasi model AI dari 80% menjadi di bawah 1% dengan flip tunggal pada GPU A6000.

Terlepas dari RTX A6000, pembuat GPU juga merekomendasikan Mengaktifkan ECC tingkat sistem untuk produk berikut:

GPU pusat data:

  • Ampre: A100, A40, A30, A16, A10, A2, A800
  • Ada: L40S, L40, L4
  • Hopper: H100, H200, GH200, H20, H800
  • Blackwell: GB200, B200, B100
  • Turing: T1000, T600, T400, T4
  • Volta: Tesla V100, Tesla V100S

GPU Workstation:

  • Ampere RTX: A6000, A5000, A4500, A4000, A2000, A1000, A400
  • Ada RTX: 6000, 5000, 4500, 4000, 4000 SFF, 2000
  • Blackwell RTX Pro (jalur workstation terbaru)
  • Turing RTX: 8000, 6000, 5000, 4000
  • Return: Frame GV100

Tertanam / Industri:

  • Industri Jetson Agx Orin
  • Musik igx

Pembuat GPU mencatat bahwa GPU yang lebih baru seperti Blackwell RTX 50 Series (GEFORCE), Blackwell Data Center GB200, B200, B100, dan Hopper Data Center H100, H200, H20, dan GH200, datang dengan perlindungan ECC on-die bawaan, yang tidak memerlukan intervensi dari pengguna.

Salah satu cara untuk memeriksa apakah Level Sistem ECC diaktifkan adalah dengan menggunakan metode out-of-band yang memanfaatkan BMC (pengontrol manajemen alas baseboard) dan perangkat lunak antarmuka perangkat keras, seperti API Redfishuntuk memeriksa status “eccmodeenabled”.

Alat seperti NSM Tipe 3 dan NVIDIA SMBPBI juga dapat digunakan untuk konfigurasi, meskipun mereka memerlukan akses ke portal mitra NVIDIA.

Metode in-band kedua juga ada, menggunakan utilitas baris perintah NVIDIA-SMI dari CPU sistem untuk memeriksa dan mengaktifkan ECC di mana didukung.

Sailshwar memperkirakan bahwa rekomendasi ini menimbulkan perlambatan hingga 10% untuk inferensi ML dan kehilangan kapasitas memori 6,5% di semua beban kerja.

RowHammer merupakan masalah keamanan nyata yang dapat menyebabkan korupsi data atau memungkinkan serangan di lingkungan multi-penyewa seperti server cloud di mana GPU yang rentan dapat digunakan.

Namun, risiko nyata tergantung pada konteks, dan mengeksploitasi Rowhammer secara andal rumit, membutuhkan kondisi spesifik, laju akses yang tinggi, dan kontrol yang tepat, membuatnya menjadi serangan sulit untuk dieksekusi.

Perbarui 7/12 – Menambahkan tautan ke penelitian dan detail yang disediakan oleh para peneliti.

Jarum tines

8 Ancaman Umum pada tahun 2025

Sementara serangan awan mungkin tumbuh lebih canggih, penyerang masih berhasil dengan teknik yang sangat sederhana.

Menggambar dari deteksi Wiz di ribuan organisasi, laporan ini mengungkapkan 8 teknik utama yang digunakan oleh aktor ancaman cloud-fluent.