Otak Robot Open Source Ini Berpikir dalam 3D

Ahli robotik Eropa saat ini merilis sumber terbuka yang kuat kecerdasan buatan model yang bertindak sebagai otak bagi industri robot—membantu mereka memahami dan memanipulasi berbagai hal dengan ketangkasan baru.

Model baru, TOMBAK-1dikembangkan oleh para peneliti di Institut Ilmu Komputer, Kecerdasan Buatan dan Teknologi (INSAIT) di Bulgaria. Hal ini dapat membantu peneliti dan startup lain membangun dan bereksperimen dengan perangkat keras yang lebih cerdas untuk pabrik dan gudang.

Sama seperti model bahasa sumber terbuka yang memungkinkan para peneliti dan perusahaan bereksperimen dengan AI generatif, Martin Vechev, ilmuwan komputer di INSIAT dan ETH Zurich, mengatakan SPEAR-1 seharusnya membantu para robotika untuk bereksperimen dan melakukan iterasi dengan cepat. “Model berbobot terbuka sangat penting untuk memajukan AI,” kata Vechev kepada WIRED sebelum peluncurannya.

SPEAR-1 berbeda dari model pondasi robot yang ada karena model ini menggabungkan data 3D ke dalam campuran pelatihannya. Hal ini memberi model pemahaman yang lebih baik tentang dunia fisik, sehingga lebih mudah untuk memahami bagaimana objek bergerak melalui ruang fisik.

Model landasan robot umumnya dibangun di atas model bahasa visi (VLM) yang memiliki pemahaman luas namun terbatas tentang dunia fisik karena pelatihan cenderung berasal dari gambar 2D berlabel. “Pendekatan kami mengatasi ketidaksesuaian antara ruang 3D tempat robot beroperasi dan pengetahuan tentang VLM yang membentuk inti model fondasi robot,” kata Vechev.

SPEAR-1 kira-kira sama kemampuannya dengan model pondasi komersial yang dirancang untuk mengoperasikan robot, jika diukur di RoboArena, sebuah patokan yang menguji kemampuan model untuk membuat robot melakukan hal-hal seperti memeras botol saus tomat, menutup laci, dan menjepit potongan kertas menjadi satu.

Perlombaan untuk membuat robot lebih pintar sudah terjadi miliaran dolar menungganginya. Potensi komersial dari robot yang umumnya berkemampuan tinggi telah melahirkan startup-startup yang memiliki pendanaan besar, termasuk Memisahkan Dan Generalis di samping itu Kecerdasan Fisik. SPEAR-1 hampir sama baiknya dengan Pi-0.5 dari Kecerdasan Fisik, sebuah startup bernilai miliaran dolar yang didirikan oleh tim peneliti robotika terbaik.

SPEAR-1 menunjukkan bahwa upaya untuk membuat robot yang lebih cerdas mungkin melibatkan model tertutup seperti OpenAI, Google, dan Anthropic, serta varian sumber terbuka seperti Llama, DeepSeek, dan Qwen.

Namun, kecerdasan robot masih dalam tahap awal. Model AI dapat dilatih untuk mengoperasikan lengan robot sehingga dapat dengan andal mengambil objek tertentu dari meja. Namun dalam praktiknya, model tersebut perlu dilatih ulang dari awal jika menggunakan jenis lengan robot yang berbeda atau jika objek atau lingkungan diubah.

Peneliti robotika berharap bahwa resep yang sama yang menghasilkan model bahasa besar—data pelatihan dan komputasi dalam jumlah besar—pada akhirnya akan menghasilkan model robot dengan kemampuan umum serupa. Ini berarti robot mampu beradaptasi dengan sangat cepat terhadap situasi baru atau tugas baru. Pada akhirnya, model seperti itu memungkinkan humanoid beroperasi di lingkungan yang berantakan dan asing, berkat pemahaman umum tentang cara kerja dunia.

Karl Pertsch, peneliti di perusahaan Physical Intelligence, mengatakan masih terlalu dini untuk mengetahui betapa pentingnya data pelatihan 3D untuk model fondasi robot. Namun, dia menambahkan bahwa SPEAR-1 menunjukkan betapa cepatnya kemajuan model robotik yang lebih umum. “Sungguh menyenangkan melihat kelompok akademis membuat kebijakan yang cukup umum dan dapat dievaluasi di berbagai lingkungan secara langsung, dan [can] mencapai kinerja yang tidak sepele,” kata Pertsch. “Hal ini tidak mungkin terjadi bahkan setahun yang lalu.”

Post Views: 41

Read Also