Cakar robot meluncur menuju bola lampu di atas meja. Aku meringis, menunggu krisisnya. Namun tiba-tiba kecepatan cakarnya melambat. Ia mulai dengan hati-hati mengais-ngais meja, seolah mencari kacamatanya di meja samping tempat tidur. Dengan lembut ia menempatkan bohlam di antara kedua penjepitnya. Bohlamnya menggelinding. Cakar itu mengejarnya ke seberang meja. Setelah beberapa gigitan, bohlam kembali ke genggamannya. Robot dengan cepat memasang bohlam ke soket terdekat, menerangi area kerjanya.
Dalam lebih dari satu dekade menulis tentang robotSaya belum pernah melihat satu gerakan pun secara alami. Sebagian besar adalah orang-orang bodoh, bahkan ketika dikendalikan dari jarak jauh oleh seseorang. Dari beberapa lusin lengan robot yang ada di pasaran saat ini, tidak ada satupun yang bisa memasang sekrup pada bola lampu.
Saya datang mengunjungi Eka, sebuah startup yang berlokasi di Kendall Square, Cambridge, Massachusetts, dapat dicapai dengan berjalan kaki singkat dari MIT dan bersepeda sedikit lebih lama dari rumah saya. Kantor perusahaan berada beberapa lantai di atas salah satu restoran favorit saya, bernama Shy Bird, tempat saya sering datang bekerja dengan penjepit saya sendiri—mengetik cerita untuk WIRED.
Kantor Eka berukuran kecil, penuh dengan berbagai lengan robot, berbagai macam pegangan dan tangan, serta meja-meja yang dipenuhi pernak-pernik aneh dengan berbagai bentuk, ukuran, dan tekstur—sarung tangan, kotak kecil penutup telinga, sisir rambut, gantungan kunci, dan sebagainya.
Saya mencoba meletakkan beberapa benda di bawah robot. Mula-mula kotak penyumbat telinga, lalu sikat rambut, dan akhirnya—dalam upaya untuk membuatnya tersandung—kunci-kunci saya yang campur aduk, yang memiliki gantungan kunci yang mewah. Setiap kali, robot menukik ke bawah dan menggigit benda tersebut dengan lembut beberapa kali sebelum menggenggam dan mengangkatnya. Saat aku mencoba mengambil kembali kunciku dari mesin Eka, robot itu menolak sesaat, lalu melepaskannya dan langsung mengalihkan perhatiannya kembali ke meja, mencari sesuatu yang lain untuk diambil. Dedikasinya dalam memilih sangat mengesankan. Ini juga agak aneh.
Menyaksikan robot Eka beraksi mengingatkan saya saat pertama kali mencoba berbicara dengan ChatGPT. Robot-robot itu begitu cair, tampak alami, sehingga saya merasa ada sesuatu yang benar-benar cerdas, jika bukan manusia, di balik robot-robot itu.
Di ruang konferensi tidak jauh dari robot, salah satu pendiri Eka, Pulkit Agrawal, seorang profesor di MIT, dan Tuomas Haarnoja, mantan peneliti robotika Google DeepMind, memaparkan visi mereka untuk mesin baru yang membuat penasaran. “Beberapa tahun lalu, kami menyadari bahwa ketangkasan akhirnya bisa dipecahkan,” kata Agrawal. Demo robot Eka menunjukkan bahwa pendekatan perusahaan harus memungkinkan ketangkasan robot nyata dengan pelatihan lebih lanjut. Jika hal ini benar, maka hal ini bisa menjadi sebuah revolusi bagaimana robot digunakan—tidak hanya di pabrik dan gudang tetapi juga di toko, restoran, bahkan rumah tangga. “Triliunan dolar mengalir melalui tangan manusia,” kata Agrawal. “Bagi saya, ini adalah masalah terbesar di dunia yang harus dipecahkan.”
Kedua pria itu yakin mereka sudah setengah jalan menuju kesuksesan. Menyelesaikan masalah ketangkasan, kata mereka, kini tinggal meningkatkan pendekatannya.
Manusia tercepat dapat memecahkan Kubus Rubik dalam waktu sekitar tiga detik. Dalam tiga detik yang sama, komputer dengan Kubus Rubik virtual dapat menyelesaikannya ribuan variasi dari teka-teki itu. Seperti yang dikemukakan oleh ilmuwan komputer asal Austria, Hans Moravec, pada akhir tahun 1980-an, tugas yang sering kali tampak paling sulit bagi kita sebagai manusia adalah permainan anak-anak untuk sebuah mesin; hal-hal yang dilakukan seorang anak tanpa berpikir sering kali merupakan perjuangan mesin. Moravec menyatakan bahwa kemampuan untuk berinteraksi dengan alam fisik telah berkembang sejak lama sehingga bagi kita hal itu merupakan bawaan lahir, lebih dari sekedar penalaran “tingkat yang lebih tinggi”. Pertanyaannya adalah: Dapatkah kita menanamkan kecerdasan yang terkandung di dalamnya kepada mesin?
Salah satu mesin terbaru Eka dengan tangan tiga angka.Foto: Tony Luong

Pada bulan Oktober 2018, sekitar empat tahun sebelum peluncuran ChatGPT, OpenAI menciptakan Dactyl, sebuah tangan robot yang kemudian menggunakan AI untuk memecahkan Kubus Rubik. Perusahaan ini mengambil alih tangan Shadow Robot dan menciptakan simulasi detail sambungan, servo, motor, dan banyak lagi—tangan virtual yang memegang kubus virtual. Menggunakan pembelajaran penguatan, yang menggabungkan eksperimen dengan umpan balik positif dan negatif, OpenAI melatih jaringan saraf tiruan untuk memanipulasi kubus digital berulang kali. Setelah ribuan kali menggoyangkan jari virtualnya, Dactyl telah menemukan cara untuk menggerakkan aspek dari benda aslinya.
Dalam siaran persnya, OpenAI menyatakan bahwa Dactyl telah mencapai “ketangkasan mendekati tingkat manusia.” Faktanya, robot tidak memiliki unsur kecerdasan fisik yang kita anggap remeh. Jika kubus itu mulai terlepas dari genggamannya, ia tidak dapat pulih. Jika tangannya tidak ditempatkan pada sudut yang tepat, ia tidak dapat memanipulasi kubus sama sekali. Bahkan dalam kondisi sempurna, satu-satunya benda yang bisa dipegangnya hanyalah Kubus Rubik. Dan Kubus Rubik itu bahkan bukan yang standar—memiliki sensor yang melacak pergerakan kotak untuk memberi umpan balik ke Dactyl.
Beberapa tahun kemudian, OpenAI menghentikan pekerjaan robotiknya dan fokus pada model bahasa besar dan chatbots. (Perusahaan telah memulai kembali pengerjaan robotika.) Agrawal, yang tetap berhubungan dengan beberapa anggota tim Dactyl, mengatakan pendekatan simulasi proyek tersebut dianggap jalan buntu karena apa yang disebut kesenjangan sim-to-real. Namun dia dan Haarnoja, yang bekerja di laboratorium terpisah, tetap yakin bahwa mereka dapat menutup kesenjangan tersebut dengan membuat simulasi tersebut lebih dekat dengan aslinya.
Di Google DeepMind, Haarnoja mengerjakan proyek yang menggunakan pembelajaran penguatan virtual untuk melatih robot humanoid kecil untuk bermain sepak bola. (Jika ini terdengar lebih rumit daripada melatih tangan robot untuk memasang bola lampu, pertimbangkan bahwa lapangan sepak bola tidak berputar di bawah kaki pemainnya.) Di MIT, Agrawal sedang meneliti cara melatih tangan robot untuk menggenggam benda dari atas, bukan hanya memegangnya di telapak tangannya. Jika Dactyl hanya menggerakkan penjepitnya yang tidak berperasaan hingga sensor di kubus Rubik menunjukkan kotaknya bergeser ke keadaan yang diinginkan, sistem Agrawal perlu mengetahui apa yang dilakukan jari-jarinya dan bagaimana reaksi kubus tersebut pada saat tertentu—sambil memperhitungkan tarikan gravitasi. Ketika dia memberi tahu seseorang yang pernah bekerja di Dactyl tentang proyek tersebut, dia berkata, “Saya mendapat ceramah satu jam dari mereka yang mengatakan, ‘Ini tidak akan pernah berhasil.’”
Agrawal bertahan. “Pulkit adalah seorang pemikir yang sangat kreatif,” kata Ken Goldberg, seorang profesor di UC Berkeley yang telah mengenal Agrawal sejak masa mahasiswanya dan saat ini menjadi penasihat di perusahaannya. “Dia selalu mendorong ke arah yang tidak dilakukan orang lain.” (Saya pertama kali bertemu dengannya pada tahun 2017 di sebuah konferensi besar AI di Long Beach, California. Saat itu ia adalah seorang mahasiswa pascasarjana, dan ia baru saja menerbitkan makalah yang menguraikan cara baru bagi komputer untuk belajar bermain video game.)
Pada akhir tahun 2021, Agrawal telah menciptakan tangan virtual yang mampu memanipulasi 2.000 objek secara terbalik. Namun simulasi terus kehilangan dukungan di kalangan robotika, dan demam ChatGPT mulai merajalela. Jika sejumlah besar teks tulisan manusia dapat menghasilkan kecerdasan linguistik yang sangat umum, maka mungkin dengan menunjukkan cukup banyak contoh manusia yang menggunakan tangannya kepada robot dapat memberikan mereka pemahaman yang lebih baik. kecerdasan fisikjuga.
Eka menggunakan benda dengan berbagai ukuran, bentuk, dan berat untuk menguji robotnya.Foto: Tony Luong

Sejumlah perusahaan rintisan (startup) yang mempunyai pendanaan besar sedang mengejar visi ini, melatih apa yang disebut model vision-lingual-action (VLA). Untuk membuatnya, Anda menunjukkan video model, misalnya, manusia yang melipat T-shirt, atau manusia yang mengendalikan robot lipat T-shirt. Harapannya, dengan data yang cukup, akan muncul keterampilan robotik baru. Banyak video sudah tersedia secara online, namun sebuah industri kecil kini telah muncul untuk menghasilkan lebih banyak data ini. Perusahaan membayar orang untuk menghabiskan waktu berjam-jam melakukan tugas rutin dengan tangan sambil mengenakan kamera dan sarung tangan penangkap gerak.
Agrawal dan Haarnoja, yang awalnya bertemu sebagai mahasiswa pascasarjana di UC Berkeley, bekerja sama untuk melakukan pendekatan berbeda dengan Eka. Daripada meminta manusia memberikan data pelatihan, perusahaan ingin robot belajar melakukan sesuatu sendiri. Mereka menghabiskan ribuan jam komputer untuk mempraktikkan gerakan di dalam dunia simulasi dan menemukan solusi mereka sendiri. Dalam hal ini, bot Eka lebih mirip AlphaZero, program Google DeepMind yang belajar memainkan berbagai permainan papan dengan keterampilan manusia super, dan yang menemukan strategi baru dalam permainan seperti catur.
Para pendiri Eka mengatakan robot mereka dapat mentransfer pembelajaran dari simulator ke dunia nyata dengan lebih andal dibandingkan robot lain—meskipun mereka tidak menjelaskan secara pasti bagaimana caranya. Agrawal tampaknya optimis bahwa pendekatan mereka dapat menghasilkan kemampuan yang lebih besar. “Beberapa orang menginginkan robot setingkat manusia,” kata Agrawal. “Bagi kami, tujuannya adalah manusia super.”
Agrawal dan Haarnoja menolak memberikan rincian tentang bagaimana mereka melatih robot mereka karena ini adalah keunggulan komersial mereka. Namun mereka mengungkapkan bahwa mereka telah menciptakan gripper robot khusus yang menggabungkan indra peraba. Agrawal dan Haarnoja juga mengatakan mereka telah mengembangkan algoritma AI jenis baru yang disebut model vision-force-action. Model ini belajar dari simulasi yang menggabungkan tidak hanya sambungan dan motor realistis tetapi juga prinsip fisika seperti massa dan inersia. Ia mempelajari bagaimana gerakan memengaruhi piksel pada layar dan bagaimana bobot serta kecepatan gerakannya berinteraksi dengan objek yang dipegangnya.
Mungkin yang paling banyak Demo Eka yang menarik melibatkan nugget ayam.
Insinyur perusahaan telah mendirikan stasiun tempat nugget ayam ditaburkan di atas meja. Sebuah ban berjalan membawa wadah plastik di satu sisinya. Robot Eka harus mengambil nugget dan memasukkannya ke dalam kotak. Ia melakukan hal ini tidak hanya dengan kecepatan yang mengesankan tetapi juga dengan improvisasi yang mirip manusia, terkadang menempatkan nugget dengan hati-hati, namun di lain waktu—jika sebuah wadah bergerak di luar jangkauan—hampir melemparkannya dari jarak dekat.
Robot Eka berlatih memasukkan nugget ayam ke dalam wadah untuk dibawa pulang.Foto: Tony Luong

Penanganan makanan merupakan bidang pekerjaan yang masih sangat bergantung pada manusia. Buah, sayuran, daging, dan makanan lainnya perlu ditangani dengan cepat namun lembut. Otomatisasi juga sulit dilakukan karena tidak ada dua potong buah, sayuran, atau nugget ayam yang terlihat persis sama.
Demo yang dilakukan Eka menunjukkan bahwa perusahaannya mungkin sedang melakukan sesuatu yang besar. Saya mendapati diri saya secara mental membandingkan robot mereka dengan GPT-1, model bahasa besar pertama OpenAI, yang dikembangkan empat tahun sebelum ChatGPT. GPT-1 sering kali tidak koheren tetapi menunjukkan sedikit kecerdasan linguistik umum.
Robot-robot yang saya lihat tampaknya memiliki kecerdasan fisik yang serupa. Saat saya menonton video seseorang yang sedang meraih kunci dalam gerakan lambat, saya perhatikan ia melakukan sesuatu yang tampak sangat manusiawi: Ia menyentuhkan ujung pegangannya ke meja dan menyelipkannya ke permukaan sebelum menyentuh kunci dan mengamankannya di antara jari-jarinya. Algoritme Eka tampaknya secara naluriah mengetahui cara memulihkan kesalahan. Hal semacam ini sulit dipelajari oleh robot lain, kecuali manusia yang melatihnya dengan sengaja melakukan banyak kesalahan.
Berbeda dengan robot lain yang dapat saya pikirkan, hampir mungkin untuk membayangkan seperti apa dunia robot tersebut. Sensornya sepertinya merasakan beban lengannya, kelembaman saat ia bergerak ke arah tuts dan melambat. Begitu ia memegang kunci-kunci itu, ia sepertinya merasakan beban dari kunci-kunci itu yang tergantung di cakarnya.
Saya tidak tahu apakah pendekatan Eka benar-benar merupakan jalan menuju terobosan seperti ChatGPT di bidang robotika. Beberapa ahli yang sangat cerdas percaya bahwa menggabungkan demonstrasi manusia dengan simulasi akan memberikan hasil yang lebih baik daripada simulasi saja. Mungkin kombinasi kedua pendekatan tersebut pada akhirnya diperlukan? Namun tampak jelas bahwa robot pada akhirnya harus memiliki kecerdasan fisik dan sentuhan seperti yang sedang dikembangkan Eka jika ingin mendapatkan ketangkasan seperti manusia.
Agrawal memberi tahu saya bahwa pendekatan umum yang sama akan berhasil untuk manipulasi yang lebih baik. Ketangkasan yang diperlukan untuk membuat iPhone, misalnya, dapat dicapai dengan membuat ac yang berbeda tutor dan sensor dan mempraktikkan tugas dalam simulasi.
Setelah menghabiskan beberapa jam di Eka, saya memutuskan untuk mampir ke restoran di lantai bawah. Saya melihat dari konter saat staf menyiapkan makanan dan membuat kopi. Keturunan mesin di lantai atas mungkin dapat melakukan hal-hal ini dengan baik, atau bahkan lebih baik. Namun mengingat betapa saya menikmati mengobrol dengan orang-orang yang bekerja di sana, saya rasa saya akan membayar ekstra untuk menjaga manusia tetap ada. Kecuali, tangan saya juga diotomatisasi.
Apa katamu?
Beri tahu kami pendapat Anda tentang artikel ini di komentar di bawah. Alternatifnya, Anda dapat mengirimkan surat kepada editor di [emailprotected].







