Dalam beberapa tahun terakhir, kita telah melihat AI generatif bergerak cepat melalui era yang berbeda: chatbots, pembuatan gambar, suara, pembuatan video, dan banyak lagi. Namun Dr. Fei-Fei Li, yang sudah lama menjadi pionir AI dan salah satu direktur Institut Kecerdasan Buatan yang Berpusat pada Manusia (HAI) di Stanford, mempertaruhkan apa yang menurutnya merupakan tantangan berikutnya: kecerdasan spasial, sebuah bidang baru yang ia yakini sebagai “tantangan penentu dekade berikutnya,” seperti yang ditulisnya dalam Substack pos minggu ini.
Itulah sebabnya Li ikut mendirikan World Labs pada tahun 2024 – dan mengumpulkan $230 juta pada musim gugur lalu – untuk membangun model dunia, atau model AI generatif yang dapat “melihat, menghasilkan, menalar, dan berinteraksi dengan dunia 3D,” menurut perusahaan tersebut. Dan minggu ini, World Labs merilis produk komersial pertamanya, Marmeryang memungkinkan pengguna membuat dunia 3D mereka sendiri yang dapat diunduh dari perintah teks, gambar, atau video. Li menulis bahwa dia memperkirakan kecerdasan spasial berpotensi mengubah sektor-sektor dari penceritaan dan pembuatan film menjadi arsitektur, robotika, dan penemuan ilmiah.
“Kami melihatnya [the] model dunia sama besar dan menariknya, jika tidak lebih [than the previous eras],” kata Li, yang juga CEO perusahaan tersebut Tepi dalam sebuah wawancara.
“Menghidupkan 3D, dan memahami kekayaan spasial dan hal-hal 3D, hanyalah sebuah level berikutnya di luar garis dasar sebagian besar mode tunggal lainnya,” kata Ben Mildenhall, salah satu pendiri World Labs. Tepi. Dia menambahkan bahwa, hanya untuk tim manusia, “Membangun dunia ini merupakan masalah yang sangat besar. Hal ini membutuhkan tim yang besar dan begitu banyak perangkat lunak serta begitu banyak waktu dan usaha… Pikirkan tentang perubahan radikal yang bisa terjadi jika Anda memberdayakan orang untuk membangun sesuatu dengan lebih cepat – membuat ide, mengulangi, dan mengedit berbagai hal dalam lingkaran yang lebih ketat.”
Marble menawarkan empat tingkatan berlangganan: Gratis, yang memungkinkan hingga empat generasi dunia; Standar ($20 per bulan), yang memungkinkan hingga 12 generasi dan lebih banyak opsi pengeditan; Pro ($35 per bulan), yang memungkinkan 25 generasi dan hak komersial; dan Max ($95 per bulan), yang memungkinkan hingga 75 generasi, serta semua yang ditawarkan tingkat pro. Tepi mampu membuat kastil terbuka dengan air terjun dan, pada generasi pengguna lain, menjelajahi reruntuhan bangunan yang direklamasi oleh alam dan rumah berbentuk bola mirip Hobbit. Dimungkinkan untuk mengambil beberapa langkah ke dalam lingkungan seperti itu sebelum akhirnya menemui hambatan di generasi 3D, dan di tingkat non-bebas, file yang diunduh kompatibel dengan alat seperti Unreal Engine dan Unity. Mildenhall mengatakan bahwa dia telah melihat beberapa orang yang bersedia bekerja berjam-jam mampu melakukan “lingkungan yang cukup besar” menggunakan Marble.
Mildenhall mengatakan dia bisa membayangkan para penulis menggunakannya untuk membangun dunia imajinasi mereka, atau orang-orang yang mengerjakan VFX atau pencari lokasi di industri pembuatan film. Di tingkat perusahaan, katanya, dia bisa membayangkan perusahaan menggunakan Marble atau salah satu produk masa depan World Labs untuk menganalisis dan memvisualisasikan data mereka yang luas.
“Bahkan dengan keterbatasan model ini, kami melihat cahaya yang melampaui keberadaan kami saat ini dalam beberapa perilaku yang muncul,” kata Li, seraya menambahkan bahwa orang dapat menata ruang dengan cara yang “di luar imajinasi manusia.”
Ikuti topik dan penulis dari cerita ini untuk melihat lebih banyak hal serupa di feed beranda hasil personalisasi Anda dan untuk menerima pembaruan email.
