Deepseek membuat Openai bersemangat

Sudah lebih dari seminggu sejak Deepseek membalikkan dunia ai. Pengenalan model bobot terbuka-tampaknya dilatih pada sebagian kecil dari yang terspesialisasi Komputasi chip bahwa para pemimpin industri kekuatan – mengeluarkan gelombang kejut di dalam Openai. Karyawan tidak hanya mengklaim untuk melihat petunjuk bahwa Deepseek telah “tidak tepat suling” model Openai untuk menciptakannya sendiri, tetapi keberhasilan startup itu memiliki Wall Street yang mempertanyakan apakah perusahaan seperti Openai sangat bertelur orpute di Compute.

“Deepseek R1 adalah momen Sputnik AI,” tulis Marc Andreessen, salah satu penemu Silicon Valley yang paling berpengaruh dan provokatif, pada x.

Sebagai tanggapan, Openai sedang bersiap untuk meluncurkan model baru hari ini, menjelang jadwal yang direncanakan semula. Model, O3-Mini, akan debut di API dan Chat. Sumber mengatakan memiliki penalaran level O1 dengan kecepatan 4o-level. Dengan kata lain, cepat, murah, pintar, dan dirancang untuk menghancurkan Deepseek. (Juru bicara Openai Niko Felix mengatakan pekerjaan pada O3-Mini dimulai jauh sebelum debut Deepseek dan tujuannya adalah untuk diluncurkan pada akhir Januari).

Momen ini telah menggembleng staf openai. Di dalam perusahaan, ada perasaan yang – terutama ketika Deepseek mendominasi percakapan – Openai harus menjadi lebih efisien atau berisiko berada di belakang pesaing terbarunya.

Bagian dari masalah ini berasal dari asal usul Openai sebagai organisasi penelitian nirlaba sebelum menjadi pembangkit tenaga listrik mencari laba. Perebutan kekuasaan yang berkelanjutan antara penelitian dan kelompok produk, klaim karyawan, telah menghasilkan keretakan antara tim yang bekerja pada penalaran lanjutan dan mereka yang bekerja di obrolan. ;

Beberapa di dalam Openai ingin perusahaan membangun produk obrolan terpadu, salah satu model yang dapat mengetahui apakah suatu pertanyaan memerlukan penalaran lanjutan. Sejauh ini, itu belum terjadi. Sebaliknya, menu drop-down di ChatGPT meminta pengguna untuk memutuskan apakah mereka ingin menggunakan GPT-4O (“bagus untuk sebagian besar pertanyaan”) atau O1 (“Menggunakan penalaran lanjutan”).

Beberapa staf mengklaim bahwa sementara obrolan membawa bagian terbesar dari pendapatan Openai, O1 mendapat lebih banyak perhatian – dan sumber daya komputasi – dari kepemimpinan. “Kepemimpinan tidak peduli dengan obrolan,” kata seorang mantan karyawan yang mengerjakan (Anda dapat menebaknya) obrolan. “Semua orang ingin bekerja di O1 karena seksi, tetapi basis kode tidak dibangun untuk eksperimen, jadi tidak ada momentum.” Mantan karyawan itu meminta untuk tetap anonim, mengutip perjanjian yang tidak diketahui.

Openai menghabiskan waktu bertahun-tahun bereksperimen dengan penguatan pembelajaran untuk menyempurnakan model yang akhirnya menjadi sistem penalaran canggih yang disebut O1. (Pembelajaran penguatan adalah proses yang melatih model AI dengan sistem hukuman dan penghargaan.) Deepseek membangun pekerjaan pembelajaran penguatan yang telah dipelopori Openai untuk membuat sistem penalaran canggih, yang disebut R1. “Mereka mendapat manfaat dari mengetahui bahwa pembelajaran penguatan, diterapkan pada model bahasa, bekerja,” kata seorang mantan peneliti Openai yang tidak berwenang untuk berbicara secara publik tentang perusahaan.

“Pembelajaran penguatan [DeepSeek] DOM mirip dengan apa yang kami lakukan di Openai, “kata mantan peneliti Openai lainnya,” tetapi mereka melakukannya dengan data yang lebih baik dan tumpukan yang lebih bersih. “

Karyawan Openai mengatakan penelitian yang masuk ke O1 dilakukan di basis kode, yang disebut tumpukan “Berry”, dibangun untuk kecepatan. “Ada pertukaran-ketelitian eksperimental untuk throughput,” kata seorang mantan karyawan dengan pengetahuan langsung tentang situasi tersebut.

Pertukaran itu masuk akal untuk O1, yang pada dasarnya merupakan eksperimen yang sangat besar, meskipun ada batasan basis kode. Mereka tidak masuk akal untuk mengobrol, produk yang digunakan oleh jutaan pengguna yang dibangun di atas tumpukan yang berbeda dan lebih andal. Ketika O1 diluncurkan dan menjadi produk, retakan mulai muncul dalam proses internal Openai. “Itu seperti, ‘Mengapa kita melakukan ini di basis kode eksperimental, bukankah kita harus melakukan ini di basis kode penelitian produk utama?’” “Ada pushback besar untuk hal itu secara internal.”

Tahun lalu, perusahaan mengumumkan proyek Sputnik secara internal – upaya untuk melewati kode dan mencari tahu bagian mana yang harus bergabung dan bagian mana yang harus tetap terpisah.

Karyawan percaya proyek ini tidak sepenuhnya terwujud. Alih -alih menggabungkan tumpukan, karyawan didorong untuk hanya memprioritaskan menggunakan tumpukan “Berry”, yang membuat marah beberapa orang yang bekerja di obrolan. Seorang juru bicara Openai menyangkal hal ini dan mengatakan proyek Sputnik berhasil dikerahkan.

Masalah yang dirasakan dengan basis kode memiliki dampak nyata, kata sumber. Idealnya, setelah seorang karyawan meluncurkan pekerjaan pelatihan, GPU yang terlibat dalam pekerjaan itu dibebaskan untuk digunakan orang lain. Cara basis kode berry terstruktur, itu tidak selalu terjadi. “Orang -orang hanya akan berjongkok di GPU,” kata seorang mantan karyawan. “Ada kemacetan.”

Di luar openai, industri ini terbagi tentang bagaimana menafsirkan keberhasilan Deepseek. Awal pekan ini, saham Nvidia jatuh karena investor khawatir bahwa industri ini telah melebih -lebihkan jumlah chip yang diperlukan untuk bekerja pada AI.

Tetapi interpretasi itu picik, kata para ahli. Jika Deepseek menemukan cara untuk melakukan model pengembangan lebih efisien, seperti yang diklaimnya, itu mungkin mempercepat proses pengembangan model, tetapi pada akhirnya pemenang masih akan menjadi perusahaan dengan chip terbanyak.

“Anda memang membutuhkan lebih sedikit komputasi per unit intelijen, tetapi orang -orang masih ingin lebih banyak unit untuk meningkatkan lebih banyak lagi,” kata Miles Brundage, seorang peneliti kebijakan AI independen yang bekerja di Openai selama enam tahun, paling baru sebagai penasihat senior untuk kesiapan AGI.

Mungkin Stargate, proyek infrastruktur baru Openai yang mencolok, akan meringankan perasaan kelangkaan secara internal. Crusoe, perusahaan yang membangun pusat data pertama Stargate di Abilene, Texas, telah melanggar tanah di fasilitas 998.000 kaki persegi, menurut Andrew Schmitt, juru bicara perusahaan.

Sementara rincian proyek ini buram, saya diberitahu bahwa itu bisa tumbuh untuk mencakup lebih banyak pusat data, manufaktur chip, dan superkomputer. Openai berencana untuk menunjuk CEO baru untuk memimpin proyek – setidaknya secara teori.

CEO saat ini Sam Altman “sangat pandai membuat janji tentang apa yang akan terjadi di masa depan. Dan di masa depan hal -hal itu sama sekali tidak dapat diandalkan, ”kata mantan staf lainnya.

Perjalanan Waktu

Pada tahun 2023, Steven Levy memberikan a tampilan pasti di dalam openai Dalam bulan -bulan sebelum berbagai, pergolakannya yang sangat dipublikasikan. Bahkan kemudian, ketegangan yang mendidih hari ini sudah jelas.

Tidak adil menyebut Openai sebagai kultus, tetapi ketika saya bertanya kepada beberapa petinggi perusahaan jika seseorang dapat dengan nyaman bekerja di sana jika mereka tidak percaya Agi benar -benar datang – dan bahwa kedatangannya akan menandai salah satu momen terbesar dalam sejarah manusia – Sebagian besar eksekutif tidak berpikir begitu. Mengapa orang yang tidak wali ingin bekerja di sini? Mereka bertanya -tanya. Asumsinya adalah bahwa tenaga kerja-sekarang sekitar 500, meskipun mungkin telah tumbuh sejak Anda mulai membaca paragraf ini-telah dipilih sendiri untuk memasukkan hanya umat beriman. Paling tidak, seperti yang dikatakan Altman, begitu Anda dipekerjakan, tampaknya tidak bisa dihindari bahwa Anda akan ditarik ke dalam mantra.

Pada saat yang sama, Openai bukanlah perusahaan seperti dulu. Didirikan sebagai operasi penelitian nirlaba murni, tetapi hari ini sebagian besar karyawannya bekerja secara teknis untuk entitas yang menghasilkan laba yang dilaporkan dihargai hampir $ 30 miliar. Altman dan timnya sekarang menghadapi tekanan untuk memberikan revolusi dalam setiap siklus produk, dengan cara yang memenuhi tuntutan komersial investor dan tetap di depan dalam lanskap yang sangat kompetitif. Semuanya sambil bergegas ke misi semu-messian untuk mengangkat kemanusiaan daripada memusnahkannya.

Tekanan semacam itu – belum lagi perhatian yang tak kenal ampun dari seluruh dunia – dapat menjadi kekuatan yang melemahkan. The Beatles memicu gelombang perubahan budaya yang kolosal, tetapi mereka berlabuh revolusi mereka hanya begitu lama: enam tahun setelah berdentang akord yang tak terlupakan yang mereka bahkan bukan band lagi. Maelstrom Openai telah melepaskan hampir pasti akan jauh lebih besar. Tapi para pemimpin Openai bersumpah mereka akan tetap berada di jalur. Yang ingin mereka lakukan, kata mereka, adalah membangun komputer yang cukup pintar dan cukup aman untuk mengakhiri sejarah, menyodorkan kemanusiaan ke era karunia yang tak terbayangkan.

Akhir Times Chronicle

A Penerbangan penumpang jatuh ke dalam helikopter militer di Washington, DC, pada Rabu malam.

Terakhir, tetapi tidak kalah penting

Deepseek meninggalkan basis data inti yang terpapar, membocorkan 1 juta catatantermasuk petunjuk pengguna dan token otentikasi API.

Elon Musk memberi tahu teman -teman bahwa dia sedang tidur di Kantor doge dekat Gedung Putih.

Dan, bukan kejutan besar, LACKEYS ELON MUSK sudah mulai mengambil alih kantor manajemen personalia AS.

UPDATE 1/31/25 11:32 ET: Kisah ini telah diperbarui untuk memasukkan komentar tambahan dari Openai tentang waktu O3-Mini.

Post Views: 70

Perjalanan Waktu

Akhir Times Chronicle

Terakhir, tetapi tidak kalah penting

Read Also