Scroll untuk baca artikel
#Viral

Openai baru saja merilis model bobot terbuka pertama sejak GPT-2

45
×

Openai baru saja merilis model bobot terbuka pertama sejak GPT-2

Share this article
openai-baru-saja-merilis-model-bobot-terbuka-pertama-sejak-gpt-2
Openai baru saja merilis model bobot terbuka pertama sejak GPT-2

Openai baru saja menjatuhkan model bobot terbuka pertama dalam lebih dari lima tahun. Dua model bahasa, GPT-OSS-20B dan GPT-OSS-20B, dapat berjalan secara lokal di perangkat konsumen dan disesuaikan untuk tujuan tertentu. Untuk Openaimereka mewakili pergeseran dari strategi baru -baru ini untuk fokus pada rilis eksklusif, ketika perusahaan bergerak menuju kelompok model AI yang lebih luas, dan lebih terbuka, yang tersedia untuk pengguna.

“Kami senang membuat model ini, hasil dari miliaran dolar penelitian, tersedia untuk dunia untuk membawa AI ke tangan yang paling mungkin,” kata CEO Openai Sam Altman dalam sebuah pernyataan yang diemail. Baik GPT-OSS-120B dan GPT-OSS-20B secara resmi tersedia untuk diunduh secara gratis di Hugging Face, platform hosting yang populer untuk Alat AI. Model berat terbuka terakhir yang dirilis oleh openai adalah GPT-2pada tahun 2019.

Example 300x600

Apa yang membedakan model dengan berat terbuka adalah kenyataan bahwa “bobotnya” tersedia untuk umum, yang berarti bahwa siapa pun dapat mengintip parameter internal untuk mendapatkan gambaran tentang bagaimana ia memproses informasi. Daripada meremehkan model hak milik Openai dengan opsi gratis, pendiri Greg Brockman melihat rilis ini sebagai “pelengkap” untuk layanan berbayar perusahaan, seperti antarmuka pemrograman aplikasi yang saat ini digunakan oleh banyak pengembang. “Model dengan berat terbuka memiliki serangkaian kekuatan yang sangat berbeda,” kata Brockman dalam briefing dengan wartawan. Tidak seperti Chatgpt, Anda dapat menjalankan model GPT-OSS tanpa koneksi ke internet dan di belakang firewall.

Kedua model GPT-OSS menggunakan penalaran rantai-dipikirkan mendekati, yang Openai pertama kali digunakan dalam model O1 -nya musim gugur yang lalu. Daripada hanya memberikan output, pendekatan ini memiliki alat AI generatif melalui beberapa langkah untuk menjawab prompt. Model-model khusus teks baru ini bukan multimodal, tetapi mereka dapat menelusuri web, memanggil model berbasis cloud untuk membantu tugas, menjalankan kode, dan menavigasi perangkat lunak sebagai Anda memiliki agen. Yang lebih kecil dari dua model, GPT-OSS-20B, cukup kompak untuk berjalan secara lokal pada perangkat konsumen dengan lebih dari 16 GB memori.

Dua model baru dari openai tersedia di bawah Lisensi Apache 2.0pilihan populer untuk model bobot terbuka. Dengan Apache 2.0, model dapat digunakan untuk tujuan komersial, didistribusikan kembali, dan dimasukkan sebagai bagian dari perangkat lunak berlisensi lainnya. Rilis model bobot terbuka dari Alibaba Qwen maupun Mistral Juga beroperasi di bawah Apache 2.0.

Diumumkan secara publik pada bulan Maret, rilis model terbuka ini pada awalnya ditunda untuk pengujian keselamatan lebih lanjut. Melepaskan model dengan berat terbuka berpotensi lebih berbahaya daripada versi tertutup karena menghilangkan hambatan di sekitar siapa yang dapat menggunakan alat ini, dan siapa pun dapat mencoba menyempurnakan versi GPT-OSS untuk tujuan yang tidak diinginkan.

Selain evaluasi Openai biasanya berjalan pada model kepemilikannya, startup tersebut menyesuaikan opsi bobot terbuka untuk melihat bagaimana berpotensi disalahgunakan oleh “aktor buruk” yang mengunduh alat tersebut. “Kami benar-benar menyempurnakan model secara internal pada beberapa area risiko ini,” kata Eric Wallace, seorang peneliti keselamatan di Openai, “dan mengukur seberapa tinggi kami bisa mendorong mereka.” Dalam tes Openai, model bobot terbuka tidak mencapai tingkat risiko yang tinggi, yang diukur dengan itu Kerangka Kesiapan.

Bagaimana kinerja model -model ini dibandingkan dengan rilis Openai lainnya? “Skor tolok ukur untuk kedua model ini cukup kuat,” kata Chris Koch, seorang peneliti Openai, dalam briefing. Berbicara tentang GPT-OSS-120B, peneliti membandingkan kinerjanya yang mirip dengan Openai O3 dan model O4-mini, yang merupakan hak milik, dan bahkan menghasilkannya dalam evaluasi tertentu. Itu kartu model Untuk GPT-OSS menjelaskan tentang bagaimana tepatnya menumpuk pada penawaran perusahaan lainnya. Dalam briefing pers pra-peluncuran, anggota staf Openai juga berfokus pada latensi yang ditawarkan oleh GPT-OSS dan biaya yang lebih murah untuk menjalankan model-model ini.

Di awal tahun ini, startup Cina Deepseek Lembah Silikon Tertanam dengan rilis model murah-ke-lari yang terbuka. Sementara blog rilis tentang GPT-OSS tidak menyebutkan Deepseek atau perusahaan AI Cina lainnya secara langsung, Altman jelas bahwa ia ingin inovasi di sekitar model bobot terbuka terjadi di Amerika Serikat. “Kembali ke ketika kami mulai pada tahun 2015, misi Openai adalah untuk memastikan AGI yang menguntungkan seluruh umat manusia,” kata Altman dalam sebuah pernyataan. “Untuk itu, kami sangat senang dunia untuk membangun tumpukan AI terbuka yang dibuat di Amerika Serikat, berdasarkan nilai -nilai demokratis, tersedia secara gratis untuk semua dan untuk manfaat besar.”

Di AS, pemimpin dengan berat terbuka telah menjadi meta. Raksasa teknologi ini merilis serangkaian model LLAMA pertama pada tahun 2023, dengan rilis terbaru Meta, Llama 4tiba beberapa bulan yang lalu. Dengan mengingat hal itu, meta saat ini sangat fokus pada membangun AI yang dapat melampaui kognisi manusia, yang sering disebut Superintelligence oleh AI Insiders. Perusahaan baru -baru ini meluncurkan lab internal baru yang berfokus pada petunjuk ini oleh Alexandr Wang, mantan CEO skala. Mark Zuckerberg memiliki ditandai Bahwa perusahaan dapat beralih dari open-source untuk model masa depan, mengutip potensi masalah keamanan.

Rilis GPT-OSS juga datang sebagai Perang Bakat AI Antara perusahaan, seperti Openai dan Meta, terus meningkat. Pada tahun 2025, para peneliti AI yang memiliki bakat dalam permintaan disajikan dengan penawaran astronomi untuk beralih perusahaan. Rilis terbaru dari Openai bisa menjadi persaingan yang ketat untuk meta, tergantung pada bagaimana model GPT-OSS diterima oleh pengembang.