Scroll untuk baca artikel
Lifestyle

Openai mendapat grafik getaran

64
×

Openai mendapat grafik getaran

Share this article
openai-mendapat-grafik-getaran
Openai mendapat grafik getaran

Jay Peters

Example 300x600

adalah editor berita yang meliput teknologi, bermain game, dan banyak lagi. Dia bergabung dengan The Verge pada 2019 setelah hampir dua tahun di TechMeme.

Selama itu Livestream GPT-5 Besar pada hari KamisOpenai memamerkan beberapa grafik yang membuat model tampak cukup mengesankan – tetapi jika Anda melihat lebih dekat, beberapa grafik sedikit off.

Dalam satu, ironisnya menunjukkan seberapa baik GPT-5 melakukannya dalam “Eval Penipuan di seluruh model,” skala ada di semua tempat. Untuk “penipuan pengkodean,” misalnya, bagan yang ditunjukkan di atas panggung mengatakan GPT-5 dengan pemikiran tampaknya mendapat tingkat penipuan 50,0 persen, tetapi itu dibandingkan dengan skor O3 Openai yang lebih kecil 47,4 persen yang entah bagaimana memiliki bilah yang lebih besar. Openai tampaknya memiliki angka yang akurat untuk bagan ini di dalamnya Posting blog GPT-5Namun, di mana tingkat penipuan GPT-5 diberi label 16,5 persen.

Dengan bagan iniOpenai menunjukkan di atas panggung bahwa salah satu skor GPT-5 adalah lebih rendah dari O3 tetapi ditampilkan dengan bar yang lebih besar. Dalam grafik yang sama ini, skor O3 dan GPT-4O berbeda tetapi ditunjukkan dengan batang berukuran sama. Sudah cukup buruk sehingga CEO Sam Altman mengomentarinya, menyebutnya “Kacau bagan mega,” meskipun ia mencatat bahwa versi yang benar ada di posting blog Openai.

Staf pemasaran openai juga meminta maafdengan mengatakan, “Kami memperbaiki bagan di blog, permintaan maaf atas kejahatan bagan yang tidak disengaja.”

Openai tidak segera menanggapi permintaan komentar. Dan sementara itu tidak jelas apakah Openai digunakan GPT-5 Untuk benar -benar membuat grafik, itu masih bukan tampilan yang bagus untuk perusahaan pada hari peluncurannya yang besar – terutama ketika menggembar -gemborkan “kemajuan signifikan dalam mengurangi halusinasi” dengan model barunya.

Ikuti topik dan penulis Dari cerita ini untuk melihat lebih banyak seperti ini di umpan beranda pribadi Anda dan untuk menerima pembaruan email.