Sam Altman Perkenalkan GPT 5.2, Ungguli Claude dan Gemini

Redaksi Jurnalzone.id

Diterbitkan:

GPT 5.2

JURNALZONE.IDOpenAI kembali menetapkan standar baru dalam industri kecerdasan buatan dengan merilis GPT-5.2, model bahasa terbaru yang diklaim sebagai varian paling cerdas yang tersedia untuk umum saat ini. CEO OpenAI, Sam Altman, mengonfirmasi bahwa teknologi anyar ini sudah dapat diakses mulai hari ini, baik melalui layanan ChatGPT maupun integrasi API bagi para pengembang.

Peluncuran ini menjadi sorotan utama karena membawa lompatan performa yang signifikan dalam penalaran matematika dan penyelesaian tugas dunia nyata.

Peningkatan Terasa pada Penggunaan Harian

Dalam pernyataan resminya di media sosial, Sam Altman menyoroti bahwa pembaruan ini bukan sekadar penambahan fitur kosmetik, melainkan peningkatan fundamental pada “otak” dari sistem AI tersebut. Ia menekankan bahwa pengalaman menggunakan model ini memberikan nuansa kemajuan teknologi yang sangat kentara.

“Even without the ability to do new things like output polished files, GPT-5.2 feels like the biggest upgrade we’ve had in a long time. Curious to hear what you think!”

Dari pernyataan itu, dijelaskan bahwa meskipun GPT-5.2 mungkin belum memiliki kemampuan baru dalam menghasilkan fail yang dipoles secara otomatis, sensasi penggunaannya terasa sebagai pembaruan terbesar yang pernah dirasakan perusahaan dalam kurun waktu yang lama. Altman mengajak pengguna untuk segera mengeksplorasi kemampuannya.

Lebih lanjut, model ini dirancang secara spesifik untuk unggul dalam knowledge work tasks atau pekerjaan berbasis pengetahuan. Hal ini menjadikannya asisten yang lebih reliabel untuk profesional yang membutuhkan akurasi tinggi.

Lonjakan Efektivitas Berdasarkan GDPval

Salah satu parameter krusial yang ditonjolkan adalah skor GDPval, sebuah tolok ukur yang menilai preferensi pakar industri terhadap hasil kerja AI dibandingkan hasil kerja manusia atau pakar lainnya.

“For example, GDPval measures how often industry experts prefer the model’s output to the output of other industry experts. GPT-5.2 gets a 70% (beat or tie); GPT-5 got a 38%. Try it to make slides, spreadsheets, code, and much more.”

Melalui penjelasan tersebut, ditegaskan adanya kenaikan performa yang masif. Jika model GPT-5 sebelumnya hanya mampu meraih skor 38%, varian GPT-5.2 ini melesat hingga angka 70%. Angka ini mengindikasikan bahwa hasil kerja model—baik dalam pembuatan slides presentasi, pengolahan data spreadsheets, hingga penulisan kode (code)—kini jauh lebih disukai oleh para ahli dibandingkan sebelumnya.

Dominasi Mutlak di Berbagai Benchmark

Keunggulan GPT-5.2 tidak hanya sebatas klaim, melainkan dibuktikan melalui serangkaian data pengujian teknis yang ketat. Berdasarkan grafik perbandingan yang dirilis, model ini mengungguli kompetitor beratnya seperti Claude Opus 4.5 dari Anthropic dan Gemini 3 Pro dari Google.

“Performance is strong across the board: 55.6% on SWE-Bench Pro, 52.9% or ARC-AGI-2, 40.3% on FrontierMath.”

Data tersebut diperkuat dengan pencapaian fenomenal pada kategori AIME 2025 (kompetisi matematika tanpa alat bantu), di mana GPT-5.2 berhasil meraih skor sempurna 100.0%. Angka ini melampaui Gemini 3 Pro yang berada di posisi 95.0% dan Claude Opus 4.5 dengan skor 92.8%.

Selain itu, pada pengujian GPQA Diamond yang menguji pertanyaan sains tingkat lanjut, GPT-5.2 memimpin dengan skor 92.4%, sedikit di atas Gemini 3 Pro (91.9%). Kemampuan rekayasa perangkat lunak melalui SWE-Bench Pro juga mencatatkan angka 55.6%, jauh meninggalkan Claude Opus 4.5 (52.0%) dan Gemini 3 Pro (43.3%). Data ini mengukuhkan posisi OpenAI sebagai pemimpin pasar dalam pengembangan Artificial General Intelligence (AGI) tahap awal.

Ikuti kami di Google News: Follow Kami

Bagikan Berita Ini