Misi OpenAI Ciptakan AI yang Bisa Lakukan Segalanya

Misi OpenAI Ciptakan AI

Jurnalzone.id – OpenAI, perusahaan di balik ChatGPT, kini tengah berfokus pada misi ambisius untuk mengembangkan “agen AI” yang mampu melakukan berbagai tugas kompleks layaknya manusia di komputer. Dilansir dari TechCrunch pada Minggu (3/8/2025), upaya strategis ini berpusat pada pengembangan “model penalaran” (reasoning models) seperti o1, sebuah terobosan yang dianggap krusial untuk masa depan kecerdasan buatan dan merupakan hasil dari riset jangka panjang yang disengaja, berbeda dari ChatGPT yang disebut sebagai “kecelakaan yang membahagiakan.”

Awal Mula dan Kebangkitan Reinforcement Learning

Upaya OpenAI untuk meningkatkan kemampuan penalaran AI bukanlah hal baru. Hunter Lightman, seorang peneliti di OpenAI, menjelaskan bahwa timnya, MathGen, pada awalnya berfokus pada kemampuan matematika yang saat itu menjadi kelemahan model AI. “Kami mencoba membuat model lebih baik dalam penalaran matematis, yang pada saat itu mereka tidak terlalu bagus,” kata Lightman kepada TechCrunch.

Kemampuan penalaran ini sangat bergantung pada teknik Reinforcement Learning (RL), di mana model AI diberi umpan balik atas tindakannya di lingkungan simulasi. Teknik ini pernah menjadi sorotan global pada tahun 2016 ketika AlphaGo dari Google DeepMind, yang menggunakan RL, berhasil mengalahkan juara dunia permainan Go.

OpenAI kemudian menggabungkan Large Language Models (LLM) dengan RL dan komputasi waktu-uji (test-time computation) untuk menghasilkan terobosan yang disebut “Strawberry” pada tahun 2023. Inovasi inilah yang memungkinkan pendekatan chain-of-thought (CoT), di mana AI dapat memverifikasi langkah-langkahnya sebelum memberikan jawaban.

Baca juga: Anthropic Putus Akses API OpenAI

Terobosan Model ‘o1’ dan Persaingan Talenta

Pengembangan dari proyek Strawberry secara langsung mengarah pada penciptaan model penalaran canggih bernama o1 pada musim gugur 2024. Terobosan ini dengan cepat mengubah lanskap riset AI dan menjadikan para peneliti di baliknya sebagai talenta yang paling dicari di Silicon Valley. Tercatat, Mark Zuckerberg dari Meta merekrut lima peneliti dari tim o1 untuk unit superintelijen baru mereka, menunjukkan betapa berharganya keahlian di bidang ini.

Keberhasilan ini digambarkan sebagai momen yang sangat menggembirakan bagi para peneliti. “Saya bisa melihat model itu mulai bernalar,” kata peneliti El Kishky. “Model itu akan menyadari kesalahan dan mundur, ia akan frustrasi. Rasanya benar-benar seperti membaca pemikiran seseorang.” Dari pernyataan itu, ditegaskan bahwa model AI menunjukkan perilaku yang menyerupai proses berpikir manusia saat memecahkan masalah.

Tantangan Berikutnya: Tugas Subjektif dan Masa Depan Agen AI

Meskipun telah mencapai kemajuan pesat, agen AI yang ada saat ini masih kesulitan dalam menangani tugas-tugas yang kompleks dan subjektif, seperti berbelanja online atau mencari parkir. Menurut Lightman, ini adalah masalah data. “Seperti banyak masalah dalam machine learning, ini adalah masalah data,” ujarnya, seraya menambahkan bahwa riset masa depan akan berfokus pada cara melatih model untuk tugas yang kurang dapat diverifikasi.

OpenAI optimis dapat mengatasi tantangan ini. Peneliti Noam Brown menyatakan bahwa perusahaan memiliki teknik RL baru untuk mengajarkan keterampilan yang tidak mudah diverifikasi, seperti yang digunakan untuk melatih model yang berhasil meraih medali emas di Olimpiade Matematika Internasional.

Ke depan, OpenAI bertujuan untuk menyederhanakan interaksi pengguna dengan agen AI, menciptakan sistem yang secara intuitif memahami apa yang diinginkan pengguna tanpa perlu pengaturan rumit. Namun, mereka harus bergerak cepat karena persaingan semakin ketat dengan kehadiran raksasa teknologi lain seperti Google, Anthropic, xAI, dan Meta yang juga mengejar tujuan serupa. “Kemajuannya sangat cepat. Saya tidak melihat alasan untuk berpikir itu akan melambat,” pungkas Brown.