SAINS, Jurnalzone.id – Peneliti dari Penn State University yang dipimpin oleh Asisten Profesor Rui Zhang telah mengembangkan pendekatan baru untuk meningkatkan efisiensi dan akurasi sistem kecerdasan buatan (AI). Melalui tiga makalah ilmiah yang akan dipublikasikan di sejumlah konferensi internasional sepanjang 2025, mereka memperkenalkan GReaTer, sebuah metode untuk optimasi perintah AI secara otomatis, dan HRScene, sebuah tolok ukur untuk pemrosesan gambar beresolusi tinggi.
Inovasi ini bertujuan untuk mengoptimalkan cara kerja AI di balik layar, seperti pada layanan ChatGPT atau Microsoft Copilot, agar dapat memberikan respons yang lebih baik dan memahami data visual yang kompleks dengan lebih akurat.
Otomatisasi Perintah untuk Hasil AI yang Lebih Baik
Menurut Zhang, prompt engineering atau rekayasa perintah adalah kunci untuk mendapatkan hasil maksimal dari AI. Proses ini melibatkan perancangan input (perintah) yang efektif untuk memandu AI menghasilkan respons yang lebih baik. Ia mencontohkan, alih-alih meminta “ringkas artikel ini”, pengguna bisa memberikan perintah lebih spesifik seperti “ringkas artikel ini dalam tiga poin untuk siswa SMA” agar hasilnya lebih relevan.
Untuk mengatasi tantangan rekayasa perintah yang sering kali memakan waktu dan memerlukan keahlian, tim riset Zhang mengembangkan metode GReaTer. Metode ini memungkinkan sistem AI secara otomatis menghasilkan dan menyempurnakan perintahnya sendiri.
“Automasi proses ini berarti AI dapat beradaptasi dengan tugas baru dengan lebih sedikit campur tangan manusia, meningkatkan akurasi, menghemat waktu, dan menekan biaya,” jelas Zhang.
Berdasarkan metode ini, mereka juga mengembangkan GReaTerPrompt, sebuah toolkit open-source yang ramah pengguna. Hasil pengujian menunjukkan metode ini secara signifikan meningkatkan kinerja AI dalam tugas penalaran bahasa dan pemecahan masalah matematika, bahkan memungkinkan model AI yang lebih kecil menyaingi kualitas model yang jauh lebih besar.
HRScene: Menjawab Tantangan Gambar Resolusi Tinggi
Inovasi kedua yang diperkenalkan adalah HRScene, sebuah tolok ukur (benchmark) baru yang dikembangkan untuk mengevaluasi kemampuan model visi-bahasa modern seperti GPT-4V atau Gemini dalam memahami gambar beresolusi tinggi dan padat informasi. Zhang menyatakan bahwa pemahaman gambar resolusi tinggi sangat penting karena banyak aplikasi ilmiah dan sosial bergantung pada detail halus yang mungkin terlewat oleh model AI saat ini.
HRScene mencakup contoh-contoh dari domain krusial seperti radiologi, fenotipe tanaman, penginderaan jauh, dan astronomi. Potensi dampaknya sangat luas, di antaranya:
- Kesehatan: Membantu interpretasi pindaian radiologi seperti MRI atau CT scan untuk diagnosis yang lebih akurat.
- Pertanian: Menganalisis citra detail tanaman untuk mendeteksi penyakit atau menganalisis struktur daun guna meningkatkan hasil panen.
- Lingkungan dan Keamanan Publik: Memanfaatkan citra satelit resolusi tinggi untuk pemantauan bencana, perencanaan kota, dan riset iklim.
- Astronomi: Menganalisis citra teleskop untuk mendeteksi objek langit yang jauh atau redup