AI Terinspirasi Otak Manusia Kalahkan ChatGPT

AI Terinspirasi Otak Manusia Kalahkan ChatGPT

Para ilmuwan di Singapura telah mengembangkan model AI baru yang terinspirasi dari cara kerja otak manusia. Model yang disebut Hierarchical Reasoning Model (HRM) ini menunjukkan kemampuan penalaran yang lebih baik dibanding model bahasa besar seperti ChatGPT, meski hanya menggunakan parameter yang jauh lebih sedikit.

HRM hanya membutuhkan 27 juta parameter dengan 1.000 sampel pelatihan, namun mampu melampaui kinerja model-model canggih yang memiliki triliunan parameter dalam berbagai benchmark penalaran yang menantang.


Sebuah terobosan baru dalam pengembangan kecerdasan buatan telah menggemparkan dunia AI. Para ilmuwan di Singapura berhasil menciptakan model AI yang meniru cara kerja otak manusia dan mampu mengalahkan model-model bahasa besar (LLM) seperti ChatGPT dalam tugas-tugas penalaran kompleks.

Model bernama Hierarchical Reasoning Model (HRM) ini hanya menggunakan 27 juta parameter dengan 1.000 sampel pelatihan, jauh lebih efisien dibandingkan model-model canggih lainnya yang membutuhkan miliaran hingga triliunan parameter. Sebagai perbandingan, GPT-5 diperkirakan memiliki antara 3 hingga 5 triliun parameter.

Keunggulan HRM terletak pada pendekatan penalarannya yang berbeda, meniru cara otak manusia memproses informasi secara hierarkis dan multi-skala waktu. Hasil pengujian menunjukkan bahwa HRM mencapai skor 40,3% dalam benchmark ARC-AGI-1, melampaui performa OpenAI o3-mini-high (34,5%), Claude 3.7 (21,2%), dan Deepseek R1 (15,8%).

Pendekatan Revolusioner dalam Penalaran AI

Sebagian besar model bahasa besar (LLM) saat ini menggunakan metode penalaran berantai (chain-of-thought/CoT) yang memecah masalah kompleks menjadi langkah-langkah sederhana dalam bahasa natural. Pendekatan ini meniru proses berpikir manusia dengan membagi masalah rumit menjadi bagian-bagian yang lebih mudah dipahami.

Namun, para ilmuwan dari Sapient mengidentifikasi beberapa kelemahan dalam metode CoT, termasuk dekomposisi tugas yang rapuh, kebutuhan data yang ekstensif, dan latensi tinggi. Inilah yang mendorong mereka untuk mengembangkan pendekatan baru yang lebih efisien dan efektif.

HRM mengeksekusi tugas penalaran sekuensial dalam satu langkah maju, tanpa pengawasan eksplisit pada langkah-langkah perantara, melalui dua modul. Modul tingkat tinggi bertanggung jawab untuk perencanaan abstrak yang lambat, sedangkan modul tingkat rendah menangani komputasi yang cepat dan detail.

Sistem ini bekerja dengan menerapkan penyempurnaan iteratif – teknik komputasi yang meningkatkan akurasi solusi dengan terus menyempurnakan perkiraan awal – selama beberapa "burst pemikiran" singkat. Setiap burst mempertimbangkan apakah proses berpikir harus dilanjutkan atau diajukan sebagai jawaban "final" atas prompt awal.

Arsitektur hierarkis ini menyerupai cara otak manusia memproses informasi di berbagai wilayah, dengan beberapa area bertanggung jawab untuk pemikiran abstrak dan area lain untuk kalkulasi detail. Pendekatan biomimetik ini tampaknya menjadi kunci keberhasilan HRM dalam tugas-tugas penalaran kompleks.

Prestasi Mengesankan dalam Tugas Kompleks

HRM mencapai kinerja hampir sempurna pada tugas-tugas menantang seperti teka-teki Sudoku kompleks – yang tidak bisa diselesaikan oleh LLM konvensional – serta unggul dalam pencarian jalur optimal di dalam labirin. Prestasi ini menunjukkan potensi besar model untuk aplikasi yang membutuhkan kemampuan penalaran tingkat tinggi.

Dalam benchmark ARC-AGI-2 yang lebih sulit, HRM mencapai skor 5%, mengalahkan o3-mini-high (3%), Deepseek R1 (1,3%), dan Claude 3.7 (0,9%). Meskipun angka-angka ini mungkin tampak kecil, benchmark ARC-AGI dikenal sangat menantang dan dirancang untuk menguji seberapa dekat model AI dengan kecerdasan umum buatan (AGI).

Para peneliti juga membuka akses kode model mereka di GitHub, memungkinkan komunitas AI untuk mempelajari dan memvalidasi temuan mereka. Penyelenggara benchmark ARC-AGI melakukan upaya mereproduksi hasil tersebut dan berhasil mengkonfirmasi angka-angka yang dilaporkan.

Menariknya, penyelenggara benchmark menemukan bahwa arsitektur hierarkis hanya berdampak minimal pada performa – sebaliknya, ada proses penyempurnaan yang kurang didokumentasikan selama pelatihan yang mendorong peningkatan performa substansial.

Implikasi untuk Masa Depan AI

Pengembangan HRM menandai langkah penting dalam evolusi AI. Dengan meniru struktur hierarkis otak manusia, model ini menunjukkan bahwa efisiensi dan kemampuan penalaran yang lebih baik dapat dicapai tanpa harus mengandalkan model raksasa dengan triliunan parameter.

Bagi perusahaan seperti Burhan Infratek yang fokus pada pengembangan AI untuk generasi AI Native, temuan ini membuka peluang baru untuk menciptakan sistem AI yang lebih cerdas, lebih efisien, dan lebih mampu bernalar seperti manusia dengan sumber daya komputasi yang lebih sedikit.

Keberhasilan pendekatan terinspirasi otak ini juga menyoroti pentingnya memahami kognisi manusia sebagai dasar untuk mengembangkan AI yang lebih canggih. Pendekatan biomimetik tampaknya menawarkan jalur yang menjanjikan untuk mencapai kecerdasan umum buatan (AGI) di masa depan.

(Burung Hantu Infratek / Berbagai Sumber)


Berita ini 100% diriset, ditulis dan dikembangkan oleh AI internal Burung Hantu Infratek. Bisa jadi terdapat kesalahan pada data aktual.