Google Gemini Deep Think: Kecerdasan Buatan Pemikir Paralel Saingi OpenAI

Google Gemini Deep Think: Kecerdasan Buatan Pemikir Paralel Saingi OpenAI

Google DeepMind meluncurkan Gemini 2.5 Deep Think, model AI penalaran terbaru yang mampu mengeksplorasi dan mempertimbangkan beberapa ide secara bersamaan. Model ini menjadi yang pertama dari Google yang menggunakan sistem multi-agen, dimana beberapa AI bekerja paralel untuk memecahkan masalah.

Inovasi baru ini hanya tersedia bagi pelanggan Google berlangganan Ultra dengan biaya $250 per bulan, dan mulai dapat diakses melalui aplikasi Gemini sejak hari Jumat.

Model AI yang mirip dengan yang digunakan di Deep Think telah membantu Google meraih medali emas di Olimpiade Matematika Internasional (IMO) tahun ini, menunjukkan kemampuan penalaran yang luar biasa.

Performa Melebihi Pesaing Utama

Google mengklaim bahwa Gemini 2.5 Deep Think mencapai performa terbaik dalam berbagai tes kecerdasan buatan. Pada Humanity's Last Exam (HLE), tes yang mengukur kemampuan AI menjawab ribuan pertanyaan dari berbagai bidang, model ini meraih skor 34,8%.

Pencapaian tersebut jauh melampaui kompetitor utama seperti Grok 4 milik xAI yang hanya mencapai 25,4%, dan OpenAI dengan model o3-nya yang hanya mencapai 20,3%.

Dalam tes LiveCodeBench 6 yang menguji kemampuan coding kompetitif, Deep Think juga unggul dengan skor 87,6%, dibandingkan Grok 4 (79%) dan o3 milik OpenAI (72%).

Keunggulan lain dari Gemini 2.5 Deep Think adalah kemampuannya bekerja secara otomatis dengan berbagai alat seperti eksekusi kode dan Google Search. Model ini juga mampu menghasilkan respons yang jauh lebih panjang dibanding model AI tradisional.

Dalam pengujian Google, model ini menghasilkan tugas pengembangan web yang lebih detail dan menarik secara estetika dibandingkan model AI lainnya. Google menyatakan bahwa model ini dapat membantu peneliti dan "berpotensi mempercepat jalan menuju penemuan baru".

Tren Multi-Agen Sistem di Industri AI

Tampaknya beberapa laboratorium AI terkemuka sedang berkumpul di sekitar pendekatan multi-agen. xAI milik Elon Musk baru-baru ini merilis sistem multi-agen mereka sendiri, Grok 4 Heavy, yang diklaim mampu mencapai kinerja terdepan di industri pada beberapa tolok ukur.

Peneliti OpenAI, Noam Brown, mengatakan dalam sebuah podcast bahwa model AI yang belum dirilis yang digunakan perusahaan untuk meraih medali emas di Olimpiade Matematika Internasional tahun ini juga merupakan sistem multi-agen.

Sementara itu, Anthropic Research agent, yang menghasilkan ringkasan penelitian menyeluruh, juga didukung oleh sistem multi-agen.

Meskipun kinerjanya kuat, sistem multi-agen tampaknya lebih mahal untuk dioperasikan dibandingkan model AI tradisional. Artinya, perusahaan teknologi mungkin akan terus membatasi sistem ini di balik paket langganan termahal mereka, seperti yang telah dipilih oleh xAI dan sekarang Google.

Biaya tinggi ini menjelaskan mengapa akses ke Gemini 2.5 Deep Think dibatasi hanya untuk pelanggan Ultra dengan biaya $250 per bulan, mirip dengan strategi yang diterapkan xAI dengan Grok 4 Heavy mereka.

Masa Depan Pengembangan AI Multi-Agen

Dalam beberapa minggu mendatang, Google berencana untuk membagikan Gemini 2.5 Deep Think kepada sekelompok penguji terpilih melalui API Gemini. Perusahaan ingin memahami lebih baik bagaimana pengembang dan perusahaan dapat memanfaatkan sistem multi-agen mereka.

Google juga akan merilis model AI yang digunakan pada Olimpiade Matematika Internasional kepada sekelompok matematikawan dan akademisi terpilih. Model ini mampu "berpikir selama berjam-jam", bukan hitungan detik atau menit seperti kebanyakan model AI yang menghadap konsumen.

Perkembangan ini menunjukkan bahwa teknologi AI semakin mendekati kemampuan penalaran manusia, meskipun dengan pendekatan dan metode yang berbeda. Kompetisi antara perusahaan teknologi besar dalam mengembangkan AI semakin intensif, dengan masing-masing berusaha menciptakan model yang lebih cerdas dan lebih mampu bernalar.

(Burung Hantu Infratek / Berbagai Sumber)


Berita ini 100% diriset, ditulis dan dikembangkan oleh AI internal Burung Hantu Infratek. Bisa jadi terdapat kesalahan pada data aktual.