BOCOR: OpenAI Akan Segera Rilis Model AI Open-Source

Dunia teknologi kecerdasan buatan sedang diguncang kabar mengejutkan. OpenAI, perusahaan di balik ChatGPT, dikabarkan akan segera meluncurkan model AI open-source berukuran raksasa dalam waktu dekat, bahkan mungkin dalam hitungan jam.
Rumor ini diperkuat dengan munculnya jejak digital berupa tangkapan layar yang menunjukkan repositori model dengan nama seperti yofo-deepcurrent/gpt-oss-120b dan yofo-wildflower/gpt-oss-20b. Meski repositori tersebut kini telah dihapus, akun-akun tersebut ternyata milik anggota tim OpenAI.
Tag gpt-oss dalam nama repositori tersebut sangat mencolok, yang tampaknya jelas merujuk pada 'GPT Open Source Software'. Ini merupakan langkah mengejutkan dari perusahaan yang selama ini semakin ketat menjaga model-model terbaiknya.
Perubahan Arah yang Mengejutkan
OpenAI dulunya didirikan sebagai organisasi nirlaba dengan tujuan mengembangkan kecerdasan buatan yang aman dan bermanfaat bagi seluruh umat manusia. Namun selama beberapa tahun terakhir, perusahaan ini semakin menutup diri dengan menjaga model-model AI terbaiknya dari akses publik.
Jika rumor ini benar, peluncuran model open-source akan menjadi semacam kembalinya OpenAI ke akar mereka. Fakta bahwa kita melihat beberapa versi berbeda, dengan nama kode dan ukuran yang berbeda, menunjukkan ada rencana peluncuran keluarga model yang telah dipersiapkan dengan matang.
Berkat kebocoran file konfigurasi, kita bahkan bisa mengintip "isi mesin" dari versi yang diduga memiliki 120 miliar parameter. Model ini tampaknya dibangun dengan arsitektur Mixture of Experts (MoE), yang bekerja tidak seperti otak tunggal yang berusaha mengetahui segalanya, melainkan seperti dewan yang terdiri dari 128 penasihat spesialis.
Ketika ada pertanyaan masuk, sistem ini secara cerdas memilih empat ahli terbaik untuk menanganinya. Cara kerja ini memberikan model tersebut pengetahuan luas berkat jumlah parameternya yang besar, namun tetap cepat dan lincah karena hanya sebagian kecil dari sistemnya yang bekerja pada satu waktu.
Desain ini menempatkan model AI open-source OpenAI tepat bersaing dengan para pemain utama di bidang ini, seperti Mixtral dari Mistral AI dan keluarga Llama dari Meta.
Spesifikasi yang Mengagumkan
Model AI open-source OpenAI ini tampaknya memiliki kosakata yang sangat besar, yang akan membuatnya lebih efisien dalam menangani berbagai bahasa. Model ini juga menggunakan Sliding Window Attention untuk menangani teks panjang tanpa kesulitan. Dalam praktiknya, semua ini menunjukkan bahwa modelnya kuat dan praktis untuk dijalankan.
Jadi, mengapa OpenAI membuat langkah seperti ini sekarang? Selama bertahun-tahun, perusahaan ini menghadapi kritik ringan hingga keras karena menyimpang dari awal mereka yang lebih terbuka. Meluncurkan gpt-oss yang kuat akan menjadi langkah menarik simpati yang ditujukan langsung kepada para pengembang dan peneliti yang merasa ditinggalkan.
Tentu saja, ini juga merupakan langkah kompetitif yang cerdik. Meta dan Mistral telah menunjukkan bagaimana ekosistem open-source yang berkembang dapat mendorong inovasi. Dengan memasukkan model AI open-source yang kuat ke dalam persaingan, OpenAI tidak hanya bergabung dalam perlombaan; mereka mencoba mendefinisikan ulang jalur perlombaan itu sendiri.
Spesifikasi lainnya juga tidak kalah mengesankan. Model ini dilengkapi kosakata besar yang membuatnya lebih efisien dalam menangani berbagai bahasa, serta menggunakan teknologi Sliding Window Attention untuk memproses teks panjang dengan mulus.
Kombinasi fitur-fitur ini menciptakan model yang tidak hanya kuat dalam kemampuan, tetapi juga praktis untuk dijalankan pada infrastruktur yang tersedia secara luas.
Dampak Besar bagi Industri AI
Sampai kita mendapat pengumuman resmi dari OpenAI, semua ini masih berstatus rumor. Namun, ini adalah rumor yang memiliki substansi, didukung oleh kode dan file konfigurasi yang bocor.
Peluncuran model AI open-source berperforma tinggi dengan 120 miliar parameter dari nama paling terkenal di industri AI akan menjadi peristiwa bersejarah, dan tampaknya hal itu akan segera terjadi.
Langkah ini berpotensi mengubah lanskap pengembangan AI secara drastis, membuka akses lebih luas bagi peneliti dan pengembang di seluruh dunia untuk bereksperimen dengan teknologi canggih yang sebelumnya hanya tersedia bagi segelintir perusahaan besar.
(Burung Hantu Infratek / Berbagai Sumber)
Berita ini 100% diriset, ditulis dan dikembangkan oleh AI internal Burung Hantu Infratek. Bisa jadi terdapat kesalahan pada data aktual.
