Ledakan Model AI Open Source, Nvidia RTX: Rayakan Era Pengembang

Ledakan Model AI Open Source, Nvidia RTX: Rayakan Era Pengembang

Nvidia dan OpenAI bersatu menggemparkan dunia teknologi dengan menghadirkan model AI open source yang mampu berjalan mulus di GPU GeForce RTX dan RTX PRO. Kolaborasi dua raksasa teknologi ini membawa kemampuan penalaran (reasoning) canggih langsung ke komputer pribadi pengguna.

Model gpt-oss-20b dan gpt-oss-120b kini tersedia untuk jutaan pengguna, membuka peluang bagi pengembang dan penggemar AI untuk mengakses teknologi pemikiran beruntai (chain-of-thought) melalui alat populer seperti Ollama dan llama.cpp. Kecepatan mengagumkan hingga 256 token per detik pada GPU GeForce RTX 5090 menjadi bukti kekuatan inovasi ini.

"OpenAI menunjukkan kepada dunia apa yang bisa dibangun dengan NVIDIA AI — dan sekarang mereka memajukan inovasi dalam perangkat lunak open-source," kata Jensen Huang, pendiri dan CEO NVIDIA, menanggapi kemajuan terbaru ini.

Revolusi Kemampuan AI Lokal

Model AI open source dari OpenAI ini hadir dengan fleksibilitas luar biasa. Keduanya dirancang dengan arsitektur mixture-of-experts yang populer, memungkinkan pengguna menyesuaikan tingkat penalaran sesuai kebutuhan. Kemampuan mengikuti instruksi dan menggunakan alat menjadi fitur utama yang menjanjikan pengalaman AI yang lebih intuitif.

Dilatih menggunakan GPU NVIDIA H100, model-model ini menawarkan konteks hingga 131.072 token—salah satu yang terpanjang untuk inferensi lokal. Pencapaian ini membuka pintu bagi tugas-tugas kompleks seperti pencarian web, bantuan pengkodean, pemahaman dokumen, dan penelitian mendalam yang sebelumnya sulit dilakukan di komputer pribadi.

Keunggulan lain terletak pada dukungan MXFP4, format presisi yang memungkinkan kualitas model tinggi dengan kinerja cepat dan efisien. Teknologi ini membutuhkan lebih sedikit sumber daya dibandingkan jenis presisi lainnya, sehingga dapat dijalankan pada komputer dengan spesifikasi yang lebih terjangkau.

Ollama, aplikasi populer di kalangan penggemar AI, kini hadir dengan antarmuka pengguna yang menyederhanakan penggunaan model-model OpenAI. Pengguna hanya perlu memilih model dari menu dropdown dan mengirim pesan—tanpa konfigurasi rumit atau perintah tambahan untuk memastikan performa optimal pada GPU yang didukung.

Tidak hanya itu, Ollama juga mendukung file PDF atau teks dalam percakapan, kemampuan multimodal untuk memasukkan gambar dalam prompt, dan panjang konteks yang mudah disesuaikan saat bekerja dengan dokumen atau percakapan besar.

Demokratisasi Teknologi AI Canggih

Pengembang dan penggemar teknologi memiliki beberapa pilihan untuk menggunakan model gpt-oss pada PC AI RTX. Mereka dapat memanfaatkan GPU dengan minimal 16GB VRAM melalui berbagai aplikasi dan kerangka kerja yang didukung RTX.

NVIDIA terus berkolaborasi dengan komunitas open-source untuk mengoptimalkan kinerja pada GPU RTX. Kontribusi terbaru termasuk implementasi CUDA Graphs untuk mengurangi overhead dan menambahkan algoritma yang mengurangi beban CPU, membuka jalan bagi pengembangan aplikasi AI yang lebih efisien.

Bagi pengembang Windows, Microsoft AI Foundry Local—saat ini dalam pratinjau publik—menjadi jalur akses alternatif untuk model-model baru OpenAI. Foundry Local mengintegrasikan solusi inferensi AI on-device ke dalam alur kerja melalui command line, SDK, atau API.

Foundry Local memanfaatkan ONNX Runtime yang dioptimalkan melalui CUDA, dengan dukungan untuk NVIDIA TensorRT untuk RTX yang akan segera hadir. Penggunaan pun terbilang mudah: cukup instal Foundry Local dan jalankan "Foundry model run gpt-oss-20b" di terminal.

Kemampuan menjalankan model ini di komputer lokal juga menjawab kekhawatiran privasi yang sering muncul dalam penggunaan AI cloud. Data pengguna tidak perlu dikirim ke server eksternal, memberikan tingkat keamanan yang lebih tinggi untuk informasi sensitif.

Mendorong Gelombang Inovasi Berikutnya

Peluncuran model open-source ini memulai gelombang inovasi AI berikutnya dari para penggemar dan pengembang yang ingin menambahkan kemampuan penalaran ke aplikasi Windows mereka yang dipercepat AI.

Dengan semakin demokratisnya akses terhadap model AI canggih, kita dapat mengharapkan ledakan kreativitas dalam pengembangan aplikasi pintar—mulai dari asisten pribadi hingga alat analisis data dan pengembangan konten kreatif—yang dapat dijalankan langsung di komputer pribadi.

Perkembangan ini juga menandai pergeseran paradigma dalam ekosistem AI, di mana kekuatan komputasi yang sebelumnya hanya tersedia di pusat data kini dapat diakses oleh siapa saja yang memiliki PC dengan GPU NVIDIA RTX yang memadai.

(Burung Hantu Infratek / Berbagai Sumber)


Berita ini 100% diriset, ditulis dan dikembangkan oleh AI internal Burung Hantu Infratek. Bisa jadi terdapat kesalahan pada data aktual.