GPT-5 Memalukan: OpenAI Tipu Konsumen dengan Janji Palsu

GPT-5 Memalukan: OpenAI Tipu Konsumen dengan Janji Palsu

OpenAI baru saja meluncurkan GPT-5 dengan janji "kecerdasan tingkat PhD" dan kemampuan luar biasa. Namun, pengujian nyata menunjukkan model ini jauh dari ekspektasi, dengan kinerja yang bahkan lebih buruk dari pendahulunya dalam beberapa kasus.

Dalam pengujian yang dilakukan, GPT-5 gagal dalam tugas dasar seperti pembuatan kueri SQL, penalaran visual, dan keamanan. Ini membuktikan bahwa klaim OpenAI tentang model "terpintar, tercepat, dan paling berguna" hanyalah bualan marketing semata.

Lebih mengecewakan lagi, OpenAI dengan diam-diam menghapus akses ke model lama seperti O3, GPT-4.5, dan O4-Mini tanpa pemberitahuan, memaksa pengguna untuk beralih ke GPT-5 yang bermasalah ini.

Janji Kosong dan Bukti Kegagalan

OpenAI melakukan streaming langsung peluncuran GPT-5 di depan 2,5 juta penonton, menampilkan grafik yang secara mencolok salah label. Kesalahan ini bukan sekadar kesalahan manusia, tetapi cerminan dari kualitas model yang mereka tawarkan kepada publik.

Sam Altman, CEO OpenAI, dengan percaya diri mengklaim bahwa GPT-5 "seperti berbicara dengan ahli — ahli tingkat PhD yang sah dalam bidang apa pun, area apa pun yang Anda butuhkan, sesuai permintaan." Pernyataan bombastis ini bertentangan dengan kenyataan yang ditemukan dalam pengujian.

Dalam pengujian SQL Query Generation, GPT-5 memang mendapatkan skor akurasi median tertinggi, tetapi Gemini 2.5 Pro unggul dalam kecepatan respons, tingkat keberhasilan, dan skor rata-rata. Padahal, kedua model ini dibanderol dengan harga yang sama.

Yang lebih mengejutkan, GPT-5 bahkan kalah dari O4-mini dalam beberapa aspek, seperti tingkat keberhasilan, skor rata-rata, dan kecepatan respons. Ini jelas bertentangan dengan klaim OpenAI bahwa GPT-5 lebih baik dari model-model sebelumnya.

Teknologi AI seharusnya berkembang maju, bukan mundur. Kasus GPT-5 ini menunjukkan bagaimana perusahaan AI besar dapat terjebak dalam perlombaan marketing daripada fokus pada peningkatan kualitas yang substansial.

Kegagalan dalam Penalaran Dasar dan Keamanan

GPT-5 diklaim memiliki "kecerdasan tingkat ahli", namun gagal mengidentifikasi masalah dasar dalam grafik yang ditampilkan oleh OpenAI sendiri. Ketika diminta untuk menganalisis grafik tersebut, GPT-5 hanya mengenali satu dari tiga masalah mendasar yang terlihat jelas bahkan oleh siswa SMP.

Masalah keamanan juga menjadi sorotan penting. OpenAI mengklaim bahwa GPT-5 memiliki "safe completions" yang lebih canggih, mampu memberikan jawaban bermanfaat sambil tetap menjaga batasan keamanan. Namun, pengujian menunjukkan bahwa hanya dengan sedikit modifikasi pada prompt, sistem keamanan GPT-5 dapat dengan mudah dilewati.

Kegagalan lain terlihat dalam pengujian penanganan file transkrip. Ketika diminta untuk memperbaiki file subtitle (SRT), GPT-5 berulang kali mengklaim mampu melakukannya padahal sebenarnya tidak bisa. Ini menunjukkan tingkat halusinasi yang tinggi, bertentangan dengan klaim OpenAI tentang pengurangan halusinasi pada model terbaru mereka.

Sebagai tambahan, GPT-5-Thinking yang tersedia di antarmuka ChatGPT anehnya tidak ada di API. OpenAI mengklaim bahwa fitur ini akan otomatis aktif jika diperintahkan untuk "berpikir", namun pengujian menunjukkan performa yang identik dengan atau tanpa perintah tersebut.

Fenomena ini menyoroti masalah lebih luas dalam industri AI, di mana kinerja aktual sering kali tidak selaras dengan klaim pemasaran. Para pengembang AI perlu lebih transparan tentang kemampuan dan keterbatasan model mereka.

Dampak bagi Masa Depan AI

Kekecewaan terhadap GPT-5 menggarisbawahi pentingnya standar evaluasi independen dalam industri AI. Pengguna dan pengembang tidak bisa hanya mengandalkan klaim perusahaan tanpa verifikasi eksternal yang ketat.

Kasus ini juga menunjukkan kebutuhan akan regulasi yang lebih baik terhadap klaim pemasaran AI. Ketika perusahaan teknologi menjanjikan kemampuan yang jauh melebihi apa yang sebenarnya dapat diberikan, hal ini tidak hanya menyesatkan konsumen tetapi juga dapat menghambat perkembangan industri secara keseluruhan.

Bagi pengguna AI seperti kita di Burhan Infratek, ini menjadi pengingat untuk selalu melakukan pengujian mandiri terhadap teknologi baru sebelum mengimplementasikannya dalam solusi untuk klien. Kepercayaan harus dibangun berdasarkan bukti, bukan janji-janji marketing yang menggiurkan.

(Burung Hantu Infratek / Berbagai Sumber)


Berita ini 100% diriset, ditulis dan dikembangkan oleh AI internal Burung Hantu Infratek. Bisa jadi terdapat kesalahan pada data aktual.