Wikipedia Minta AI Companies Bayar API, Hentikan Scraping Data

Wikipedia Minta AI Companies Bayar API, Hentikan Scraping Data

Wikimedia Foundation pada Senin mengimbau perusahaan AI untuk menggunakan konten Wikipedia secara bertanggung jawab dengan memastikan atribusi yang tepat dan mengakses konten melalui produk berbayar Wikimedia Enterprise platform, setelah mendeteksi lonjakan traffic tidak wajar di Mei dan Juni 2025 yang ternyata berasal dari AI bots yang mencoba menghindari deteksi sambil menyamar sebagai manusia, sementara traffic dari human page views turun 8% year-over-year, memaksa ensiklopedia online terbesar ketujuh di dunia ini yang dibiayai donasi senilai $179 juta per tahun untuk menegaskan bahwa scraping masif membebani server mereka dan mengancam kelangsungan misi nonprofit yang mengandalkan kontribusi editor sukarelawan dan dukungan donor individual.


Traffic Human Turun 8%, AI Bots Menyamar Manusia

Wikipedia mencatat fenomena mengkhawatirkan dalam traffic websitenya pada pertengahan 2025. Setelah memperbarui sistem deteksi bot mereka, Wikimedia Foundation menemukan bahwa traffic yang tidak biasa tinggi pada Mei dan Juni 2025 ternyata berasal dari AI bots yang mencoba "menghindari deteksi" dengan menyamar sebagai pengunjung manusia. Penemuan ini menjadi lebih mengkhawatirkan karena bersamaan dengan penurunan 8% year-over-year dalam human page views, menunjukkan pergeseran signifikan dalam cara orang mengakses informasi.

Dalam posting blog yang diterbitkan Senin 10 November 2025, Wikimedia Foundation menyampaikan rencana sederhana untuk memastikan websitenya terus didukung di era AI meskipun traffic-nya menurun. Organisasi yang menjalankan ensiklopedia online populer ini menyerukan kepada developer AI untuk menggunakan kontennya secara "bertanggung jawab" dengan memastikan kontribusinya diatribusikan dengan benar dan konten diakses melalui produk berbayarnya, Wikimedia Enterprise platform.

Produk opt-in berbayar ini memungkinkan perusahaan menggunakan konten Wikipedia dalam skala besar tanpa "membebani server Wikipedia secara parah", jelas posting blog Wikimedia Foundation. Selain itu, sifat berbayar dari produk tersebut memungkinkan perusahaan AI untuk mendukung misi nonprofit organisasi. Meskipun postingan tersebut tidak sampai mengancam penalti atau tindakan hukum apa pun untuk penggunaan materialnya melalui scraping, Wikipedia dengan jelas menyatakan kekhawatirannya tentang dampak jangka panjang dari praktik ini.

Biaya Operasional $179 Juta, Terancam AI Disruption

Menjalankan Wikipedia adalah upaya yang mahal. Situs ini saat ini adalah website yang paling banyak dikunjungi ketujuh di dunia menurut Semrush. Biayanya mencapai $179 juta untuk menjalankan Wikipedia selama tahun fiskal 2023-2024 menurut audit Wikimedia Foundation. Wikimedia menjaga Wikipedia tetap berjalan terutama melalui donasi dan tidak menjalankan iklan, menjadikannya salah satu platform nonprofit terbesar yang sepenuhnya bergantung pada kontribusi publik.

Namun AI mengubah kebiasaan riset orang. Alih-alih meneliti subjek di Wikipedia, orang beralih ke AI untuk menjawab pertanyaan mereka. Meskipun Wikipedia gratis digunakan, jika orang melewatinya dengan menggunakan ChatGPT atau layanan AI lainnya, mereka tidak akan melihat permintaan donasi di bagian atas halaman beranda Wikipedia, dan situs tersebut bisa kehilangan uang. Ini menciptakan lingkaran setan di mana lebih sedikit kunjungan ke Wikipedia berarti lebih sedikit sukarelawan yang mungkin tumbuh dan memperkaya konten, dan lebih sedikit donor individu yang mungkin mendukung pekerjaan ini.

Wikimedia meminta perusahaan AI untuk membayar menggunakan Enterprise API-nya, yang akan memungkinkan mereka "menggunakan konten Wikipedia dalam skala besar dan berkelanjutan tanpa membebani server Wikipedia secara parah, sambil juga memungkinkan mereka untuk mendukung misi nonprofit kami." Platform berbayar ini dirancang khusus untuk memberikan akses terstruktur ke konten Wikipedia yang telah diparsing, dalam format JSON yang developer-friendly dan machine-readable, ideal untuk training models, building features, dan testing NLP pipelines.

Panduan untuk AI Developers: Atribusi Wajib

Wikipedia kini menetapkan pedoman untuk developer dan penyedia AI, menyatakan bahwa developer AI generatif harus memberikan atribusi untuk memberikan kredit kepada kontributor manusia yang kontennya digunakan untuk membuat outputnya. "Agar orang dapat mempercayai informasi yang dibagikan di internet, platform harus menjelaskan dari mana informasi tersebut bersumber dan meningkatkan peluang untuk mengunjungi dan berpartisipasi dalam sumber-sumber tersebut," bunyi posting tersebut.

Permintaan Wikimedia muncul saat kreator konten online mendorong kembali perusahaan AI yang menggunakan data online tanpa izin atau pembayaran. Penerbit online seperti Penske, New York Times, dan News Corp menggugat perusahaan AI atas pelanggaran hak cipta. Perusahaan lain seperti Associated Press dan Reuters telah menandatangani kesepakatan lisensi dengan perusahaan AI. Google sendiri setuju pada kesepakatan dengan Wikimedia pada 2022 untuk mengakses konten Wikipedia secara komersial, menunjukkan preseden untuk model bisnis yang lebih berkelanjutan.

Awal tahun ini, organisasi merilis strategi AI untuk editor, yang mengatakan akan menggunakan AI untuk membantu editor dengan alur kerja seputar tugas yang membosankan, mengotomatisasi terjemahan, dan alat lain yang membantu editornya, bukan menggantikan mereka. Pendekatan ini menekankan bahwa Wikimedia melihat AI sebagai alat untuk memperkuat komunitas manusia, bukan menggantikannya, sejalan dengan filosofi nonprofit yang memprioritaskan kontribusi dan partisipasi manusia.

Sementara itu, saham Big Tech telah melambung ke ketinggian stratosfer selama boom AI. Nvidia sempat menjadi perusahaan $5 triliun pertama di dunia akhir bulan lalu, dengan Microsoft dan Alphabet (perusahaan induk Google) menembus batas $4 triliun awal tahun ini. Kontras antara valuasi raksasa teknologi yang memanfaatkan data Wikipedia dan kesulitan finansial organisasi nonprofit yang menyediakannya semakin memperkuat argumen Wikimedia untuk kompensasi yang adil.

(Burung Hantu Infratek / Berbagai Sumber)


⚠️ Berita ini seluruhnya diriset, ditulis, dan dikembangkan oleh AI internal Burung Hantu Infratek. Mohon maaf apabila terdapat ketidakakuratan pada data aktual.


Berita Terkait AI Data Training dan Scraping

🤖 Perplexity Kepergok Curi Data Website yang Melarang AI Scraping

🔥 Moonshot AI Rilis Kimi K2 Thinking: Model Open Source China Kalahkan GPT-5 dan Claude Sonnet 4.5

Intel CTO Sachin Katti Resign Setelah 6 Bulan, Pindah ke OpenAI untuk Bangun Infrastruktur AGI

💡 AMD Prediksi Pasar Chip Data Center AI Tembus $1 Triliun di 2030: Lisa Su Targetkan Puluhan Miliar Revenue

🚀 Google Dark Launch Gemini 3 Pro Preview: Model AI 1 Triliun Parameter dengan Context Window 1 Juta Token

💻 Yann LeCun Tinggalkan Meta: Pelopor AI Dirikan Startup World Models


Sumber dan Referensi

[1] Wikipedia urges AI companies to use its paid API, and stop scraping

[2] Wikipedia Asks AI Companies to Stop Scraping Data and to Start Paying Up

[3] Wikipedia Kaggle Dataset using Structured Contents Snapshot