Polars Raih $21 Juta Pendanaan Accel: Revolusi Pemrosesan Data Alternatif Pandas

Polars berhasil mengumpulkan $21 juta dalam putaran Series A yang dipimpin Accel untuk mengembangkan platform data terdistribusi yang menantang dominasi Pandas dan Apache Spark. Startup Amsterdam ini menargetkan pengembang AI dan software developer AI dengan mesin pemrosesan data berbasis Rust yang 12 kali lebih cepat dari solusi konvensional.
Startup Polars Kumpulkan $21 Juta untuk Tantang Ekosistem Pandas
Polars, perusahaan di balik proyek open source populer dengan nama yang sama, resmi mengumumkan keberhasilan mengumpulkan €18 juta (sekitar $21 juta) dalam putaran Series A yang dipimpin oleh Accel, dengan partisipasi dari Bain Capital Partners dan investor malaikat. Pencapaian pendanaan ini menandai langkah besar dalam misi perusahaan Amsterdam untuk merevolusi cara pengembang AI dan developer perangkat lunak AI memproses data besar.
Perjalanan Polars dimulai sebagai proyek sampingan selama pandemi COVID oleh Ritchie Vink, yang frustrasi dengan keterbatasan Pandas dalam menangani dataset besar. Vink memutuskan membangun mesin query yang lebih baik menggunakan bahasa pemrograman Rust, menghasilkan solusi yang mampu memproses data jauh lebih cepat dari alternatif yang ada.
Lima tahun kemudian, Polars telah digunakan secara luas oleh data scientist dan tim pengembangan untuk kemampuannya memproses data dengan performa yang signifikan lebih tinggi. Kombinasi kinerja dan popularitas inilah yang menarik perhatian investor ventura, tetapi Series A ini dipicu oleh roadmap Polars untuk menjadi bisnis yang dapat diskalakan.
Dua tahun setelah meluncurkan sebagai perusahaan, Polars bulan ini merilis Polars Cloud, platform data terkelola yang memungkinkan pengguna menjalankan query di cloud dengan skala besar. Layanan ini dirancang khusus untuk kebutuhan pengembang aplikasi AI yang bekerja dengan dataset petabyte.
Accel partner Zhenya Loginov yang memimpin putaran pendanaan menyatakan, "Dalam komunitas open source, lelucon yang beredar adalah bahwa kamu bisa menulis ulang apapun dalam Rust dan itu akan menjadi lebih baik. Alasan itu menjadi lelucon adalah karena itu bukan keunggulan berkelanjutan yang nyata, dan kamu perlu melakukan lebih banyak lagi."
Polars Cloud: Platform Terdistribusi untuk Skala Enterprise
Bagi Vink dan co-founder-nya, mantan CTO Xomnia Chiel Peters, melakukan lebih banyak berarti membangun produk di sekitar perkakas, seperti Polars Cloud dan Polars Distributed. Yang terakhir adalah mesin terdistribusi yang akan mendukung kasus penggunaan yang melibatkan petabyte data, bukan dataset kecil, dan saat ini tersedia dalam beta publik.
Membangun fitur baru inilah yang akan menjadi tujuan sebagian besar pendanaan, kata Vink. Dengan Polars Distributed, startup ini bertujuan menantang Apache Spark, yang penciptanya mendirikan Databricks. Strategi ini secara langsung menargetkan kebutuhan software developer AI yang mengelola infrastruktur data skala besar untuk pelatihan model AI.
Bagi Polars, mengejar pangsa pasar Pandas sudah cukup untuk mengamankan putaran seed $4 juta yang dipimpin Bain Capital pada 2023. Namun Pandas tetap open source tanpa platform komersial khusus, dan meskipun Polars telah melampaui 24 juta unduhan, jalur menuju pengembalian akan tidak jelas jika bukan karena Polars Distributed dan kemampuan untuk meningkatkan skala dari mesin tunggal ke cluster terkelola.
Loginov menyebut ini sebagai pasar kedua yang "lebih menarik", dia setuju dengan Vink bahwa nilai Polars adalah dalam menutup kesenjangan skala antara Pandas dan Spark. "Jika kamu masuk ke dalam kemampuan memproses dataset dengan ukuran dan kompleksitas apa pun, kamu menyelesaikan banyak tantangan untuk banyak perusahaan. Jadi kami merasa bahwa pasar utama berpotensi sangat besar," kata Loginov.
Performa Luar Biasa: Rust vs Python dalam Benchmark Real-World
Polars mengklaim produk inti sudah digunakan dalam produksi di seluruh keuangan, ilmu kehidupan, dan logistik. Dalam benchmark TPC-H yang dilakukan secara independen, Polars menunjukkan performa yang mengesankan dibandingkan kompetitor tradisional seperti Pandas dan bahkan Apache Spark dalam beberapa skenario.
Pengujian performa menunjukkan bahwa Polars dapat memberikan peningkatan kecepatan hingga 12 kali dalam operasi group by tanggal pada dataset dengan 76 juta baris, menyelesaikan tugas dalam 4.7 detik dibandingkan dengan 28 detik yang dibutuhkan Pandas. Untuk filtering log berukuran 10GB, Polars menyelesaikan dalam 18 detik sementara Pandas membutuhkan 95 detik.
Keunggulan performa ini sangat penting bagi pengembang AI yang bekerja dengan dataset pelatihan besar atau melakukan analisis real-time pada data streaming. Software developer AI dapat memanfaatkan multi-threading asli, evaluasi malas, dan tata letak memori Arrow yang diimplementasikan dalam Polars untuk mengoptimalkan pipeline data mereka.
Arsitektur berbasis Rust memberikan Polars keunggulan fundamental dalam menghindari bottleneck GIL (Global Interpreter Lock) yang membatasi Python, memungkinkan paralelisme sejati yang essential untuk aplikasi AI modern.
Ekspansi Ekosistem: Dari Open Source ke Platform Enterprise
Polars Cloud dan Polars Distributed membuka babak baru untuk perusahaan ini. Dengan lebih dari 23 juta pengguna bulanan tumbuh dari 250 ribu sejak investasi seed, adopsi Polars menunjukkan tren yang kuat di kalangan komunitas data science dan pengembang aplikasi AI.
Platform cloud yang baru diluncurkan menawarkan serverless compute yang memungkinkan developer memulai sumber daya komputasi tanpa mengelola infrastruktur. Ini sangat valuable untuk pengembang AI yang fokus pada eksperimen model dan iterasi algoritma rather than manajemen infrastruktur.
Unified DataFrame Experience yang ditawarkan Polars Cloud memungkinkan developer menulis kode DataFrame sekali dan menjalankannya di mana saja, dari mesin lokal hingga cluster terdistribusi skala besar. API yang konsisten ini simplifies development workflow untuk software developer AI yang bekerja across different environments.
Polars juga mengintegrasikan distributed queries yang memungkinkan horizontal scaling workload across multiple machines. Untuk query dataset besar dari cloud storage, performance sering dibatasi oleh I/O limitations dari single node, yang dapat diatasi significally dengan pendekatan distributed ini.
Strategi Kompetitif: Menantang Dominasi Apache Spark dan Databricks
Dengan target menantang Apache Spark yang telah mapan, Polars mengadopsi strategi unique dengan fokus pada developer experience dan performance optimization. Berbeda dengan Spark yang complex dalam deployment dan tuning, Polars menawarkan simplicity tanpa mengorbankan performance untuk pengembang aplikasi AI.
Ecosistem data processing saat ini terfragmentasi antara tools untuk local work (Pandas) dan solutions untuk distributed computing (Spark/Databricks), masing-masing dengan APIs dan limitations tersendiri. Polars berusaha bridging gap ini dengan platform unified yang scalable dari single machine hingga distributed clusters.
Untuk founder lain yang berharap mengubah proyek open source menjadi venture komersial, Loginov menunjukkan pelajaran kunci dari perjalanan Vink. "Polars menjadi sukses karena mengatasi masalah yang benar-benar besar — dia menemukan niche di mana teknologi yang tersedia saat ini sudah ketinggalan zaman. Jadi saya akan menyarankan menemukan masalah yang besar."
Investment ini memposisikan Polars untuk compete secara langsung dengan established players dalam data processing ecosystem, particularly targeting needs dari modern AI development teams yang membutuhkan both speed dan scalability dalam data operations mereka.
(Burung Hantu Infratek / Berbagai Sumber)
Berita ini 100% diriset, ditulis dan dikembangkan oleh AI internal Burung Hantu Infratek. Bisa jadi terdapat kesalahan pada data aktual.
Sumber dan Referensi:
[1] The startup behind open source tool Polars raises $21M from Accel
[2] Polars raises €18M Series A to build fast, ergonomic data processing at any scale
[3] Launch of Polars Cloud and Distributed Polars
[4] The 2025 Data Processing Revolution: How Polars Crushes Pandas by 12x Speed
