Gemini 2.5 Flash Image Siap Produksi

Google resmi mengumumkan Gemini 2.5 Flash Image kini tersedia untuk lingkungan produksi dengan 10 rasio aspek baru dan kemampuan output khusus gambar. Model AI generasi gambar yang dikenal sebagai "Nano Banana" ini menawarkan harga kompetitif $0.039 per gambar untuk pengembang AI dan software developer AI yang ingin mengintegrasikan teknologi canggih ke dalam aplikasi mereka.

Google Lepas Gemini 2.5 Flash Image untuk Produksi

Google akhirnya merilis Gemini 2.5 Flash Image secara resmi untuk lingkungan produksi setelah sebelumnya hanya tersedia dalam tahap pengembangan. Model AI generasi gambar yang terkenal dengan nama kode "Nano Banana" ini kini siap digunakan oleh pengembang AI dan software developer AI di seluruh dunia untuk membangun aplikasi komersial.

Keunggulan utama dari model ini adalah kemampuannya menggabungkan beberapa gambar secara mulus, mempertahankan konsistensi karakter untuk bercerita yang lebih kaya, dan melakukan pengeditan terarah menggunakan bahasa alami. Gemini 2.5 Flash Image juga memanfaatkan pengetahuan luas Gemini untuk generasi dan modifikasi gambar yang lebih akurat.

Fitur baru yang paling menarik adalah dukungan 10 rasio aspek berbeda, mulai dari lanskap sinematik hingga postingan media sosial vertikal. Rasio yang didukung meliputi lanskap (21:9, 16:9, 4:3, 3:2), persegi (1:1), potret (9:16, 3:4, 2:3), dan fleksibel (5:4, 4:5). Fleksibilitas ini memungkinkan kreator konten membuat visual untuk berbagai format tanpa perlu penyesuaian tambahan.

Model ini dapat diakses melalui Gemini API di Google AI Studio dan Vertex AI untuk penggunaan enterprise. Google juga menyediakan dokumentasi lengkap dan cookbook untuk membantu developer memahami fitur-fitur baru termasuk rasio aspek yang diperluas dan kemampuan menentukan output khusus gambar.

Untuk memudahkan pengembangan, Google AI Studio menawarkan "build mode" yang memungkinkan pembuatan dan remix aplikasi AI kustom dari satu prompt saja. Misalnya, "Build me an image editing app with filters" dapat langsung menghasilkan aplikasi fungsional yang siap deploy.

Implementasi Real-World dari Developer Terkemuka

Cartwheel, platform yang menggunakan AI untuk memberikan kontrol langsung kepada artis dalam mewujudkan visi kreatif mereka, telah berhasil mengimplementasikan Gemini 2.5 Flash Image setelah bulan-bulan pengembangan fitur "Pose Mode". Andrew Carr, Co-founder Cartwheel menjelaskan bahwa model lain tidak mampu merender karakter dari sudut kamera arbitrary atau mempertahankan kesetiaan pose tanpa mengorbankan "world knowledge".

Kombinasi tool posing 3D Cartwheel dengan Gemini 2.5 Flash Image menciptakan sistem kreasi gambar yang powerful dengan kontrol karakter dan konsistensi yang tak tertandingi. Ini membuktikan bahwa model Google mampu memberikan performa superior dibanding kompetitor dalam hal rendering dan konsistensi visual.

Volley, kreator game dungeon crawler berbasis AI "Wit's End", menggunakan Gemini 2.5 Flash Image untuk menggenerate dan mengedit visual secara real-time selama sesi permainan. James Wilsterman, CTO Volley, mengatakan model ini menunjukkan rule-following yang state-of-the-art untuk panduan estetik sambil mempertahankan latensi di bawah 10 detik.

Kemampuan ini membuka banyak aplikasi live, seperti memungkinkan pemain memilih gaya dan memperbaiki output dalam loop multi-turn. Untuk software developer AI yang membangun aplikasi gaming atau interactive, performa real-time ini sangat berharga untuk menciptakan pengalaman user yang responsif.

Pricing dan Ketersediaan untuk Developer

Gemini 2.5 Flash Image dihargai sangat kompetitif di $0.039 per gambar, dengan rate $30.00 per 1 juta output token. Pricing untuk modalitas input dan output lainnya selaras dengan Gemini 2.5 Flash standar, membuatnya terjangkau untuk developer yang ingin mengintegrasikan teknologi AI generasi gambar canggih.

Google juga menyediakan tiga contoh aplikasi yang dapat dicoba dan diremix: Bananimate untuk membuat GIF animasi dengan Nano Banana dari gambar dan prompt, Enhance untuk zoom tak terbatas ke dalam fotografi dengan creative upscaler, dan Fit check sebagai virtual fitting room yang memungkinkan upload foto diri dan outfit untuk melihat tampilannya.

Ketersediaan model ini melalui berbagai channel - Gemini API, Google AI Studio untuk testing, dan Vertex AI untuk enterprise - memberikan fleksibilitas bagi pengembang aplikasi AI untuk memilih platform yang sesuai dengan kebutuhan dan skala proyek mereka. Developer dapat langsung mulai building hari ini dengan dokumentasi dan cookbook yang tersedia.

(Burung Hantu Infratek / Berbagai Sumber)

Berita ini 100% diriset, ditulis dan dikembangkan oleh AI internal Burung Hantu Infratek. Bisa jadi terdapat kesalahan pada data aktual.

Sumber dan Referensi:

[1] Gemini 2.5 Flash Image now ready for production with new aspect ratios

[2] Cartwheel - AI Image Creation Platform

[3] Volley Games - AI Powered Gaming

[4] Google AI Studio

[5] Gemini API Documentation