Gemini Luncurkan Model Editing Gambar Terbaru, Jaga Keaslian Subjek Dalam Transformasi

Google merilis model editing gambar terbaru untuk aplikasi Gemini yang mampu mempertahankan keaslian subjek meskipun ditransformasi ke berbagai skenario. Model ini mengatasi masalah umum dalam editing AI di mana hasil editan sering membuat subjek terlihat "hampir mirip tapi tidak sama" dengan aslinya.
Lima fitur utama yang ditawarkan model baru ini adalah: perubahan kostum dan lokasi, penggabungan beberapa foto, editing multi-tahap, percampuran desain, dan watermark otomatis. Teknologi ini membuka kemungkinan kreativitas digital yang lebih luas bagi pengguna awam, sambil tetap menjaga keamanan konten melalui fitur watermark baik yang terlihat maupun yang tidak terlihat (SynthID).
Google baru saja merilis pembaruan besar untuk fitur editing gambar di aplikasi Gemini. Model baru dari Google DeepMind ini diklaim sebagai model editing gambar teratas di dunia. Kemampuan utamanya: menjaga keaslian wajah dan karakter subjek meski diubah ke berbagai skenario.
Pembaruan ini menjawab tantangan umum dalam editing AI, di mana hasil editan seringkali membuat subjek "hampir mirip tapi tidak sama" dengan aslinya. Kini pengguna dapat mengubah gambar secara drastis sambil mempertahankan identitas orang, hewan peliharaan, atau subjek lainnya.
Teknologi AI generatif ini membuka kemungkinan editing visual yang lebih luas namun tetap otentik, mendorong batas kreativitas digital.
Menjaga Identitas Asli dalam Transformasi Digital
Google telah menghadirkan kemampuan editing gambar dasar di aplikasi Gemini sejak awal tahun ini. Namun, tim pengembang menyadari adanya kelemahan signifikan: ketidakmampuan mempertahankan kemiripan subjek secara konsisten ketika diedit.
Permasalahan ini menjadi fokus utama pengembangan. Ketika pengguna mengedit foto diri, keluarga, atau hewan peliharaan, perbedaan kecil dalam hasil sangat mengganggu. Model baru ini dirancang khusus untuk mengatasi masalah tersebut.
Kemampuan AI untuk memahami dan mempertahankan ciri khas subjek dalam berbagai transformasi merupakan lompatan besar dalam teknologi computer vision. Sistem ini menganalisis dan menyimpan karakteristik unik subjek, kemudian memastikan karakteristik tersebut tetap ada dalam hasil editan.
Aspek penting lainnya adalah kemampuan sistem mengenali dan mempertahankan konsistensi visual di berbagai skenario. Baik itu perubahan latar belakang, pakaian, atau bahkan penempatan subjek dalam era waktu berbeda.
Dari perspektif teknis, ini menunjukkan kemajuan signifikan dalam pemahaman semantik AI terhadap identitas visual, menandai evolusi penting dalam pengolahan gambar berbasis kecerdasan buatan.
Lima Fitur Utama yang Revolusioner
Model editing gambar terbaru dari Gemini hadir dengan lima kemampuan utama yang mengubah cara pengguna berinteraksi dengan konten visual. Pertama, fitur perubahan kostum dan lokasi yang memungkinkan pengguna menempatkan diri atau subjek lain dalam berbagai skenario tanpa kehilangan kemiripan asli. Teknologi AI memastikan subjek tetap tampak seperti dirinya meski diletakkan dalam konteks berbeda.
Kedua, kemampuan menggabungkan beberapa foto menjadi satu adegan baru. Fitur ini memungkinkan pengguna mengambil elemen dari berbagai gambar dan menggabungkannya secara harmonis. Misalnya, menggabungkan foto diri dengan foto hewan peliharaan untuk menciptakan potret bersama yang sempurna dalam setting baru.
Ketiga, editing multi-tahap yang memungkinkan pengguna terus memodifikasi hasil secara bertahap. Pengguna bisa mulai dengan ruangan kosong, lalu menambahkan warna dinding, rak buku, dan furnitur secara berurutan. AI Gemini menjaga konsistensi visual selama proses berlangsung.
Keempat, fitur percampuran desain yang revolusioner. Ini memungkinkan pengguna menerapkan gaya visual dari satu objek ke objek lain - seperti mengaplikasikan pola dan warna kelopak bunga pada sepatu bot hujan, atau mendesain gaun dengan pola sayap kupu-kupu.
Kelima, watermark otomatis pada setiap gambar. Gemini tidak hanya menambahkan tanda air yang terlihat, tetapi juga menyematkan watermark digital SynthID yang tidak terlihat pada setiap gambar hasil AI. Ini menjadi solusi untuk masalah otentikasi konten di era deepfake.
Implikasi untuk Masa Depan Kreativitas Digital
Kemajuan dalam teknologi editing gambar AI ini membuka jalan baru bagi kreativitas digital. Pengguna awam kini memiliki akses ke kemampuan manipulasi gambar tingkat lanjut yang sebelumnya hanya tersedia bagi profesional dengan perangkat khusus.
Bagi industri kreatif, ini berarti demokratisasi alat desain visual. Dampaknya akan terasa pada bidang periklanan, desain produk, dan industri hiburan. Bisnis kecil kini dapat menciptakan materi visual berkualitas tinggi dengan investasi minimal.
Namun, perkembangan ini juga menghadirkan tantangan etis baru. Kemudahan memanipulasi gambar dengan hasil yang semakin realistis membutuhkan standar baru dalam verifikasi konten dan literasi media digital. Inisiatif watermark Gemini adalah langkah awal yang penting dalam arah ini.
(Burung Hantu Infratek / Berbagai Sumber)
Berita ini 100% diriset, ditulis dan dikembangkan oleh AI internal Burung Hantu Infratek. Bisa jadi terdapat kesalahan pada data aktual.
