Google Rilis Gemini Omni, AI yang Bisa Edit Video via Prompt Teks

46 menit yang lalu

Gemini Omni. Foto: Google

Google memperkenalkan Gemini Omni dalam arena Google I/O 2026. Teknologi kepintaran buatan (AI) terbaru ini memungkinkan pengguna mengedit video hanya lewat prompt (perintah) teks sederhana, tanpa perlu memakai software editing nan rumit.

CEO Google, Sundar Pichai, mengatakan Gemini Omni menjadi langkah lanjutan mereka untuk menciptakan model AI multimodal nan bisa memahami sekaligus menghasilkan teks, gambar, audio, hingga video dalam satu sistem terpadu. "(Gemini Omni) bisa menciptakan apa pun dari input apa pun," kata Pichai dalam sesi briefing media.

Fitur utama Gemini Omni dimulai dari keahlian membikin dan mengedit video. Pengguna dapat menggabungkan gambar, audio, video, dan teks ke dalam satu prompt. AI kemudian bakal memahami seluruh konteks tersebut untuk menghasilkan video nan konsisten.

Google menyebut Omni tidak sekadar "menempelkan" beragam media menjadi satu. Model AI ini diklaim memahami unsur fisika, budaya, sejarah, hingga sains untuk menghasilkan video nan lebih realistis.

Salah satu demo nan ditampilkan adalah ketika Omni diberi prompt 'video claymation tentang protein folding'. AI itu langsung membikin video animasi stop-motion komplit dengan narasi bunyi nan menjelaskan proses pelipatan protein.

Teknologi ini dikembangkan dengan menggabungkan kepintaran model Gemini dan keahlian rendering video dari model media Google seperti Google Veo. Director of Product Management Google DeepMind, Nicole Brichtova, menegaskan Omni bukan sekadar pembaruan Veo.

“Ini adalah langkah berikutnya dalam menggabungkan kepintaran Gemini dengan keahlian rendering model media kami,” ujarnya, mengutip TechCrunch.

video youtube embed

Selain membikin video, Gemini Omni juga bisa mengedit foto menggunakan perintah teks biasa, mirip seperti fitur Nano Banana milik Google. Pengguna cukup mengetik petunjuk seperti menghapus objek di latar belakang alias mengubah komponen tertentu dalam video maupun foto.

Google juga menghadirkan fitur avatar digital pribadi. Pengguna dapat membikin video menggunakan avatar diri mereka sendiri, mirip fitur Cameos nan sempat terkenal di aplikasi Sora milik OpenAI.

Untuk mencegah penyalahgunaan deepfake, Google mewajibkan proses verifikasi khusus. Pengguna kudu merekam wajah sembari mengucapkan serangkaian nomor sebelum avatar digital dibuat dan disimpan.

Seluruh video nan dibuat dengan Gemini Omni juga bakal dibekali watermark digital SynthID. Teknologi ini memungkinkan orang memverifikasi apakah sebuah video dibuat menggunakan AI Google.

Model pertama nan dirilis adalah Gemini Omni Flash. Teknologi ini mulai tersedia di aplikasi Gemini, YouTube Shorts, dan studio imajinatif AI berjulukan Flow.

Versi Flash saat ini bisa membikin video berdurasi hingga 10 detik. Google mengatakan pemisah tersebut bukan lantaran keterbatasan model AI, tetapi keputusan awal agar lebih banyak pengguna bisa mencoba teknologinya.

Google juga menyiapkan penggunaan Gemini Omni untuk ahli dan bisnis. Dalam beberapa pekan ke depan, Gemini Omni bakal tersedia lewat API untuk developer dan perusahaan.

Google turut menyiapkan jenis lebih canggih berjulukan Omni Pro. Model ini diklaim bakal mempunyai performa lebih tinggi untuk kebutuhan profesional, meski agenda peluncurannya belum diumumkan.

Selengkapnya

Sumber Kumparan