Google membocorkan sejumlah pembaruan untuk Gemini yang memperluas kemampuannya sebagai AI multimodal. Dengan peningkatan ini, Gemini tidak hanya merespons pertanyaan berbasis teks, tetapi juga dapat melihat, mendengar, serta memahami konteks visual dan audio di sekitar pengguna.
Salah satu fitur yang disorot adalah Live Search berbasis kamera real-time. Pengguna cukup mengarahkan kamera ponsel ke suatu objek, lalu Gemini akan memberikan analisis, informasi, dan saran yang relevan. Contohnya, ketika kamera diarahkan ke makanan di dapur, AI dapat menampilkan resep dan rekomendasi olahan. Saat menyorot mobil, Gemini disebut mampu mendeteksi bagian yang rusak dan memberikan solusi perbaikan. Penggabungan pengenalan gambar, suara, dan konteks lingkungan ini ditujukan agar interaksi terasa lebih intuitif.
Pembaruan lain hadir melalui AI Mode baru di Google Search yang membawa konsep agentic AI, yakni kemampuan AI untuk bertindak lebih otomatis. Dalam mode ini, Gemini tidak hanya menjawab pertanyaan, tetapi juga dapat melakukan tindakan seperti memesan restoran, mencari tiket, atau mengatur jadwal pertemuan. Misalnya, pengguna dapat memberi perintah untuk mencarikan restoran Jepang untuk makan malam empat orang, lalu Gemini menelusuri opsi, menyesuaikan dengan preferensi, hingga melakukan reservasi.
Google juga menyematkan Gemini langsung ke browser Chrome. Tombol khusus Gemini muncul di antarmuka, memungkinkan pengguna mengajukan pertanyaan berdasarkan laman yang sedang dibuka. Saat membuka situs e-commerce, misalnya, pengguna dapat meminta rekomendasi produk atau membandingkan harga antartoko. Gemini kemudian menganalisis isi halaman dan memberikan jawaban tanpa pengguna perlu berpindah tab.
Di sisi kreatif, Gemini disebut kini mampu membuat video sekaligus menganalisis gambar dan memahami suara. Melalui model Veo 3 dan platform Flow, Google memperkenalkan sistem generatif yang dapat mengubah teks atau foto menjadi video bergaya sinematik lengkap dengan audio dan transisi. Fitur “Scene Extension” memungkinkan AI memperluas klip video secara otomatis dengan menambahkan adegan baru, sementara “Ingredients to Video” dapat menggabungkan beberapa gambar menjadi video utuh dengan narasi.
Selain itu, Gemini juga mendapatkan kemampuan untuk menonton dan merangkum video di Google Drive. Pengguna dapat memperoleh ringkasan poin penting dari video rapat atau kuliah tanpa harus menonton seluruhnya. Google turut memperluas dukungan bahasa, termasuk Bahasa Indonesia, agar pengguna lokal dapat memanfaatkan fitur AI dengan pemahaman konteks bahasa yang lebih sesuai.
Beragam pembaruan tersebut dinilai berpotensi memengaruhi cara pengguna di Indonesia bekerja dan berkreasi, mulai dari pencarian informasi visual secara instan hingga pembuatan konten digital yang lebih cepat. Meski demikian, pengguna tetap perlu memperhatikan aspek privasi dan keamanan data, mengingat sejumlah fitur baru memanfaatkan konteks visual serta riwayat aktivitas untuk menghasilkan personalisasi.