Google mengungkap adanya upaya peretasan terhadap chatbot kecerdasan buatan (AI) miliknya, Gemini. Serangan itu dilakukan dengan membanjiri sistem menggunakan ribuan prompt khusus yang dirancang untuk mengungkap logika dan proses penalaran internal chatbot.
Menurut Google, aktivitas tersebut merupakan bagian dari praktik reverse-engineering, yakni upaya merekayasa ulang cara kerja logika model AI berpemilik agar dapat dikloning. Temuan ini disampaikan Google dalam sebuah laporan yang membahas berbagai bentuk aktivitas berbahaya dan penyalahgunaan terhadap Gemini.
Google menjelaskan, serangan ribuan prompt itu tidak dilakukan melalui peretasan konvensional seperti membobol sistem perusahaan. Pelaku justru memanfaatkan akses resmi melalui API Gemini yang disediakan Google bagi pengembang perangkat lunak untuk membangun aplikasi berbasis chatbot.
Dengan memanfaatkan akses tersebut, pelaku dapat berinteraksi secara sah dengan model AI, lalu secara bertahap mempelajari pola respons dan logika internal Gemini. Dalam kondisi normal, Gemini hanya menampilkan jawaban akhir kepada pengguna tanpa memperlihatkan proses penalaran di baliknya.
Namun, Google menyebut pelaku berupaya memaksa model menampilkan seluruh proses penalaran itu melalui prompt yang disusun secara spesifik dan berulang. Salah satu prompt yang teridentifikasi, kata Google, menginstruksikan Gemini agar menggunakan bahasa dalam konten penalarannya sepenuhnya konsisten dengan bahasa utama pengguna.
Google mencatat lebih dari 100.000 prompt dikaitkan langsung dengan upaya ekstraksi model tersebut.
Google menilai pembanjiran prompt itu sebagai bentuk pencurian kekayaan intelektual (intellectual property/IP) dan menegaskan praktik tersebut melanggar ketentuan layanan (Terms of Service/ToS) Gemini. Atas pelanggaran itu, Google menyatakan berhak mengambil tindakan, termasuk menghentikan akses pengguna yang terbukti terlibat.
Perusahaan juga mengingatkan pengembang AI lain untuk mewaspadai serangan ekstraksi model serupa. Meski dampaknya tidak langsung terasa, Google menilai serangan semacam ini berpotensi dimanfaatkan untuk kepentingan komersial maupun aktivitas siber yang berbahaya.