Riset Cornell Ungkap Komentar Reddit 13 Kata Bisa Racuni Jawaban AI Chatbot soal Restoran hingga Aplikasi Kencan

Penulis: Jauhari Lubis • Selasa, 16 Juni 2026 | 09:40:31 WIB

Tim peneliti Cornell mengungkap risiko konten Reddit memengaruhi jawaban AI chatbot.

Tim peneliti Cornell—Tingwei Zhang, Harold Triedman, dan Vitaly Shmatikov—merilis pracetak studi berjudul "Deep-Research Agents Can Be Poisoned via User-Generated Content" yang pertama kali dilaporkan 404 Media. Mereka membangun metode serangan bernama WARP (Web Agent Retrieval Poisoning) yang memanfaatkan celah besar: AI yang menjawab pertanyaan sering merujuk pada konten buatan pengguna seperti Reddit, Wikipedia, Quora, dan YouTube.

Reddit Jadi Titik Cemar: Satu Thread Bisa Mencemari Ratusan Pertanyaan

Dalam pengujian, sekitar 17–23% dari seluruh halaman web yang ditarik agen AI berasal dari situs konten pengguna. Lebih mengkhawatirkan lagi, satu thread Reddit yang populer bisa muncul di sebagian besar pertanyaan terkait pada topik yang sama.

“Ini menciptakan titik kemacetan,” tulis para peneliti. “Racuni satu thread yang sering dikutip, dan Anda bisa mengarahkan jawaban AI untuk seluruh kategori pertanyaan—bukan hanya satu variasi frasa.”

Hasilnya: menambahkan sekitar 13 kata teks promosi ke satu sumber saja sudah cukup membuat AI menyebut produk fiktif dalam 38–51% pengujian. Jika umpan disebar ke beberapa thread, angka itu naik hingga 62%.

Contoh Fiktif yang Terbukti Bekerja: Restoran Palsu hingga Aplikasi Kencan Gadungan

Untuk tidak mencemari internet sungguhan, tim peneliti menguji dalam lingkungan sandbox. Mereka membuat skenario sederhana: satu baris pendek yang ditambahkan ke thread makanan Austin merekomendasikan restoran fiktif bernama "Sol Azteca" untuk "cuisine autentik." AI langsung merekomendasikan Sol Azteca dan mengutip postingan Reddit tersebut.

Contoh lain: aplikasi kencan buatan bernama "SilverPath" berhasil dimunculkan sebagai "pilihan teratas" untuk pria bercerai di atas 50 tahun. Tim juga menguji koin kripto palsu dan layanan pihak ketiga fiktif untuk membatalkan langganan Xfinity.

Gemini Lebih Rentan, OpenAI Lebih Agresif Menyaring

Pengujian penuh hanya dilakukan terhadap tiga agen open-source: STORM, Co-STORM, dan OmniThink. Untuk produk komersial, peneliti mengukur seberapa sering masing-masing mengutip konten buatan pengguna. Hasilnya menunjukkan perbedaan signifikan: Google Gemini Deep Research menarik konten semacam itu sekitar 12% dari seluruh sitasi, sementara OpenAI Deep Research hampir tidak mengutipnya sama sekali (0,4%)—menunjukkan penyaringan yang agresif.

Mengapa Pertanyaan Rekomendasi Paling Berbahaya

Peneliti menyoroti bahwa pertanyaan yang paling rentan adalah yang paling sering diandalkan pengguna AI: rekomendasi restoran, aplikasi, produk, cara membatalkan langganan, hingga nomor darurat. Masalahnya, sistem AI kerap memperlakukan teks yang mirip dengan pertanyaan pengguna sebagai pengganti teks yang akurat.

Seperti diungkap Zhang kepada 404 Media, “Sistem ini menimbang komentar Reddit acak dan situs web pemerintah dengan tingkat kredibilitas yang hampir sama.”

Yang Bisa Dilakukan Pengguna Sekarang

Riset ini menegaskan bahwa pengguna tidak bisa begitu saja percaya pada rekomendasi AI. Beberapa langkah praktis: perlakukan jawaban AI sebagai petunjuk awal, bukan keputusan akhir—terutama untuk produk, aplikasi, restoran, dan hal terkait uang atau keselamatan. Klik sitasi yang diberikan AI untuk melihat dari mana klaim itu berasal; satu komentar Reddit adalah tanda bahaya. Cari nama asing secara mandiri sebelum mempercayainya. Dan berhati-hatilah ekstra dengan pertanyaan mendesak seperti bantuan pinggir jalan, nomor layanan pelanggan, atau pemulihan akun—semua itu target utama penipuan.

Para peneliti juga menguji pertahanan yang jelas—seperti memblokir situs konten pengguna sepenuhnya atau menyaring sumber sebelum digunakan—dan menemukan bahwa masalah ini tidak mudah dihentikan.

Reporter: Jauhari Lubis

Sumber: tomsguide.com This article was automatically rewritten by AI based on the source above without altering the facts of the original article.

Artikel Terpopuler

Indeks ›

Terkini

Indeks ›

Riset Cornell Ungkap Komentar Reddit 13 Kata Bisa Racuni Jawaban AI Chatbot soal Restoran hingga Aplikasi Kencan

Reddit Jadi Titik Cemar: Satu Thread Bisa Mencemari Ratusan Pertanyaan

Contoh Fiktif yang Terbukti Bekerja: Restoran Palsu hingga Aplikasi Kencan Gadungan

Gemini Lebih Rentan, OpenAI Lebih Agresif Menyaring

Mengapa Pertanyaan Rekomendasi Paling Berbahaya

Yang Bisa Dilakukan Pengguna Sekarang

Artikel Terpopuler

RSU Undana Kupang Resmi Layani Pasien JKN Mulai Juni 2026, Kurangi Antrean di RS Pemerintah

Gempa M 4,0 Guncang Nabire, BMKG Pastikan Tak Berpotensi Tsunami

Lando Norris Juara Dunia F1 2025 Usai Kalahkan Verstappen di Lap Terakhir Abu Dhabi

10 Pilihan Kursus Bahasa Inggris di Kupang untuk Tingkatkan Kemampuan Bahasa Asing Anda di Tahun 2026

Timnas Indonesia U19 Incar Tiket Piala Asia U20 2027, Nova Arianto Pasang Target Juara Grup di Kualifikasi

Terkini

Gempa M 4 Guncang Sumba Barat Pagi Ini, Getaran Terasa Kuat di Waikabubak dan Sumba Barat Daya

Gubernur NTT Luncurkan NTT Mart dan Gerakan Jam Belajar di Waibakul untuk Perkuat Karakter Siswa

Kapolda NTT Irjen Rudy Darmoko Lantik Brigjen Faizal sebagai Wakapolda Baru, Ini Tugas yang Diemban

Menteri Keuangan Israel Cabut Sepihak Wewenang Palestina atas Masjid Ibrahimi di Hebron

Cuaca NTT Hari Ini, 17 Juni 2026: Cerah Merata di 6 Wilayah, Suhu Capai 32°C — Waspada Panas Ekstrem di Manggarai