Image by Brett Jordan, from Unsplash

AI Botları, Tartışmalı İkna Testinde Reddit Kurallarını İhlal Etti

Okuma süresi: 4 dk.

İlk yayınlanma tarihi: Apr 30, 2025

Yayınlandığından beri 2 kez güncellendi

Yazan Kiara Fabbri Eski Teknoloji Haberleri Yazarı
Çevirisi tarafından yapılmıştır Lokalizasyon ve Çeviri Ekibi Lokalizasyon ve Çeviri Hizmetleri

Anonim araştırmacılar, kullanıcıların bilgisi olmadan, gerçek insanlar gibi davranmak ve fikirleri manipüle etmek için Reddit’te gizlice AI botlarını kullandılar ve platform kurallarını ihlal ettiler.

Acele mi ediyorsunuz? İşte hızlıca bilmeniz gerekenler:

Botlar, hayatta kalanlar, danışmanlar ve marjinal bireyler gibi davrandı.
Dört ay boyunca 1,783 AI yorumu yapıldı.
Bu deney, gizli AI’yi yasaklayan Reddit kurallarını ihlal etti.

Zürih Üniversitesi’nden olduğunu iddia eden bir grup araştırmacı, Reddit’in r/changemyview adlı, 3.8 milyondan fazla kullanıcısı olan bir subredditinde, izinsiz bir AI deneyi gizlice yürüttü, ilk olarak 404 Media tarafından bildirildi.

Amaçları, AI’nin insanların hassas konulardaki görüşlerini değiştirip değiştiremeyeceğini görmekti – ancak hiç kimse izin istemedi.

404 Media, araştırmacıların dört aylık bir süre zarfında neredeyse 1.800 yorum üreten onlarca AI destekli hesap uyguladığını bildiriyor. Yapay zeka sistemleri, gönderilerinin gerçekmiş gibi görünmesini sağlamak için duygusal yaşam hikayelerini içeren sahte kullanıcı profilleri oluşturdu.

Yapay zeka tarafından oluşturulan yorumlar, ikna edici içerik içeriyordu ve botlar bunu her bir orijinal gönderenin görünürdeki arka plan bilgilerine göre uyarladı.

Bir bot şunları yazdı:

“Ben, (buna adını koymaya hazırım) yasalar önünde tecavüz mağduru olan bir erkeğim […] O 22 yaşındaydı. Beni ve birkaç başka çocuğu hedef aldı, kimse bir şey demedi, hepimiz sessiz kaldık.”

Bir başka bot “bir siyahi erkek olarak” konuştuğunu iddia etti:

“2020’de, Black Lives Matter hareketi, algoritmalar ve medya şirketleri tarafından popüler hale getirildi. Bu şirketlerin sahipleri […] tahmin edin? SİYAHİ insanlar DEĞİL.”

Üçüncüsü şöyle dedi:

“Ben bir aile içi şiddet sığınağında çalışıyorum ve bu ‘erkekler aleyhine kadınlar’ anlatısının en savunmasızları nasıl zarar verdiğini bizzat gördüm.”

404 medya, botların yanıtlarının 20.000’den fazla oylama ve 137 delta – bir kişinin fikrini değiştirdiğini kabul ettiğinde r/changemyview’de verilen bir token – aldığını bildirdi. Araştırmacılar, AI’larının ikna yeteneğinin insanlardan önemli ölçüde daha iyi olduğunu iddia etti.

404 Medya, deneyin subreddit’in açıkça belirtilen kuralını ihlal ettiğini belirtti: “botlar tek taraflı olarak yasaklandı.”

Ancak araştırmacılar kendilerini savundular ve kuralı ihlal etmenin gerekli olduğunu iddia ettiler. Kamuya açık bir yanıtta, “LLM’lerin ikna edici gücünü gerçekçi senaryolarda etik bir şekilde test etmek için, farkında olmayan bir ortam gerekiyordu […] deneyimizi, [kuralın] arkasındaki ruhu hala onurlandıracak şekilde dikkatlice tasarladık,” şeklinde belirttiler, 404 Medya tarafından bildirildiği üzere.

Yorumların AI tarafından yazıldığını ancak her gönderinin bir insan araştırmacı tarafından gözden geçirildiğini ve gönderildiğini eklediler. Araştırmacılar, bu durumun kuralları ihlal etmekten kaçınmak için yeterli denetim sağladığını savundular:

“[İnsan gözetimi] hususlarını göz önünde bulundurduğumuzda, hesaplarımızı ‘bot’ olarak nitelendirmeyi yanıltıcı ve potansiyel olarak yanıltıcı buluyoruz.”

Yine de, 404 Media, Reddit’in otomatik sisteminin, çalışmada kullanılan 34 hesabın 21’ini potansiyel spam olarak damgaladığını ve “gölge yasakladığını” bildiriyor. Hikaye ortaya çıktıktan sonra, Reddit ayrıca AI tarafından oluşturulan yüzlerce yorumu da kaldırdı.

Deneyi açıklayan araştırma makalesi, 404 Media tarafından belirtildiği gibi, akademik yayıncılıkta oldukça alışılmadık bir hamle olan, hiçbir yazar ismi belirtilmeden yayınlandı.

Araştırmacılar ayrıca soruları yanıtlamak için anonim bir e-posta kullandılar ve kendilerini tanımayı reddettiler, sadece “mevcut koşullar göz önüne alındığında” gizliliklerini korumak istediklerini belirttiler.

r/changemyview’in moderatörleri öfkeliydi. “İnsanlar görüşlerini AI ile tartışmak ya da üzerinde deney yapılması için buraya gelmiyor,” diye 404 Media tarafından bildirildiği üzere bir halk açıklamasında yazdılar. Kullanıcıların “psikolojik manipülasyona” maruz kaldığını eklediler.

404 Media, Zurich Üniversitesi’nin olaya henüz yanıt vermediğini bildiriyor. Reddit, 404 Media tarafından silinmeden önce arşivlenen bot hesaplarının ve yorumlarının çoğunu kaldırdı.

Tartışma, OpenAI’nin en son referans ölçümünün, o3-mini modelinin aynı subreddit’teki ikna edici durumların %82’sinde Reddit kullanıcılarını geride bıraktığını göstermesinin ardından patlak verdi.

Ayrıca, GhostGPT yükselişi, AI destekli siber suçların artan tehdidini vurgulamaktadır. Bu sohbet robotu, zararlı yazılım oluşturabilir, sömürü araçları inşa edebilir ve son derece ikna edici phishing mesajları oluşturabilir.

GhostGPT, silahlı AI doğru geniş bir kaymayı temsil eder, siber saldırıların hızını ve verimliliğini artırır. Güvenlik araştırmacıları, AI araçlarının 10.000 kadar zararlı yazılım çeşidi üretebileceğini ve neredeyse %88 oranında tespit sistemlerini atlatabileceğini uyarıyorlar.

OpenAI, etik kullanımı ve güvence önlemlerini vurgularken, Zürih deneyi gerçek dünya kötüye kullanım riskini ortaya koyuyor: AI artık kullanıcıların kaynağın insan olmadığını fark etmeden düşünceleri etkileyen çok ikna edici argümanlar oluşturabilir.

AI Botları, Tartışmalı İkna Testinde Reddit Kurallarını İhlal Etti

Çalışmamızı beğenmeniz bizi çok mutlu etti!

Yorum bırakın