
Image by Marco Verch, from Ccnull
AI Labirenti: Cloudflare’ın Yeni Aracı, Sahte Web Sayfaları ile AI Tarayıcılarını Kandırıyor
Cloudflare, izinsiz olarak sitelerden veri çeken AI destekli web kazıyıcılarına karşı tasarlanmış bir araç olan “AI Labirenti”ni duyurdu.
Acele mi ediyorsunuz? İşte hızlıca öğrenmeniz gerekenler:
- Araç, kazıyıcıların zamanını boşa harcamak için gerçekçi ama işe yaramaz AI oluşturulan içerik üretir.
- AI Labirenti, Anthropic ve Perplexity AI dahil olmak üzere robots.txt’yi görmezden gelen botları hedefler.
- Bir sonraki nesil bal tuzağı olarak işlev görür, yetkisiz tarayıcıları tespit eder ve parmak izlerini alır.
AI Labirenti, bu botları doğrudan engellemek yerine onları AI tarafından oluşturulan sonsuz bir sayfa labirentine yönlendirir ve bu sayede zamanlarını ve hesaplama güçlerini boşa harcar.
“Yetkisiz taramaları tespit ettiğimizde, isteği engelleme yerine, bir tarayıcının onları geçmeye teşvik edecek kadar ikna edici olan bir dizi AI tarafından oluşturulmuş sayfalara bağlantı vereceğiz,” diye açıkladı Cloudflare, blog yazısında.
“Ancak gerçek görünümlü bu içerik, korumakta olduğumuz site içeriği değildir, bu yüzden tarayıcı zaman ve kaynakları boşa harcar,” diye ekledi Cloudflare.
ArsTechnica, AI scraperların bir sorun olduğunu belirtiyor çünkü genellikle izinsiz bir şekilde web sitelerinden büyük miktarda veri toplayarak AI modellerini eğitirler. Bu, birkaç sorun yaratır: Fikri mülkiyet haklarını ihlal edebilir, web sitesi sahiplerinin erişimi düzenlemek için kullandığı kontrolleri atlayabilir.
Ayrıca, scraping, hassas veya özel verilerin yanlış kullanımına yol açabilir. Scraping’in hacmi dramatik bir şekilde artmıştır, Cloudflare günlük 50 milyarın üzerinde crawler isteği bildirmektedir.
Bu büyük ölçekli veri çekme işlemi, web sitesi kaynaklarını tüketirken site performansını ve gizliliğini etkiliyor ve AI geliştirmedeki veri sömürüsü konusundaki artan endişelere katkıda bulunuyor.
Web sitesi sahipleri geleneksel olarak, botlara neye erişebilecekleri ve neye erişemeyecekleri konusunda bilgi vermek için robots.txt dosyasına güvenirken, birçok AI şirketi – Anthropic ve Perplexity AI gibi büyük oyuncular dahil – bu yönlendirmeleri görmezden gelmekle suçlandılar, The Verge tarafından bildirildiği gibi.
Cloudflare’ın AI Labirenti, bu istenmeyen botlarla başa çıkmak için daha agresif bir yaklaşım sunar. Bu araç, botları gerçek görünen fakat sonuç olarak AI eğitimi için işe yaramayan yapay bir içerik ağına çeken “sonraki nesil honeypot” olarak işlev görür.
Geleneksel honeypotlardan farklı olarak, botların tanımaya öğrendiği, AI Labirenti, Cloudflare’ın Workers AI platformunu kullanarak gerçekçi görünen ancak ilgisiz bilgiler oluşturur.
“Gerçek bir insan, AI tarafından üretilen saçmalıkların labirentinde dört bağlantıya kadar gitmez,” diye belirtti Cloudflare. “Bunu yapan her ziyaretçinin bir bot olması çok muhtemel, bu da bize kötü botları tanımlamak ve parmak izi almak için yepyeni bir araç sunuyor.”
AI tarafından üretilen içerik, bilimsel olarak doğru olacak şekilde tasarlanmıştır ancak korunan asıl web sitesiyle ilgisizdir.
Bu, aracın yanıltıcı bilgilere katkıda bulunmamasını sağlarken hala AI kazıyıcıları karıştırır. Yanıltıcı sayfalar, insan ziyaretçilere görünmez ve arama motoru sıralamalarını etkilemez.
AI Labirent, tüm Cloudflare kullanıcıları için ücretsiz, seçmeli bir özellik olarak mevcuttur. Web site yöneticileri, Bot Yönetimi ayarları altında Cloudflare gösterge panelinden etkinleştirebilir.
Şirket, bunu sadece AI destekli önlemlerin başlangıcı olarak tanımlıyor ve sahte sayfaları daha da aldatıcı hale getirmeyi planlıyor.
Web siteleri ve AI toplayıcıları arasındaki kedi-fare oyunu devam ediyor, Cloudflare ise online içeriği koruma konusunda yenilikçi bir yaklaşım sergiliyor. Ancak, AI şirketlerinin bu tuzaklara ne kadar hızlı uyum sağlayacağı ve bu stratejinin web verileri üzerindeki savaşta bir tırmanışa yol açıp açmayacağı konusunda sorular hala devam ediyor.
Yorum bırakın
Vazgeç