
Image by Oberon Copeland, from Unsplash
AI Botları, Wikipedia’nın Sunucularını Aşırı Yüklüyor
Wikimedia Vakfı, otomatik botların yapay zeka modellerini eğitmek için veri çaldığına dair artan baskı sebebiyle alarm vermiştir.
Acele mi ediyorsunuz? İşte hızlıca bilgilenmeniz için ana noktalar:
- AI botları, Wikimedia içeriğini rekor seviyelerde tarıyor.
- Botlar, multimedya bant genişliği kullanımında %50’lik bir artışa neden oldu.
- Yüksek maliyetli trafik şimdi %65 oranında crawlerlardan geliyor.
Vakıf, yakın zamanda bir yazıda makine tarafından oluşturulan trafiğin önceden görülmemiş bir hızda artmaya devam ettiğini, bu trafiğin sadece küçük bir kısmını insanların oluşturduğunu bildirdi.
“Ocak 2024’ten bu yana, multimedya içeriklerini indirmek için kullanılan bant genişliğinde %50’lik bir artış gördük,” diye belirtiyor gönderi.
“Bu artış, insan okuyuculardan değil, büyük ölçüde açık lisanslı görsellerin bulunduğu Wikimedia Commons resim kataloğunu tarayarak AI modellerine görsel besleyen otomatik programlardan geliyor,” diye ekledi gönderi.
Crawler olarak bilinen botlar, Wikimedia’nın projelerinden -Wikipedia ve Wikimedia Commons dahil- büyük miktarda veriyi, uygun kredi veya resmi erişim araçları olmadan çalmaktadır. Bu süreç, yeni kullanıcıların Wikimedia’yı keşfetmesini zorlaştırır ve teknik sistemlerine aşırı yük bindirir.
Örneğin, bir gönderi, Jimmy Carter’ın Wikipedia sayfasının, Aralık 2024’te vefat ettiği gün 2.8 milyondan fazla görüntülendiğini belirtiyor. 1980 tartışma videosu, web sitesi trafiğinde önemli bir artışa neden oldu. 1980 tartışmasının videosu da trafiği artırdı. Wikimedia bununla başa çıktı – ancak sadece zar zor. Mühendislere göre asıl sorun, sürekli bot trafiğidir.
“En pahalı trafiğimizin %65’i botlardan geliyor,” diye yazdı Foundation. Botlar, özellikle daha az popüler sayfaları “topluca okuyor”, bu da Wikimedia’nın ana veri merkezlerine pahalı talepleri tetikliyor.
Wikimedia’nın içeriği kullanmak ücretsiz olmasına rağmen, sunucuları öyle değil. “İçeriğimiz ücretsiz, altyapımız değil,” dedi Foundation. Ekip, geliştiricileri tüm siteyi kazıma yerine API’yi kullanmaya teşvik ederek “altyapının sorumlu kullanımını” teşvik etmek için yöntemler geliştirmeye devam ediyor.
Bu sorun, Wikimedia’yı ve sayısız diğer web sitesini ve yayıncıları etkiliyor. Ancak dünyanın en büyük açık bilgi platformu için, milyonlarca kişinin güvendiği hizmetlerin istikrarını tehdit ediyor.
Yorum bırakın
Vazgeç