Google Arama Büyük Spam Saldırısı Altında Kaldı
Google’ın arama sonuçları, son birkaç gündür tamamen kontrolden çıkmış olarak tanımlanabilecek bir spam saldırısına maruz kaldı. Birçok alanın her biri yüzbinlerce anahtar kelime için sıralamada yer alıyor; bu, bu saldırının ölçeğinin milyonlarca anahtar kelime öbeğine kolayca ulaşabileceğinin bir göstergesi.
Şaşırtıcı bir şekilde, alan adlarının çoğu yalnızca son 24-48 saat içinde kaydedilmiştir.
Bu yakın zamanda Bill Hartzer’in bir dizi gönderisinde dikkatimi çekti (LinkedIn profili) burada Majestic geri bağlantı aracı tarafından oluşturulan ve birçok spam sitesinin bağlantı ağlarını açığa çıkaran bağlantı grafiğini yayınladı.
Gönderdiği bağlantı grafiği, spam içerikli bağlantı ağları için oldukça tipik bir model olan, birbirleriyle sıkı bir şekilde birbirine bağlanan çok sayıda web sitesini gösteriyordu.
Sıkıca Birbirine Bağlı Ağın Ekran Görüntüsü
Bill ve ben Facebook messenger üzerinden spam siteleri hakkında konuştuk ve her ne kadar spam gönderenler bir geri bağlantı ağı oluşturmak için çok çaba sarf etseler de, bağlantıların aslında yüksek sıralamalardan sorumlu olmadığı konusunda hemfikirdik.
Bill şunları söyledi:
“Bence bu kısmen, bağlantılardan ziyade içeriğe daha fazla önem veren Google’ın hatası.”
Google’ın bağlantılardan çok içeriğe önem verdiğine %100 katılıyorum. Ancak benim düşüncem, spam bağlantılarının, Googlebot’un yalnızca bir veya iki gün için bile olsa spam sayfaları keşfedip dizine ekleyebilmesi için orada olduğu yönünde.
Spam sayfaları dizine eklendikten sonra muhtemelen Google’ın algoritmalarındaki iki boşluk olarak gördüğüm şeyden yararlanıyor, bundan sonra bahsedeceğim.
Google SERP’lerde Kontrol Dışı Spam
Birden fazla site, sıralaması kolay olan uzun kuyruklu ifadelerin yanı sıra, sıralaması da kolay olan yerel arama bileşenine sahip kelime öbekleri için sıralama yapıyor.
Uzun kuyruklu ifadeler, insanlar tarafından kullanılan ancak son derece nadiren kullanılan anahtar kelime öbekleridir. Uzun kuyruk neredeyse yirmi yıldır ortalıkta dolaşan bir kavramdır ve daha sonra 2006’da yayınlanan Uzun Kuyruk: İş Dünyasının Geleceği Neden Daha Azını Daha Çok Satıyor adlı kitapla popüler hale getirilmiştir.
Spam gönderenler bu nadiren aranan ifadeler için sıralama yapabilirler çünkü bu ifadeler için çok az rekabet vardır ve bu da sıralamayı kolaylaştırır.
Dolayısıyla, eğer bir spam gönderen milyonlarca sayfalık uzun kuyruklu ifadeler oluşturursa, bu sayfalar kısa bir süre içinde her gün yüzbinlerce anahtar kelime için sıralamaya girebilir.
Amazon gibi şirketler, günde yüz binlerce ayrı ürünü satmak için uzun kuyruk ilkesini kullanıyor; bu, bir ürünü günde yüz binlerce kez satmaktan farklı.
Spam gönderenlerin istismar ettiği şey de budur; uzun kuyruklu ifadeler için sıralama kolaylığı.
Spam gönderenlerin yararlandığı ikinci şey, Yerel Aramanın doğasında olan boşluktur.
Yerel arama algoritması, yerel olmayan anahtar kelimeleri sıralamaya yönelik algoritmayla aynı değildir.
Gün ışığına çıkan örnekler Craigslist’in ve ilgili anahtar kelimelerin varyasyonlarıdır.
Örnekler şöyle ifadelerdir: Craigslist otomobil parçaları, Craigslist’te kiralık odalar, Sahibinden satılık Craigslist ve çoğu Craigslist kelimesini kullanmayan binlerce başka anahtar kelime.
Spam’ın boyutu çok büyüktür ve içinde “Craigslist” kelimesi bulunan anahtar kelimelerin çok ötesine geçer.
Spam Sayfası Nasıl Görünüyor?
Sayfaları tarayıcı ile ziyaret ederek spam sayfasının nasıl göründüğüne bakmak imkansızdır.
Google’da sıralanan sitelerin kaynak kodlarını görmeye çalıştım ancak spam sitelerin tamamı otomatik olarak başka bir alana yönlendiriyor.
Daha sonra web sitesini ziyaret etmek için W3C bağlantı denetleyicisine spam URL’sini girdim ancak W3C botu da siteyi göremedi.
Bu yüzden tarayıcı kullanıcı aracımı kendisini Googlebot olarak tanımlayacak şekilde değiştirdim ancak spam sitesi beni yine de yönlendirdi.
Bu, sitenin kullanıcı aracısının Googlebot olup olmadığını kontrol etmediğini gösteriyordu.
Spam sitesi Googlebot IP adreslerini kontrol ediyordu. Ziyaretçinin IP adresi Google’a ait olarak eşleşirse, spam sayfası içeriği Googlebot’a gösteriyordu.
Diğer tüm ziyaretçiler yarım yamalak içerik görüntüleyen diğer alanlara yönlendirme aldı.
Web sitesinin HTML’sini görebilmek için bir Google IP adresiyle ziyaret etmem gerekiyordu. Bu yüzden spam sitesini ziyaret etmek ve sayfanın HTML’sini kaydetmek için Google’ın Zengin Sonuçlar test aracını kullandım.
Bill Hartzer’a Zengin Sonuçlar test aracını kullanarak HTML’yi nasıl çıkaracağını gösterdim ve o da hemen bu konuda tweet atmaya başladı, haha. Lanet olsun!
Zengin Sonuçlar Test Aracı’nın bir web sayfasının HTML’sini gösterme seçeneği vardır. Böylece HTML’yi kopyaladım, bir metin dosyasına yapıştırdım ve ardından bir HTML dosyası olarak kaydettim.
Zengin Sonuçlar Aracı Tarafından Sağlanan HTML’nin Ekran Görüntüsü
Daha sonra herhangi bir JavaScript’i kaldırmak için HTML dosyasını düzenledim ve ardından dosyayı tekrar kaydettim.
Artık web sayfasının Google’a nasıl göründüğünü görebildim:
Spam Web Sayfasının Ekran Görüntüsü
Tek Alan Adı 300.000+ Anahtar Kelimede Sıralanıyor
Bill bana, spam sitelerinden yalnızca birinin sıraladığı anahtar kelime öbeklerinin listesini içeren bir elektronik tablo gönderdi. Bir spam sitesi, bunlardan sadece biri, 300.000’den fazla anahtar kelime öbeğine göre sıralandı.
Bir Alan Adına İlişkin Anahtar Kelimeleri Gösteren Ekran Görüntüsü
Çok sayıda Craigslist anahtar kelime öbeği vardı, ancak birçoğu yerel arama öğesi içeren başka uzun kuyruklu ifadeler de vardı. Bahsettiğim gibi, uzun kuyruklu ifadeler için sıralama yapmak, yerel arama ifadeleri için sıralama yapmak ve iki tür kelime öbeğini birleştirmek kolaydır ve bu anahtar kelime öbekleri için sıralama yapmak gerçekten kolaydır.
Bu Spam Tekniği Neden Çalışıyor?
Yerel arama, yerel olmayan algoritmadan farklı bir algoritma kullanır. Örneğin, yerel bir sitenin genel olarak bir sorguda sıralamaya girmesi için çok fazla bağlantıya ihtiyacı yoktur. Sayfaların, yerel bir arama algoritmasını tetiklemek ve onu bir coğrafi alan için sıralamak için doğru türde anahtar kelimelere ihtiyacı vardır.
Dolayısıyla, “Craigslist otomobil parçaları” diye arama yaparsanız, bu yerel arama algoritmasını tetikleyecektir ve uzun kuyruklu olduğu için onu sıralamak çok fazla zaman almayacaktır.
Bu uzun yıllardır devam eden bir sorundur. Birkaç yıl önce bir web sitesi, eski Latin Latince içerik ve İngilizce başlıklar içeren bir siteyle “Rhinoplasty Plano, Texas” sıralamasında yer alabildi. Rinoplasti uzun vadeli bir yerel araştırmadır ve Plano, Teksas nispeten küçük bir kasabadır. Bu Rinoplasti anahtar kelime öbeğinin sıralaması o kadar kolaydı ki, Latince dilindeki web sitesi bu kelimeyi kolayca sıralamayı başardı.
Danny Sullivan’ın bir tweet’inde de belirtildiği gibi, Google bu spam sorununu en az 19 Aralık’tan beri biliyordu.
Evet, bunu zaten arama ekibine ilettim. İşte bir bakış. Ve bakılıyor. pic.twitter.com/vJH3EisnXD
— Google SearchLiaison (@searchliaison) 19 Aralık 2023
Bunca zamandan sonra Google’ın nihayet bu tür spam’larla mücadele etmenin bir yolunu bulup bulamayacağını görmek ilginç olacak.
Öne Çıkan Görsel: Shutterstock/Kateryna Onyshchuk