Spam SEO i ogrywanie konkurencji - ciemna strona content marketingu AI
Maciej Lesiak
- 6 minut czytania - 1085 słówSpis treści
Spam SEO ewoluował. Z prymitywnych technik link farmingu przeszedł do wyrafinowanych metod wykorzystujących LLM w masowych kampaniach dezinformacyjnych i manipulacji algorytmami. Zanim zagłębię się w techniczne szczegóły tych praktyk w kolejnym artykule, przyjrzyjmy się bliżej branży, która balansuje na granicy między marketingiem a spamem. Dzisiaj znam tę branżę black hat seo raczej z napraw po włamaniach na serwery, czyszczeniu reputacji, naprawach po seo magikach… Natomiast znam bardzo dobrze metody pracy, powody używania i mechanizmy działania rozwiązań.
Złudliwa rewolucja w content marketingu
Dzisiaj każdy właściciel firmy czy osoba zamawiająca treści na stronę myśli, że złapała boga za nogi, bo oto ma możliwość wygenerowania w kilka sekund nieskończonej liczby tekstów na każdy temat i to tekstów wydawałoby się poprawnych stylistycznie czy ładnie napisanych. No, nie da się ukryć, że modele LLM zwane potocznie jako AI potrafią generować statystycznie piękne i niepowtarzalne teksty, co w przypadku content marketingu stanowiło problem.
ChatGPT zastępuje człowieka - ależ oszczędności!
Dobrego Copywritera znającego niuanse rynku i potrafiącego pisać teksty zgodne z wytycznymi SEO czy marketingu ciężko było znaleźć. Pytanie tylko, czy ChatGPT potrafi zastąpić takiego copywritera? Pytanie także o długoterminowe koszty związane np. ze zmianą algorytmu. Przyjrzyjmy się jak wygląda taki tekst.
Typowy proces generowania treści przez AI
Pozornie stworzenie dobrego tekstu jest proste. Typowo robi się to tak, że osoby wklejają ofertę ze swojej albo ze strony konkurencji, tworzą kontekst w postaci opisu co chcą uzyskać, a następnie do skutku poprawiając generują kolejne teksty. Potrafi to robić nawet osoba ze średnim przygotowaniem merytorycznym.
Charakterystyczne wzorce tekstów AI
Problem w tym, że te teksty mają pattern AI, który nie tyle łatwo jest wykryć, co jest on pozbawiony charakteru i osobowości. Oto najczęstsze wzorce wskazujące na tekst generowany przez AI:
1. Struktura językowa:
- Przesadnie uporządkowana struktura akapitów
- Powtarzające się frazy przejściowe (“ponadto”, “należy zauważyć”, “warto podkreślić”)
- Zbyt formalne zwroty w nieformalnym kontekście
- Przewidywalne konstrukcje zdań
- Pewne elementy interpunkcji czy nawet typografii
2. Styl i ton:
- Nadmierna neutralność emocjonalna
- Brak osobistych doświadczeń i anegdot
- Zbyt idealne przejścia między akapitami
- Sztywne trzymanie się jednego poziomu formalności (rzekoma modyfikacja stylu jest pozorna)
3. Treść:
- Powierzchowne pokrycie wielu aspektów bez głębszej analizy
- Generyczne przykłady bez specyficznych detali
- Brak kontrowersyjnych opinii
- Nadmierne wykorzystanie statystycznych faktów
Naukowe potwierdzenie problemu
Niedawne badanie “Is Google Getting Worse? A Longitudinal Investigation of SEO Spam in Search Engines” przeprowadzone przez naukowców z niemieckich uniwersytetów (Leipzig University, Bauhaus-Universität Weimar i ScaDS.AI) dostarcza twardych dowodów na problem, który opisuję. Roczna analiza empiryczna pokazuje wyraźne wzorce w wynikach wyszukiwania:
1. Pattern sztucznej treści:
- Malejący współczynnik oryginalności treści (Review-Non-review Ratio, R² = .97) - im wyższa pozycja w wynikach wyszukiwania, tym mniej oryginalnych recenzji/opinii a więcej standardowego, generycznego tekstu. Silna korelacja (0.97) pokazuje, że to nie przypadek.
- Spadek złożoności języka (Function Word Ratio, R² = .97) - spadek użycia słów funkcyjnych (przyimki, spójniki, etc.) świadczy o uproszczeniu języka; tekst staje się bardziej “mechaniczny”.
- Obniżający się poziom trudności tekstu (Flesch Grade, R² = .96) - standardowy test czytelności tekstu; malejący wynik oznacza, że teksty na wyższych pozycjach są prostsze i bardziej podstawowe.
2. Wzorce manipulacji SEO:
- Rosnące dopasowanie nagłówków do słów kluczowych (Heading-Keyword Overlap, R² = .96) - im wyższa pozycja, tym więcej słów kluczowych w nagłówkach - klasyczna technika SEO.
- Malejąca liczba słów w głównej treści - Mniej słów w treści głównej ale więcej powtórzeń - wskazuje na optymalizację pod konkretne frazy zamiast tworzenia wartościowej treści.
- Zwiększona powtarzalność tych samych fraz i słów - Wzorzec powtarzania tych samych słów i fraz - typowa nadoptymalizacja pod SEO.
3. Skuteczność spamu:
- Wysoka liczba linków afiliacyjnych na najwyższych pozycjach - Strony z większą liczbą linków afiliacyjnych są wyżej w wynikach.
- Spójne wzorce optymalizacji (większość współczynników R² powyżej 0.90) - Wysokie R² (>0.90) oznacza, że te wzorce są bardzo spójne i nieprzypadkowe.
- Wyraźna korelacja między pozycją a poziomem “zoptymalizowania” treści - Im bardziej strona jest “zoptymalizowana” (czyli sztuczna), tym wyższą ma pozycję.
Badanie to potwierdza, że opisywany przeze mnie problem nie jest tylko teoretyczny - mamy empiryczne dowody na to, jak skutecznie spam SEO infiltruje wyniki wyszukiwania. Co więcej, wykryte wzorce odpowiadają dokładnie tym cechom, które wymieniałem jako charakterystyczne dla treści generowanych przez AI. Możemy więc spodziewać się, że masowe wykorzystanie AI do generowania treści tylko pogłębi ten problem. Otwiera to wbrew pozorom drogę dla etycznych i długoterminowych strategii…
Przyszłość wyszukiwania i content marketingu
Mam zatem informację dla wszystkich, którzy złapali boga za nogi i zoptymalizowali koszty. Już powoli wchodzi model assisted search z AI i wasze strony będą analizowane przez LLM i nie będą się odróżniały od waszej konkurencji, która generowała dokładnie tak samo bezpłciowe, idealnie bajkopisarskie teksty. Co wtedy zrobicie, jakiego prompta dacie i jak zmodyfikujecie własne strony, które od jakiegoś czasu notorycznie obniżają swoją reputację poprzez seo spam?
Alternatywy dla AI generated content - można to robić lepiej
Co zatem robić i jak żyć możnaby zacytować klasyka… Otóż istnieją skuteczne alternatywy dla masowego generowania treści przez AI. Pierwsza z nich to model hybrydowy, gdzie AI służy jako asystent do researchu i wstępnego szkicu, ale główną narrację i ton nadaje człowiek. Druga opcja to content curation plus - zbieranie i analizowanie istniejących treści z branży z dodaniem unikalnej, eksperckiej perspektywy. Można też postawić na dokumentację realnych doświadczeń, opisując faktyczne przypadki z życia firmy i dzieląc się procesem podejmowania decyzji. Ciekawym podejściem jest także tworzenie mniejszej ilości, ale bardziej pogłębionych treści (depth-first content), gdzie fokus jest na jakości i regularnych aktualizacjach treści. Oczywiście nie ma róży bez kolców, jeśli nie chcecie się napracować, to nie będzie efektu, ponieważ te alternatywy wymagają więcej pracy niż masowe generowanie przez AI, ale dają lepsze długoterminowe rezultaty i - co najważniejsze - budują rzeczywistą wartość dla czytelników, a nie tylko wypełniają miejsce na stronie. Warto też rozważyć wykorzystanie moderowanego user-generated content, gdzie treści tworzone przez społeczność są profesjonalnie edytowane i wzbogacane o ekspercki komentarz - ten jednak element jest coraz bardziej kontrowersyjny z prostego powodu, ludzie masowo używają AI do generowania tekstów i twórczość nie sprawia im przyjemności.
Nadchodząca deprecjacja AI-generated content
Stawiam tezę, że niedługim czasie, aby odróżnić ten cały spam od wartościowych rzeczy algorytmy zostaną tak zmodyfikowane, aby deprecjonować wartość takich stron. Wtedy pojawi się problem. Jakiego boga za nogi trzeba będzie złapać, żeby pojawić się w upragnionym wyniku wyszukiwania, który będzie jeszcze semantycznie zmanipulowany przez płatne reklamy i model pay2win?
To pytanie retoryczne z którym zostawiam wszystkich “speców” od marketingu i wróżbitów, którzy wiedzą jakie będą prawdziwe modele algorytmu za pół roku. Dla mnie obecne spamowanie treścią generowaną przez ChatGPT jest na poziomie metod black hat seo.
Źródło
Is Google Getting Worse? A Longitudinal Investigation of SEO Spam in Search Engines
Powiązane tematy
- SEO Spam and Competition Gaming - The Dark Side of AI Content Marketing
- AI in Service of Conspiracy Theories and Paranoid Thinking
- AI w służbie teorii spiskowych i paranoicznego myślenia
- Between Innovation and Disinformation - An Analysis of the Market for Books Generated by Artificial Intelligence
- Między innowacją a dezinformacją – analiza rynku książek generowanych przez sztuczną inteligencję
- TECH: How AI is Changing the Face of Polish Digital Media in 2024
- TECH: Jak SI zmienia oblicze polskich mediów cyfrowych w 2024 roku
- AI series: A scenario of how AI can take over recommendation systems, generating and reinforcing conspiracy theories and disinformation
- Seria AI: scenariusz jak SI może przejmować systemy rekomendacyjne, generując i wzmacniając teorie spiskowe oraz dezinformację
- AI Series: The maieutic method – enhancing AI with prompts
- Seria AI: Metoda majeutyczna - doskonalenie AI promptami
- AI Series: The final warning – AI's Self-Reflection on Its own development
- Seria AI: Ostateczne ostrzeżenie Sztucznej Inteligencji przed własnym rozwojem