À l’intérieur du premier « braquage SEO » de l’ère de l’IA

À l’intérieur du premier « braquage SEO » de l’ère de l’IA
  • Au cours de la dernière année, le site Web Exceljet a été victime d’un « braquage SEO » alimenté par l’IA.
  • Un spécialiste du marketing en ligne provocateur a utilisé l’IA pour cloner des milliers d’articles d’Exceljet pour un concurrent.
  • L’intrigue montre comment l’IA générative transforme le Web et pose des questions épineuses à Google.

La circulation était bloquée et David Bruns ne comprenait pas pourquoi.

Exceljet, son site Web permettant de naviguer dans Microsoft Excel, connaît un succès depuis 2012, devenant rapidement un emploi lucratif à temps plein pour le résident de l’Utah.

Cependant, fin 2022, les visites chez Exceljet ont commencé à diminuer, puis ont continué à diminuer. Le site s’appuie fortement sur le trafic de recherche Google, et comme le géant de la technologie met régulièrement à jour son classement des sites Web, Bruns se demandait s’il n’était pas tombé en disgrâce de l’entreprise. Il s’était également lancé dans une reconstruction technique ; peut-être que ça avait quelque chose à voir avec ça ?

Puis, à l’automne 2023, un ami lui a signalé une publication sur les réseaux sociaux, et tout cela avait du sens. Bruns a été victime d’un « braquage SEO », l’un des premiers de la nouvelle ère de l’IA générative. Il s’agissait d’un complot audacieux visant à copier son site Web et à siphonner le trafic de référencement Google durement gagné à l’aide de nouveaux outils d’IA puissants.

Le braquage faisait partie d’une campagne extrêmement réussie qui a multiplié par 60 le trafic vers le client de l’auteur, alors même que les visites en ligne d’Exceljet ont diminué de moitié.

« C’est une chose d’être devancé par un article qui est sans doute meilleur que l’article que vous avez écrit, mais c’en est une autre d’être devancé par un article écrit par une machine qu’aucun humain n’a jamais examiné », a déclaré Bruns à Trading Insider. « C’est tout simplement une erreur de gagner de l’argent avec ça. »

Les difficultés d’Exceljet soulèvent de grandes questions sur l’avenir d’Internet. Le contenu sur n’importe quel sujet peut désormais être généré en appuyant simplement sur un bouton, et il est pratiquement impossible de faire la différence entre ce contenu synthétique et ce qu’un humain pourrait produire sur le même sujet. Cela bouleverse rapidement les règles existantes du Web – et constitue un défi particulièrement épineux pour Google.

« Les méthodes habituelles de signalement de ce qui est vrai ne sont plus claires, et les sources fiables comme les recherches Google ne donnent plus les bons résultats », a déclaré Ethan Mollick, professeur agrégé à Wharton qui étudie l’impact de l’IA. « Nous allons devoir changer fondamentalement notre façon de traiter l’information. Je ne sais tout simplement pas si nous allons le faire aussi vite que nécessaire. »

SEO sous stéroïdes

Le champ de bataille central sur lequel cela se joue est « l’optimisation des moteurs de recherche ». Les professionnels du référencement aident les sites Web à améliorer leur classement dans les résultats de recherche, en utilisant des tactiques allant de l’analyse officielle des tendances de Google à bien plus encore. des camions douteux pour jouer avec le système. L’idée de base est de découvrir ce que les gens recherchent et de fournir un contenu pertinent pour ces requêtes.

Les référenceurs n’ont pas tardé à comprendre le potentiel commercial de l’IA générative lorsque ChatGPT a fait son apparition il y a plus d’un an. Une fois que vous savez quels termes de recherche Google (c’est-à-dire mots-clés) cibler, il n’est plus nécessaire de demander aux humains de rédiger laborieusement un article pertinent. Désormais, les modèles d’IA peuvent résoudre ce problème en quelques secondes, grâce à de nouvelles startups telles que Jasper et SEO.AI.

C’est du référencement sous stéroïdes, et Jake Ward a été plus audacieux que la plupart des acteurs de l’industrie en en tirant parti. Le braquage d’Exceljet est son œuvre alimentée par l’IA. Et il ne s’excuse pas.

Ward affirme que ce qu’il a fait n’est pas différent de celui de tout autre stratège de contenu SEO. L’IA générative vient de rendre les choses beaucoup plus rapides. « Il est inhabituel que quelque chose d’acceptable, s’il est fait une seule fois, devienne soudainement contraire à l’éthique une fois reproduit à grande échelle », a-t-il écrit sur X au début du mois.

« La plupart des sites Web, en particulier les projets à grande échelle, embauchent des rédacteurs bon marché qui ne connaissent rien au sujet sur lequel ils écrivent », a-t-il ajouté. « Ils copient et régurgitent le contenu des premiers résultats de Google. L’IA est plus intelligente que 99 % des personnes qui écrivent ces articles. »

Le braquage d’Exceljet, expliqué

Expatrié du nord de l’Angleterre vivant désormais à Dubaï, Ward et son partenaire commercial ont travaillé pour renforcer la présence de Causal, une startup de logiciels de planification d’entreprise, sur Google, en partie en utilisant l’IA générative pour se nourrir du contenu existant d’Exceljet.

Tout d’abord, ils ont téléchargé le « plan du site » d’Exceljet – essentiellement un répertoire des quelque 1 800 pages du site Web d’Exceljet. Ils ont pris les URL de chaque page et les ont toutes introduites dans des outils de génération de contenu IA. En utilisant ces URL comme guide, les outils ont rapidement craché un flux d’articles sur les mêmes sujets, sans qu’un auteur humain soit requis.

On ne sait pas exactement quand Causal a commencé à publier des articles inspirés d’Exceljet, mais son trafic augmente régulièrement depuis plus d’un an. Ce n’est pas non plus la seule tentative de Causal d’utiliser l’IA pour améliorer son classement : Le partenaire commercial de Ward, Mack Grenfell, a déjà écrit sur l’utilisation de l’IA générative pour travailler avec Causal dès octobre 2021.

Début mai 2022, Causal enregistrait en moyenne moins de 10 000 visites de trafic organique par semaine, selon les estimations de l’outil d’analyse Web Ahrefs. Au début de l’année 2023, ce chiffre atteignait 200 000, et il a culminé en octobre à plus de 600 000 par semaine.

Sur la même période, le trafic d’Exceljet a chuté. Il comptait en moyenne environ 2 millions d’utilisateurs par mois en 2022, a déclaré Bruns. En 2023, ce chiffre était tombé à un peu plus d’un million. (Les modifications apportées à l’algorithme de Google, les modifications apportées au site Web d’Exceljet et d’autres concurrents non améliorés par l’IA peuvent également avoir joué un rôle dans ce déclin.)

Le contrecoup

Le 24 novembre, Ward a publié sur X son ciblage d’Exceljet, affirmant qu’il avait « volé » le trafic d’un concurrent.

Le message est devenu viral et les réactions négatives ont été rapides. George Orosz, ingénieur logiciel de haut niveau et rédacteur de newsletters, a fait valoir que cela représentait une menace importante pour Google.

« Générer des déchets absolus avec l’IA juste pour gagner quelques dollars se produit à un rythme alarmant. D’abord les sites/articles, puis les images et bientôt les vidéos », a écrit Orosz. « La recherche sur Internet comme Google devient de plus en plus inutile, alors même qu’ils tentent de lutter contre tout cela. Les sources fiables deviennent plus précieuses. »

Dans une conversation avec BI, Bruns a fait écho aux critiques d’Orosz. « C’est un gros problème pour Google », a-t-il déclaré. « Si les gens continuent de trouver des articles de mauvaise qualité en haut des résultats de recherche, ils finiront par se demander si Google fait du bon travail, mais le fait que les articles soient proches ou qu’ils puissent être en haut des résultats fait en sorte que Google fait du bon travail. semblent légitimes. »

Encore plus exaspérant pour Bruns : lorsqu’il a examiné les articles Causal générés par l’IA, il a trouvé des erreurs factuelles dans certains articles, dont un décrivant une prétendue fonctionnalité qui n’existe pas dans Excel. Google a même sélectionné ce hurleur d’IA comme « extrait sélectionné » et l’a placé en bonne place en haut des résultats de recherche pertinents, selon Bruns.

« J’ai commencé à examiner la qualité des articles et j’ai réalisé que nous perdions du trafic à cause de choses qui n’ont même pas de sens », a-t-il déclaré.

Lorsqu’il a été contacté par BI, Ward a d’abord déclaré qu’il était ouvert à une entrevue, mais a ensuite refusé de parler officiellement. « Le client en question ne veut plus être exposé à ce que nous avons fait », a-t-il déclaré dans un message vocal.

Causal n’a pas répondu aux multiples demandes de commentaires.

Google répond

Google ne se soucie pas du contenu généré par l’IA. Le géant de la recherche, évalué à 1 670 milliards de dollars, ne pénalisera pas les articles synthétiques dans ses résultats de recherche, à condition qu’il juge le contenu utile aux utilisateurs.

« L’IA peut être un outil utile pour aider les gens dans leurs efforts créatifs, y compris le développement de contenus de qualité », a déclaré la porte-parole de Google, Jennifer Kutz, dans un communiqué. « Mais comme tout outil, il peut être utilisé à mauvais escient, c’est pourquoi nous déployons un certain nombre d’efforts pour protéger l’intégrité de Search et garantir que nous adoptons une approche responsable. »

Si Google détermine que l’IA est principalement utilisée pour manipuler les classements de recherche, cela n’est pas autorisé. Il s’agit d’un jugement nébuleux qui peut s’avérer difficile, même pour une entreprise possédant les prouesses de Google en matière d’IA.

Peu de temps après que Ward ait publié son fil de discussion, le trafic Web organique de Causal a chuté d’une falaise. Début octobre, il enregistrait plus de 610 000 visites organiques par semaine, selon les données d’Ahrefs ; à la mi-décembre, ce chiffre était tombé à environ 190 000. Selon certains experts, cela ressemblait étrangement à une « action manuelle » de Google : pénaliser délibérément le site Web dans ses classements de recherche. (Google a refusé de commenter des sites Web spécifiques.)

« Je ne peux pas confirmer qu’il y a une pénalité », a déclaré Patrick Stox, expert SEO chez Ahrefs. « Mais il n’y a fondamentalement rien d’autre que la suppression d’un tas de pages qui provoquerait une telle baisse. »

Google en conflit

Alors que Google porte un jugement sur le contenu synthétique d’autres sites Web, il travaille dur pour créer ses propres modèles d’IA pour produire automatiquement du texte et d’autres informations.

Selon le New York Times, il tente de vendre certains de ces outils d’IA générative aux principaux éditeurs de presse. Et de plus grands changements sont à venir. Google développe SGE (Search Generative Experience), un outil expérimental de réponse aux questions par IA intégré directement dans la recherche. Il pourrait s’agir du plus grand bouleversement des 25 ans d’histoire de Google, en fournissant des réponses personnalisées directement aux utilisateurs.

Selon la société de capital-risque Insight Partners, des expériences de recherche basées sur l’IA comme celle-ci peuvent entraîner une baisse du trafic allant jusqu’à 25 % pour de nombreux sites Web.

« Comme pour toute grande perturbation, soit vous vous adaptez à cette perturbation, soit vous finissez par périr », a déclaré Gary Survis, partenaire opérationnel chez Insight.

C’est un double coup pour les éditeurs et les sites Web qui dépendent de Google pour le trafic : leurs liens peuvent être rétrogradés en dessous du contenu généré par l’IA de Google, et ils seront en concurrence dans les résultats de recherche traditionnels restants avec d’autres sites Web qui utilisent l’IA pour rédiger automatiquement du contenu. .

Tremper leurs orteils

Les entreprises médiatiques ont déjà l’habitude de se lancer dans l’eau de l’IA, avec des résultats parfois calamiteux. Éditeur Gizmodo G/O Media a été critiqué pour avoir publié des histoires générées par l’IA contenant de nombreuses erreurs factuelles plus tôt cette année. L’éditeur de Sports Illustrated a récemment licencié le PDG du magazine suite à un brouhaha suite à sa publication d’articles mettant en vedette de faux écrivains et des photos de profil générées par l’IA.

Pourtant, les autres éditeurs ne sont pas dissuadés. Michael Nunez, directeur éditorial du site d’actualités technologiques VentureBeat, encourage ses écrivains à expérimenter les outils d’IA. Nich Carlson, rédacteur en chef mondial de BI, a déclaré en avril que la rédaction apprendrait soigneusement à utiliser cette nouvelle technologie.

« Le plus important pour nous est que nous ne comptons jamais sur l’IA aveuglément ou sans esprit critique, et que nous l’utilisons comme un outil pour augmenter les compétences ou le jugement humain plutôt que pour le remplacer », a déclaré Nunez de VentureBeat à BI. (Divulgation : Nunez et l’auteur de cet article siègent tous deux au conseil d’administration du San Francisco Press Club.)

Même Bruns d’Exceljet commence à utiliser l’IA dans son flux de travail, malgré le braquage SEO de Ward.

« Souvent, lorsque je termine un article, je le renvoie à ChatGPT et lui demande de réviser l’article. Je m’intéresse surtout aux fautes de frappe ou aux erreurs logiques », a déclaré Bruns. « Je l’utilise parfois pour générer des idées », a-t-il ajouté.

« De temps en temps, je vous le demande : pouvez-vous me dire comment vous résoudriez ce problème dans Excel ? »


Vous avez une histoire ? Contactez le journaliste Rob Price via l’application de messagerie cryptée Signal (+1 650-636-6268), e-mail (rprice@insider.com), Telegram / Wickr / WeChat (robaeprice), Twitter/X DM (@robaeprice), ou par courrier : Rob Price, Trading Insider, 44 Montgomery St, 3rd Floor, San Francisco, CA 94104, États-Unis

A lire également