seo #geo#seo#ai-search

GEO vs SEO en 2026, comment se faire citer par ChatGPT, Claude et Perplexity

Nouh Benzidane 18 mai 2026 · 10 min de lecture

En résumé

Le SEO Google reste la base, mais 2026 ouvre un nouveau front. Voici six leviers concrets pour faire citer votre site par ChatGPT, Claude, Perplexity, Gemini et Copilot.

Le SEO classique sur Google reste la base en 2026, mais une nouvelle bataille s’est ajoutée. ChatGPT, Claude, Perplexity, Gemini et Bing Copilot répondent désormais aux questions des utilisateurs en citant des sources web. Le GEO (Generative Engine Optimization) consiste à maximiser vos chances d’être l’une de ces sources citées. Concrètement, six leviers permettent d’agir aujourd’hui. Voici lesquels et comment je les mets en place sur mes propres projets, ce site compris.

Pourquoi parler de GEO en 2026

Le comportement de recherche a basculé en 2023 avec l’explosion de ChatGPT, puis s’est consolidé en 2024 avec Perplexity et Google AI Overviews. En 2026, une part significative des questions techniques ou de comparaison (“quel framework choisir”, “combien coûte X”, “comment faire Y”) est posée à un LLM avant Google.

Ce changement crée deux situations nouvelles pour un site web.

Situation 1. L’utilisateur pose sa question à ChatGPT. ChatGPT cite trois ou quatre sources web pour étayer sa réponse. Si votre site n’est pas dans ces sources, vous êtes invisible.

Situation 2. L’utilisateur fait toujours une recherche Google, mais Google affiche une AI Overview en haut de la SERP. Cette overview cite des sources. Si votre site n’est pas dans ces citations, le clic ne descend jamais jusqu’à votre lien organique.

Les deux situations exigent que les LLMs sachent que votre contenu existe, qu’ils puissent le crawler, et qu’ils aient envie de vous citer plutôt qu’un autre. C’est exactement ce que le GEO travaille.

Six leviers concrets pour faire du GEO

Voici les actions que j’applique sur ce site et chez mes clients. Aucune n’est théorique, je les ai toutes implémentées au moins une fois en production.

1. Autoriser explicitement les crawlers IA dans robots.txt

Beaucoup de sites bloquent les crawlers IA par défaut ou par mauvaise configuration. Première étape obligatoire, ouvrir votre robots.txt aux principaux user agents IA. Sur ce site, j’autorise explicitement les 12 crawlers suivants.

GPTBot (OpenAI, training et browsing), OAI-SearchBot (ChatGPT Search), ChatGPT-User (fetch à la demande), ClaudeBot (Anthropic), Claude-Web (legacy Anthropic), PerplexityBot (Perplexity index), Perplexity-User (fetch à la demande), Google-Extended (Gemini et AI Overviews), CCBot (Common Crawl, source de nombreux modèles), Bingbot et BingPreview (Bing et Copilot), Applebot-Extended (Apple Intelligence).

C’est dans public/robots.txt que ça se passe. Une dizaine de minutes de travail, gain potentiel énorme.

2. Publier un fichier llms.txt

Le standard llms.txt proposé par llmstxt.org consiste à servir un fichier texte à la racine du site, résumant son contenu de manière digestible par un LLM. Ce n’est pas encore largement consommé en 2026, mais Perplexity en a annoncé l’usage progressif, et plusieurs agents IA expérimentaux l’ingèrent.

Sur ce site, j’expose deux variantes. /llms.txt est un résumé court avec les pages clés et les 10 derniers articles. /llms-full.txt contient le full-text des articles pour les systèmes qui ingèrent en RAG. Coût de production : zéro, c’est généré au build à partir de mes Content Collections.

3. Structurer le contenu pour la citation

Un LLM préfère citer un passage clairement identifiable plutôt qu’un paragraphe noyé dans une longue page. Pour faciliter ça, chaque article que je publie commence par un bloc résumé court (moins de 120 mots) qui répond directement à la question du titre. Ce bloc porte l’attribut HTML id="summary".

Idem pour les “key takeaways” en fin d’article, marqués id="takeaways". Ces deux ancres sont déclarées dans un schema JSON-LD Speakable, qui indique aux assistants vocaux (Alexa, Google Assistant, Siri) quelles phrases lire à voix haute. Les LLMs s’en servent également comme signal de “voici le résumé canonique de cette page”.

4. Citer des sources fiables, datées, accessibles

Les LLMs préfèrent citer des pages qui elles-mêmes citent des sources fiables. C’est un signal de qualité indirect. Sur ce blog, chaque article inclut une section “Sources” listant les URLs consultées, avec la date d’accès. Les sources favorites sont des organisations stables et reconnues.

Pour la France, en priorité, cnil.fr (protection des données), insee.fr (statistiques), service-public.fr (références légales). Au niveau international, web.dev (performance), schema.org, MDN Web Docs.

Évitez les sources “blog-of-blog-of-blog” sans dates, ou les “selon une étude récente” sans lien.

5. Implémenter les schemas JSON-LD pertinents

Les LLMs lisent les structured data Schema.org pour comprendre rapidement le type de contenu d’une page. Sur ce site, j’expose systématiquement.

Person schema sur la home et la page À propos, avec sameAs vers LinkedIn et knowsAbout détaillant les thématiques traitées. C’est ce schema qui établit l’autorité auteur (E-E-A-T).

Article ou BlogPosting schema sur chaque article, avec headline, datePublished, dateModified, author, wordCount, keywords. Ces métadonnées aident le LLM à dater et catégoriser le contenu.

FAQPage schema sur les pages qui contiennent une FAQ structurée. C’est typiquement repris tel quel dans les rich snippets Google et facilite la citation par les LLMs.

BreadcrumbList site-wide. Aide à comprendre la hiérarchie du site.

SpeakableSpecification sur les blocs résumé et takeaways, comme expliqué plus haut.

6. Construire des signaux d’autorité auteur

Les LLMs hésitent à citer des sources anonymes ou douteuses. Ils favorisent des auteurs identifiables, vérifiables, avec une trace publique. Concrètement, pour chaque article que je publie, le byline pointe vers une page À propos qui expose mes coordonnées professionnelles vérifiables.

Sur ma page À propos, vous trouverez mon SIRET (899 453 401 00015, vérifiable sur le registre national des entreprises), mon LinkedIn, mes projets publics (urgenceserrures.fr, plombiersidf.fr, vitriersparis.fr), et un email de contact. Ces signaux apparaissent dans le Person schema JSON-LD et dans le contenu visible.

C’est le signal le plus sous-estimé. Beaucoup de sites publient sous des bylines fictives ou des comptes admin générique. Mauvaise stratégie en 2026.

Comment mesurer les résultats GEO

Le GEO est plus difficile à mesurer que le SEO Google classique, mais quelques signaux sont accessibles.

Plausible et Google Search Console. Vérifiez la part du trafic référée par les domaines ChatGPT (chat.openai.com), Perplexity (perplexity.ai), Bing Copilot, etc. Cette part est encore faible en 2026 mais croissante.

Tests manuels périodiques. Une fois par mois, je pose à ChatGPT, Claude et Perplexity les questions sur lesquelles je veux ranker. Exemple, “qui est un bon développeur Astro freelance en France ?”. Je note si mon site est cité, où, comment.

Outils tiers naissants. Plusieurs outils émergent en 2026 pour mesurer la visibilité dans les LLMs (Otterly.ai, Profound, Tryprompt). Aucun n’est encore décisif mais ils s’améliorent vite.

Les anti-patterns qui plombent votre GEO

J’ai vu plusieurs sites se priver involontairement de citations IA à cause de configurations contre-productives.

Bloquer tous les crawlers IA dans robots.txt. Souvent fait par défaut sans réfléchir. Conséquence directe, vous êtes invisible des LLMs. À ré-évaluer immédiatement sauf cas d’usage premium spécifique.

Publier du contenu IA générique sans valeur unique. Les modèles préfèrent citer un contenu qui apporte une perspective non-triviale. Si votre article répète mot pour mot ce que dit Wikipédia, le LLM citera Wikipédia, pas vous. C’est exactement pour ça que mon pipeline de génération d’articles inclut une passe d’audit qui rejette tout contenu générique et exige des éléments de voix première personne, des données spécifiques au marché français et des sources vérifiables.

Cacher les dates de publication. Un article daté de 2019 sans date de modification n’est jamais cité. Exposez toujours datePublished et dateModified en visible et dans le JSON-LD.

Tronquer le contenu derrière une newsletter ou un login. Le LLM ne peut pas crawler ce qu’il ne voit pas. Le contenu principal doit être accessible publiquement, sans gate.

Et le SEO Google dans tout ça

Petit rappel important. Le GEO ne remplace pas le SEO Google. Les deux travaillent en synergie. Les LLMs s’appuient encore largement sur l’index Google, Bing et leur propre crawl. Un site qui ranke bien sur Google sera plus facilement cité par un LLM, et vice versa.

Concrètement, voici la séquence d’investissement que je recommande à mes clients en 2026.

D’abord, fondamentaux SEO classiques (Lighthouse 95 et plus, structured data, sitemap, internal linking, contenu de qualité). C’est non négociable.

Ensuite seulement, GEO en couche complémentaire (robots.txt allowlist, llms.txt, schemas Speakable, sources fiables, signaux d’autorité auteur). C’est la cerise.

Investir dans le GEO avant d’avoir un SEO Google solide, c’est comme installer un toit avant les murs. Ne le faites pas.

Ce qu’il faut retenir

Le GEO ne remplace pas le SEO Google, il s’ajoute en couche supplémentaire pour maximiser les citations par ChatGPT, Claude, Perplexity, Gemini et Copilot.
Première action concrète, autoriser explicitement les 12 principaux crawlers IA dans votre robots.txt.
Publier un fichier llms.txt à la racine du site est gratuit, rapide à mettre en place, et de plus en plus consommé.
Structurer chaque article avec un bloc résumé et des key takeaways marqués (id=“summary” et id=“takeaways”) facilite la citation par les LLMs.
Les signaux d’autorité auteur (SIRET, LinkedIn, projets publics) sont parmi les plus déterminants pour être cité plutôt qu’un autre.

Si vous voulez voir un exemple complet d’implémentation GEO en production, ce site lui-même applique les 6 leviers. Le code est commenté et la stack documentée. Pour aller plus loin, démarrons un projet ensemble.

/faq

Questions fréquentes

GEO remplace-t-il le SEO ?

Non, GEO complète le SEO. Les moteurs IA s'appuient encore largement sur l'index Google, Bing et leurs propres crawls. Un bon SEO classique est la fondation. GEO est la couche qui maximise vos chances d'être cité par les LLMs au-delà d'être ranké en SERP.

Faut-il bloquer GPTBot et ClaudeBot pour protéger son contenu ?

Non, sauf si votre business model dépend du contenu premium payant (médias, banques de données). Pour une PME française qui cherche de la visibilité, bloquer les crawlers IA revient à se priver de citations potentielles. Mieux vaut être cité comme source que d'être ignoré.

Qu'est-ce qu'un fichier llms.txt et faut-il en mettre un ?

C'est une proposition de standard (llmstxt.org) qui consiste à publier à la racine du site un fichier texte résumant le contenu pour les LLMs. Ce n'est pas encore largement consommé en 2026, mais ça coûte rien à mettre en place et les premiers signaux montrent une adoption progressive par Perplexity et certains agents IA.

Combien de temps faut-il pour voir des résultats GEO ?

Plus long que le SEO Google. Compter 3 à 6 mois pour commencer à apparaître dans les citations ChatGPT et Perplexity. Les modèles IA mettent à jour leurs index moins fréquemment que Google. Patience requise, donc, mais l'effet est cumulatif.

/sources

[1] llmstxt.org · Proposition officielle du standard llms.txt (consulté le 2026-05-18)
[2] OpenAI · GPTBot user agent (consulté le 2026-05-18)
[3] Anthropic · ClaudeBot et Claude-Web (consulté le 2026-05-18)
[4] Google · Search Central, AI Overviews (consulté le 2026-05-18)
[5] Schema.org · Speakable specification (consulté le 2026-05-18)

/à lire ensuite