Technique· 8 min de lecture

Données structurées et citabilité IA : ce que le balisage permet et ne permet pas

Note refondue le 25 mai 2026. Article initialement publié en février 2025 — refonte intégrale après la publication Google Search Central du 15 mai 2026.

Le slug de cette page contient le mot « GEO », auquel le cabinet ne reconnaît plus le statut de discipline autonome. La précision a été apportée dans une note dédiée à laquelle il est utile de renvoyer ici[1]. Le présent texte traite de la dimension technique sous-jacente : ce que peut, et ce que ne peut pas, le balisage en données structurées pour la visibilité d'une entreprise dans les environnements génératifs.

Ce que les données structurées sont

Les données structurées sont un balisage standardisé, le plus souvent en JSON-LD, qui explicite la nature et la structure du contenu d'une page web pour les systèmes automatiques qui la lisent. Une page produit balise un produit ; une page article balise un article ; une page personne balise une personne. Le standard de référence — schema.org — est maintenu collectivement par Google, Microsoft, Yahoo et Yandex depuis 2011, et couvre désormais quelques centaines de types et plusieurs milliers de propriétés[2].

Pour le SEO classique, ce balisage produit des effets observables depuis longtemps : rich snippets dans les résultats Google, affichage enrichi des FAQ, étoiles de notation sur les produits, fil d'Ariane lisible dans la page de résultats. Aucun de ces effets n'est garanti — Google les active à sa discrétion — mais leur déclenchement améliore mesurablement les taux de clic.

Pour les environnements génératifs, l'effet est de même nature mais d'un autre ordre. Les systèmes de synthèse qui composent une réponse à partir de plusieurs sources s'appuient sur tout signal qui aide à comprendre la structure d'un contenu, à identifier qui parle, à dater une information, à relier une affirmation à une source. Le balisage en données structurées est l'un de ces signaux. Il n'est pas le seul, et il n'est pas suffisant à lui seul.

Ce que le balisage n'est pas

Trois confusions méritent d'être levées avant tout travail technique.

Le balisage en données structurées n'est pas une arme secrète. Les pages bien balisées ne sont pas mécaniquement citées par les modèles. Le balisage améliore la lisibilité d'un contenu pour un système automatique ; il ne crée pas de qualité éditoriale qui n'existerait pas dans le contenu visible.

Le balisage n'est pas non plus une technique d'optimisation propre aux moteurs génératifs. Les fondamentaux du balisage schema.org sont identiques pour le SEO classique et pour la lisibilité par les LLM. Mettre en place JSON-LD parce qu'on veut « passer en GEO » est une formulation erronée. Le balisage soigné devrait être en place pour tout site sérieux depuis des années.

Le balisage n'est pas, enfin, une technique de tromperie. Marquer une page produit comme une page personne, ou inversement, ou exagérer les caractéristiques d'une entité dans son balisage, expose à des sanctions documentées de la part des moteurs et à une perte d'éligibilité aux affichages enrichis. Les modèles génératifs, dont les corpus intègrent progressivement les pénalités constatées, finissent par traiter les balisages incohérents avec une vigilance équivalente.

Les types de schémas pertinents par profil d'entreprise

Quatre types de schémas couvrent l'essentiel des besoins d'une entreprise B2B suisse de taille moyenne. Aucun n'est nouveau ; tous gagnent à être systématisés.

Organization. Le schéma de base qui décrit l'entreprise elle-même : raison sociale, adresse, numéro IDE, secteur d'activité, fondateur, équipe dirigeante, présence sur les réseaux professionnels. Une entreprise sans balisage Organization complet et à jour signale aux systèmes automatiques qu'elle ne s'occupe pas de sa propre identification — c'est un signal faible.

Service ou Product. Le balisage des offres principales de l'entreprise. Pour un cabinet de conseil, le schéma Service ; pour un éditeur logiciel, le schéma SoftwareApplication ; pour un industriel, le schéma Product. La propriété areaServed mérite une attention particulière pour une entreprise suisse à ancrage régional : préciser explicitement « Suisse romande » ou « Canton du Valais » plutôt qu'un vague « Suisse » oriente la sélection des modèles dans les réponses géographiquement situées.

Article et Person. Pour les contenus éditoriaux du site — articles, notes, analyses — le balisage Article couplé au balisage Person de l'auteur. Cette double identification renforce le signal E-E-A-T attendu par les moteurs, et elle constitue désormais un signal d'autorité éditoriale repris par les systèmes de synthèse. L'auteur anonyme ou la signature collective « rédaction » est un signal faible ; l'auteur nominalement identifié avec sa biographie professionnelle est un signal fort.

FAQPage. Pour les pages qui traitent effectivement de questions fréquemment posées. À ne pas surcharger : balisage uniquement quand les questions et leurs réponses figurent réellement dans le contenu visible de la page. Un balisage FAQPage sur une page qui n'en contient pas est sanctionné.

D'autres schémas peuvent être pertinents selon le secteur — LocalBusiness pour une activité géographiquement ancrée, JobPosting pour une page de carrière, Course pour un organisme de formation, MedicalEntity pour le secteur santé. Le principe directeur reste le même : ne baliser que ce que la page contient effectivement.

Les erreurs courantes qui invalident l'effort

Quatre erreurs reviennent dans les audits techniques que conduit le cabinet.

La première est le balisage fantôme : un balisage présent dans le code mais sans correspondance avec le contenu visible. Un schéma Person qui mentionne un dirigeant qui ne figure nulle part dans la page rendue. Un schéma Service qui décrit une offre que le site ne présente pas. Ces décalages, détectables par Google Search Console et par les outils de validation, peuvent faire perdre l'éligibilité aux résultats enrichis et fragiliser la confiance accordée à la page.

La deuxième est le balisage gonflé : un schéma surchargé de propriétés excessives — awards, endorsements, aggregateRating inventés ou non vérifiables. Ce gonflage peut produire un effet à court terme et se retourner ensuite, brutalement, à la première vérification automatique d'incohérence.

La troisième est le balisage incohérent entre pages : la même entreprise décrite avec des informations légèrement différentes selon les sous-domaines, les langues, les pages produits. Les systèmes de synthèse arbitrent en cas de contradiction, et tendent à retenir la source la plus stable, pas la source la plus récente. Une cohérence inter-pages parfaite n'est pas une finition cosmétique ; c'est une condition d'autorité.

La quatrième est le balisage non maintenu : un schéma posé en 2022 et jamais ré-examiné. Les évolutions de schema.org, les changements d'équipe dirigeante, les évolutions du périmètre d'activité créent des écarts qui s'accumulent. Une revue annuelle du balisage, même rapide, est un travail d'hygiène que les directions techniques sous-estiment souvent.

Une dimension parmi d'autres

Le balisage en données structurées est l'un des trois chantiers opérationnels que le cabinet identifie dans son cadre de travail sur la citabilité IA. Les deux autres — l'autorité éditoriale (transparence des sources, identification des auteurs, fraîcheur des contenus) et l'autorité tierce (présence dans les sources que les modèles consultent comme arbitres) — comptent au moins autant. Un balisage parfait sur des contenus pauvres ne produit pas de citabilité ; un contenu fort mal balisé peut être moins bien sélectionné qu'il ne le mérite.

L'articulation des trois chantiers et la méthode complète de mesure des écarts sont exposées dans le Cahier MCVA n°1 — Mesurer la citabilité IA après mai 2026, premier volume de la collection Les Cahiers MCVA.

Sources

[1] Cf. GEO vs SEO : pourquoi cette opposition n'a plus de doctrine, Jérôme Deshaie, refonte du 25 mai 2026. []

[2] Google Search Central, Understand how structured data works. URL : developers.google.com/search/docs/appearance/structured-data/intro-structured-data []


Jérôme Deshaie est CEO de MCVA Consulting SA, cabinet suisse de conseil stratégique en intelligence artificielle, basé en Valais.

Articles connexes