Canonical tag : les URLs canoniques expliquées
Lorsque le contenu d’une page peut être consulté sous plusieurs URLs différentes, il est considéré comme contenu dupliqué (en anglais : duplicate content), ce qui peut avoir pour conséquence que la page en question ne soit pas indexée par le moteur de recherche. Cela pose par exemple un défi aux projets Web qui proposent des contenus quasiment identiques dans la même langue sous des domaines spécifiques à différents pays.
Une solution possible à ce problème est le Canonical tag (balise canonique), qui vous permet de déclarer une URL ou une URI comme ressource standard pour l’indexation.
Une balise canonique, c’est quoi ?
En 2009, Yahoo, Microsoft et Google présentent le « Canonical tag » pour les liens, une balise qui allait rapidement devenir l’un des principaux outils pour le SEO et qui est distinguée depuis 2012 comme standard officiel du Web dans le RFC 6596. Si le lien canonique est intégré à une page, il renvoie à une URL ou une URI standard indiquée, également appelée URL canonique, qui doit être utilisée comme source d’indexation à la place de cette page.
L’URL canonique combine donc sa propre popularité de lien et sa réputation avec celles des pages de référence : elle génère ainsi un meilleur classement. Comme les URL marquées par la balise ne sont pas incluses dans l’index, il n’y a pas de problème de contenu dupliqué. Toutefois, l’attribution n’est qu’une suggestion aux moteurs de recherche, qui ne doivent donc pas nécessairement saisir l’attribut de lien et l’inclure dans leur évaluation. Si l’implémentation est incomplète ou erronée, il existe même le risque que l’ensemble du site soit ignoré, d’où l’importance d’utiliser correctement la balise canonique.
- Améliorez votre classement sur Google sans les frais d'une agence
- Répondez aux avis clients et générez des publications pour les réseaux
- Aucune connaissance en référencement et marketing en ligne requise
Canonical Tag : comment ça marche ?
Pour que la balise canonique fonctionne, deux choses sont nécessaires : d’une part, vous avez besoin de l’URL exact de la page canonique souhaitée, qui doit être déclarée comme ressource standard. D’autre part, vous avez besoin d’un élément de lien dans lequel vous pouvez insérer l’URL canonique, y compris l’élément Canonical. Le code se présente ainsi :
<link rel="canonical" href="URL/URI de la page canonique">
htmlL’élément lien, qui n’a pas de balise de fin en HTML, contient comme élément vide uniquement les attributs rel
et href
. Le premier est nécessaire pour spécifier la relation entre le document actuel et le document lié, tandis que le second indique où se trouve le document lié. Les valeurs nécessaires à cet effet se trouvent à l’intérieur des guillemets : la valeur rel "canonical"
indique que l’URL liée doit être une URL canonique, qui est ensuite indiquée dans l’attribut href.
Pour que les pages alternatives se réfèrent à la ressource standard indiquée, le code doit être inséré dans la zone Head des documents HTML correspondants. Si le contenu n’est pas en HTML, par exemple dans le cas d’un fichier PDF, il est également possible de l’implémenter dans le HTTP-Header Cela implique une syntaxe légèrement différente :
Link: <URL/URI de la page canonique>; rel="canonical"
htmlQuand utiliser le Canonical tag ?
Par définition, le Canonical tag n’est pas un facteur que les moteurs de recherche doivent absolument prendre en compte. Comme le code doit en outre être implémenté séparément pour chaque contenu présent plusieurs fois et chaque URI alternative, la question se pose de savoir si l’effort relativement important est effectivement rentable au final. Découvrez ci-dessous quatre scénarios dans lesquels vous devriez absolument envisager l’utilisation de la balise canonique.
Les contenus sont distribués sur des URLs dynamiques
Les URLs dynamiques jouent un rôle important de nos jours, surtout dans l’e-commerce. Les pages spécifiques à l’utilisateur représentent certes une option excellente et simple pour présenter le même contenu (y compris de légères variations) à différents utilisateurs, mais elles posent régulièrement des problèmes au crawler du moteur de recherche. Dans ce cas, les balises Canonical sont recommandées pour éviter d’éventuelles classifications en tant que contenu dupliqué.
Les contenus sont accessibles via différentes URLs
Pour des raisons structurelles, certains projets Web tels que les blogs, les boutiques en ligne ou les portails de conseils proposent des contenus dans plusieurs catégories à la fois et donc souvent sous différentes URLs. Ainsi, une boutique pourrait par exemple proposer simultanément la page d’aperçu de l’article « chemise verte » sous les URLs suivantes :
-
mon-ecommerce.shop/mode/chemise-verte
. -
mon-ecommerce.shop/moded’été/chemise-verte
-
mon-ecommerce.shop/modehivernale/chemise-verte
.
Le fait que le contenu soit accessible via différentes URLs est également fréquent lorsque les structures d’un site Web changent ou même lorsqu’un déménagement complet du domaine a eu lieu. Pour de tels cas, les redirections 301 sont en principe prévues, mais si cela n’est pas réalisable pour des raisons techniques, le tag link rel="canonical"
est une alternative judicieuse à votre disposition.
Le contenu est disponible sur plusieurs domaines
Vous pouvez utiliser le Canonical tag non seulement pour un lien interne, mais aussi pour un lien vers un domaine externe.
De cette manière, vous proposez sans problème vos contributions sur un autre domaine, sans créer de contenu dupliqué. De plus, les signaux d’utilisateurs positifs, les liens ou autres facteurs de classement sont transférés sur l’URL d’origine, ce qui peut améliorer considérablement sa performance.
Les contenus présentent différents formats
Dans certaines situations, il est tout à fait judicieux de publier des contenus sous différents formats et de proposer par exemple un formulaire non seulement en version HTML, mais aussi en fichier PDF et en édition imprimée. Pour que les moteurs de recherche n’évaluent pas chaque variante indépendamment et, dans le pire des cas produisent un mauvais classement, il est recommandé d’utiliser des balises canoniques.
Si vous disposez d’un certificat SSL/TLS valide, il est recommandé d’utiliser des URLs canoniques HTTPS sécurisées et d’y faire référence à partir des variantes non sauvegardées (HTTP). Il en va de même pour les pages mobiles ou AMP. Pour celles-ci, il même obligatoire d’utiliser des balises canoniques.
Canonical tag : les erreurs fréquentes
Dans de nombreuses situations, une URL canonique est la solution optimale pour éviter le duplicate content sur votre site Web. Les principaux moteurs de recherche tiennent compte de la balise Canonical lors de l’indexation et reconnaissent ainsi que vous ne souhaitez pas vous classer en parallèle avec des contenus identiques ou similaires. En outre, les signaux positifs des moteurs de recherche sont réunis dans l’URL principale, ce qui améliore leurs chances de positionnement. Il convient toutefois de noter ici que l’utilisation de balises canoniques peut rapidement s’avérer être un facteur négatif si elles ne sont pas correctement distinguées ou mal implémentées. Les paragraphes suivants vous présentent donc les erreurs les plus fréquentes avec le Canonical tag.
Avec l’audit SEO gratuit de IONOS, vous pouvez faire évaluer rapidement et facilement les performances SEO de votre site.
Les pages numérotées renvoient à une URL canonique
Pour présenter les contenus de manière attrayante, de nombreux webmasters ont recours à ce que l’on appelle la pagination. Les portails d’information utilisent notamment cette méthode, qui consiste à répartir le contenu sur plusieurs pages et à les numéroter. Toutefois, si l’on utilise des balises Canonical pour de tels contenus et que l’on renvoie à l’URL de départ sur les pages suivantes avec le tag link-rel="canonical"
, on commet une erreur lourde de conséquences : les pages suivantes ne sont en effet en aucun cas des doublons, ce qui fait que le contenu en réalité unique n’arrive pas dans l’index. Si vous souhaitez tout de même transmettre aux moteurs de recherche des informations sur la pagination choisie, il est conseillé de procéder de deux manières :
-
Renvoyer à la page précédente et à la page suivante sur chaque URL. Pour cela, vous avez également besoin de l’attribut de lien
rel
, mais il faut remplacer la valeur"canonical"
par"prev"
ou"next"
. - Avec le tag
link-rel="canonical"
, renvoyer à une version d’une page du contenu en question, qui combine toutes les pages numérotées.
Les URLs relatives ne renvoient pas à la page canonique souhaitée
Comme la plupart des balises HTML, la balise <link>
offre la possibilité de spécifier des URLs absolues et relatives. Alors que les URLs absolues décrivent le chemin complet (y compris « http:// », etc.), les URLs relatives renvoient spécifiquement à un dossier particulier sur le site Web actuel, sans qu’il soit nécessaire d’indiquer l’URL complète. Par exemple, un chemin relatif "images/image.jpg"
indique que l’image image.jpg est accessible dans le sous-dossier « Images » du répertoire actuel. Lors de l’utilisation de la balise Canonical, l’utilisation de tels chemins conduit toutefois rapidement à des complications, de sorte que les crawlers ignorent complètement la balise dans le pire des cas.
Google renvoie à titre d’exemple à la distinction suivante :
< link rel="canonical" href="example.com/cupcake.html" >
htmlEn raison de l’absence de préfixe HTTP, le crawler considère l’URL example.com/cupcake.html
comme une URL relative et part du principe que l’URL canonique souhaitée est http://example.com/example.com/cupcake.html
. Idéalement, vous devriez donc toujours indiquer l’URL complète lorsque vous placez le Canonical tag ou, au moins faire référence à une URL absolue sans domaine :
< link rel="canonical" href="/cupcake.html" />
htmlUne mauvaise mise en œuvre d’une stratégie SEO peut parfois avoir de graves conséquences sur le classement de votre site. Nous vous présentons les erreurs de référencement les plus fréquentes afin que vous puissiez les éviter.
Les pages font référence à plus d’une URL canonique
La nature des URLs canoniques exclut logiquement qu’une sous-page renvoie à plusieurs de ces pages standard. De tels liens multiples apparaissent rapidement si vous travaillez avec un système de gestion de contenu ou avec un logiciel de boutique en ligne. En effet, les plugins et les templates insèrent souvent des balises Canonical de manière automatique et inaperçue, même si vous avez déjà marqué une URL canonique. En particulier si vous utilisez de telles extensions, mais aussi en cas de modification de la structure de la page, vous devez donc impérativement vérifier le texte source et corriger les indications le cas échéant. Dans le cas contraire, vos efforts resteront probablement infructueux, car il est fort probable que les moteurs de recherche ignorent toutes les balises canoniques au lieu d’en privilégier une.
- Éditeur de site intuitif avec fonctions d'IA
- Générateur d'images et de textes avec optimisation SEO
- Domaine, SSL et boîte email inclus
Les balises Canonical manquent dans la version mobile
Proposer une version mobile de votre site Web en plus de la version de bureau peut être à l’origine d’énormément d’erreurs dans le balisage des liens. Et même si les pages mobiles sont indexées malgré l’absence d’indications, il convient d’aider les moteurs de recherche à les reconnaître et à les catégoriser. Ainsi, Google recommande de désigner la version mobile comme version alternative au moyen de rel="alternate"
et, en outre, de renvoyer les pages mobiles vers les URLs de bureau correspondantes au moyen de la balise Canonical. Le géant des moteurs de recherche a réuni des conseils détaillés et les procédures possibles dans un guide pour les « Mobile Friendly Websites ».
Le SEO englobe de nombreux composants de pages Web, stratégies d’optimisation et notions techniques. Il est donc souvent difficile pour les nouveaux venus de s’y retrouver. Dans notre lexique SEO, nous vous expliquons les termes principaux liés à l’optimisation pour les moteurs de recherche.
Les balises Canonical et hreflang se contredisent
Les projets Web internationaux avec des domaines de différents pays représentent un grand défi pour les responsables SEO. D’une part, les pages de toutes les variantes doivent obtenir de bons classements et arriver à l’utilisateur final approprié ; d’autre part, il faut réduire au maximum le risque de contenu dupliqué. L’un des outils les plus importants est l’attribut hreflang, qui permet de désigner les différentes versions comme alternatives équivalentes. Pour ce faire, il est toutefois nécessaire que ces pages renvoient toujours à elles-mêmes. Si de telles URLs renvoient en même temps à une URL canonique via le Canonical tag, cela constitue logiquement une contradiction pour les crawlers des moteurs de recherche.
Le résultat est que le moteur de recherche ignore les deux signaux et indexe les pages Web sur la base d’autres caractéristiques. Il faut donc absolument éviter d’utiliser les deux instructions ensemble.
La combinaison d’URLs canoniques et de hreflang n’est pas la seule à générer des contradictions qui ont un impact négatif sur le classement de vos pages. L’utilisation commune de balises Canonical et d’instructions telles que nofollow
, noindex
ou disallow
n’est pas non plus expressément souhaitée par Google.
Les différences entre la balise canonique et la redirection 301
À première vue, la balise canonique semble ressembler fortement aux redirections 301. En effet, ces redirections, basées sur le code d’état HTTP 301 (Moved Permanently ou « déplacé définitivement »), signalent également aux moteurs de recherche que différentes pages Web doivent être considérées comme un seul exemplaire. En outre, les redirections ont également pour effet de diriger les visiteurs vers l’URL déclarée comme originale, tandis que toutes les autres variantes sont supprimées. Les pages avec la balise Canonical sont uniquement marquées comme copie pour les moteurs de recherche et restent donc toujours accessibles pour les utilisateurs.
Une autre différence réside dans le fait que les moteurs de recherche n’ignorent jamais une redirection, alors que cela peut tout à fait être le cas avec le marquage d’élément de lien recommandant. Enfin, les deux méthodes se distinguent également par leur fonctionnalité en cas d’utilisation interdomaine : alors que les redirections 301 transportent effectivement une page d’un domaine A vers un domaine B, la balise Canonical indique uniquement qu’il existe un équivalent d’une page du domaine A sur le domaine B. Les redirections 301 ne peuvent pas être utilisées dans le cadre d’une utilisation interdomaine.