Je vais faire un plan de mon site (sitemap)
Pour être facilement repéré et bien classé sur le web, un site a, entre autres besoins, d’être indexé correctement. Ce travail d’indexation est effectué par les moteurs de recherche, qui ont, à l’occasion, besoin d’être aidés en la matière. Aussi, que ce soit pour indiquer les éléments à prendre en compte et/ou la marche à suivre, un sitemap peut donc s’avérer très utile.
Définition de sitemap
Le sitemap est une technique informatique permettant une exploration plus intelligente des sites internet par les moteurs de recherche. Il s’agit d’un protocole mis en place par Google pour aider ses « crawlers » (robots d’indexation) dans leur tâche. Grâce à ce procédé, ceux-ci sont donc en mesure de trouver plus facilement les adresses à indexer sur chaque site internet visité. Déjà automatique, le processus de classement devient alors plus simple, plus rapide et surtout plus efficace.
Le fonctionnement d’un sitemap consiste en effet à indiquer l’emplacement des URL à l’intérieur de la page web. Une fois collectées, celles-ci peuvent ensuite être classées dans la base de données des moteurs de recherche.
Pouvant littéralement se traduire par « plan de site », le sitemap est en quelque sorte une manière de structurer un site web pour le rendre plus déchiffrable par les crawlers. Il se présente principalement en format XML ou texte contenant un certain nombre d’informations relatives à la page web. C’est donc par le biais de ce fichier .xml que les webmasters signalent aux moteurs de recherche les adresses à indexer, et, si besoin est, la manière dont cela devrait être fait. Lisez aussi la définition du SEO..
Quelles sont les informations indiquées dans un fichier sitemap ?
Pour rappel, un sitemap est un protocole permettant aux administrateurs de soumettre aux moteurs de recherche la liste des sites internet qu’ils souhaitent voir indexer. Pour se faire, ils créent donc une sorte de fichier de balisage qui met en évidence lesdites adresses, en plus de quelques détails complémentaires. Généralement, on retrouve donc :
- La page concernée
- Sa périodicité d’actualisation
- La date de sa plus récente mise à jour
- Son niveau d’importance comparativement aux autres pages du site
Pour information, il faut noter que depuis son lancement en 2005, le protocole sitemap a, pendant un bon moment, été l’apanage du GoogleBot. Mais, depuis 2006 la plupart des autres grands moteurs de recherche l’ont officiellement intégré à leur robot d’indexation. Il s’agit entre autres des plateformes Yahoo, Ask, Yandex, Bing, Live Search, Baidu, MSN ou encore Orange.
Pourquoi créer un fichier sitemap.xml ?
Un site internet qui présente une arborescence complexe peut rendre difficile la tâche d’indexation. Il en est de même s’il s’agit d’une plateforme web énormément fournie en matière de liens internes et de volume de pages.
La conception d’un fichier sitemap.xml répond ainsi principalement à un besoin de gestion optimisée du crawl. En d’autres termes, ce protocole évite entre autres à Google de s’emmêler les pédales au moment de l’analyse du contenu d’un site.
De façon générale donc, on peut citer en termes d’avantages un certain nombre de points assez intéressants. Entre autres :
- Pouvoir établir et mettre en avant une liste de toutes les URL importantes de son site afin de garantir leur accessibilité par les moteurs de recherches
- La possibilité d’indiquer à ces derniers les pages qu’ils doivent prioritairement crawler chaque fois qu’ils passent en revue le site en question.
- Inviter les robots d’indexation à revenir souvent crawler les pages du site, en leur donnant des précisions sur la fréquence de mise à jour et la date des dernières modifications.
- Le fait de pouvoir accéder à un certain nombre d’informations pouvant s’avérer utiles à la bonne administration de la plateforme web.
- La possibilité de suivre de près les statistiques de son site se rapportant au nombre d’apparitions dans les résultats de recherche.
- Faciliter l’indexation d’un site créé très récemment et qui ne contient pas beaucoup de liens externes. Pareil pour les sites contenant des contenus archivés ou proposant des pages dynamiques comme c’est très souvent le cas pour les plateformes de e-commerce.
Comment créer son propre sitemap ?
À moins que vous soyez un as de l’informatique, la meilleure manière de concevoir votre fichier sitemap est de passer par un éditeur. En effet, un certain nombre d’outils comme Yost SEO ou encore GSC (Google Search Control) sont proposés aujourd’hui pour cela. Mais avant de vous lancer, il convient de décider du format à adopter. Ce qu’il faut savoir, c’est que le fichier XML sera indispensable s’il s’agit :
- De donner des informations relatives aux smartphones
- D’établir une liste des éléments multimédias (images et vidéos) se trouvant dans la page HTML
- De mettre en place un sitemap d’actualités
- De fournir des commentaires de langues dans le cas où vous en avez plusieurs à gérer
En dehors de ces conditions, vous pouvez tout simplement utiliser le format texte pour élaborer votre protocole. Dans ce cas, il vous suffira de réaliser l’encodage du fichier en UTF-8, tout en veillant à lister uniquement les URL à faire indexer. Au moment de nommer le fichier, il ne faudra pas oublier de toujours ajouter l’extension .txt à la fin.
Pour ce qui est de la création d’un sitemap XML, vous pouvez y arriver facilement en utilisant l’éditeur Google XML sitemap. Tout ce que vous aurez à faire ici sera de procéder à l’installation et à l’activation du plug-in. Une fois le fichier généré, vous n’aurez qu’à faire les ajustements nécessaires au niveau de ses paramètres. Par ailleurs, il faut noter que la manière de soumettre un sitemap peut varier d’un éditeur à un autre, et en fonction du moteur de recherche choisi.
Utilisation de la balise hreflang
Un site internet peut contenir une ou plusieurs pages correspondantes chacune à des langues différentes, on parle alors de site multilingue. Dans ce cas, il est possible de préciser cet aspect aux robots d’indexation. C’est là qu’intervient la balise hreflang, surtout si le site propose des contenus intégralement traduits dans plusieurs langues. Ainsi, en fonction de sa région ou de son pays, l’utilisateur sera facilement redirigé vers le contenu qui convient à sa spécificité linguistique.
Généralement, on utilise la balise hreflang en la faisant apparaître au niveau de l’entête de la page, ou si possible directement dans le sitemap. Si les références sont bien faites en fonctions des langues disponibles, le moteur se chargera ainsi d’afficher la page demandée dans la langue qu’il faut.
Sitemap et référencement
La mise en place d’un sitemap n’est pas réellement indispensable au bon classement d’un site internet. En effet, une plateforme construite comme il se doit, se classe naturellement en bonne position. Son bon référencement dépendra donc de sa pertinence, de la qualité de sa structuration, et surtout son maillage interne.
Cependant, cela ne signifie pas pour autant que la mise en place de ce protocole est totalement inutile. Un sitemap participe au référencement du site en se contentant de révéler les informations de vos pages. Celles-ci ne seront donc bien positionnées que si elles contiennent les éléments indispensables à cela.
Ce qu’il faut retenir sur l’importance du sitemap
Si la création d’un fichier sitemap n’est pas une étape incontournable pour la bonne administration d’un site internet, il apporte une aide non négligeable. Son utilité sera par exemple particulièrement intéressante, s’il s’agit de gérer des sites importants et compliqués. Dans le cas contraire, il ne sera pas nécessaire d’en faire une priorité.