Je vérifie mes pages d’erreur 404
Les erreurs 404 sont fréquentes quand vous surfez sur la toile. En effet, tous les internaute y ont déjà été confronté. Elle ne constitue pas en soi une erreur très pénalisante. Mais, quelques fois quand même, il faut les retrouver, car elles peuvent avoir un impact négatif sur le référencement de votre site web.
Définition d’erreur 404
Quand vous naviguez sur la toile, il vous est sûrement déjà arrivé de tomber sur une page blanche. Celle-ci affiche un message qui dit « 404 file not found » (404 page non trouvée), « fichier introuvable », « la page web n’existe plus » ou juste « erreur 404 ». En fait, l’erreur 404 est un code d’état http que le serveur qui héberge la page web envoie. Mais, elle veut dire que la page web que vous avez essayé de visiter soit n’existe pas ou plus, soit a été censurée, soit ne peut être trouvée sur le serveur.
Vous faites face à ces cas quand la page web a été supprimée à la source. Le créateur l’a définitivement supprimée et n’en a pas informé les moteurs de recherche. Il se peut aussi qu’elle existe, mais c’est dans le lien de l’URL qui permet d’y accéder qu’il y a une erreur. Le Webmaster qui s’en est occupé a pu commettre une erreur de saisie. De plus, il est possible que la page web soit en phase de migration ou de refonte. Quand c’est le cas, elle n’existe plus dans sa première forme. Il est nécessaire que le créateur informe les moteurs de recherche que c’est la même page, en redirigeant vers ces nouvelles URL.
De plus, la page web affichant une erreur 404, les moteurs de recherche ne l’indexeront pas. Cela signifie que personne ne pourra trouver cette page via une recherche Google. Et, le moteur ne pourra pas l’explorer. Si vous avez un site web qui affiche une erreur 404, vous devez immédiatement la réparer. Sinon, les robots de recherche de Google vont retarder son exploration : ils ne vont pas perdre du temps à passer sur votre site. Ils ne vont pas non plus le classer dans leurs bases de données. Google bot va également retarder la fréquence des visites du site.
Voir aussi définition SEO.
L’impact des erreurs 404 sur le référencement
En matière de référencement, Google donne l’avantage aux sites web bien travaillés. Si leurs contenus sont utiles, pertinents, accessibles aux moteurs de recherche et aux internautes, que les pages sont chargées plus rapidement, ils ont plus de chances d’être référencés et de gagner en positionnement. Un site web bien travaillé est un site web qui contient le minimum d’erreurs possible, voire pas d’erreurs du tout – ce qui est très rare.
Donc moins vous aurez des erreurs 404 sur votre site web, mieux ce sera pour votre positionnement. Cependant, les erreurs 404 ne sont pas particulièrement handicapantes pour le référencement, si elles ne sont pas de taille considérable. Cependant, si l’un ou l’autre de ces cas se présentent, il faut immédiatement détecter les erreurs et rectifier le tir.
Comment retrouver ces pages d’erreur 404 sur votre site ?
- La page qui dirige vers le message d’erreur est assez importante sur votre site web. Les moteurs de recherche vont imaginer qu’elle a été supprimée, et ils vont la retirer de leur base de données. Elle ne pourra plus être explorée par les visiteurs de votre site, alors qu’elle est pertinente. Ce qui fera des visiteurs frustrés, qui vont tout bonnement chercher ailleurs.
- La page existe bel et bien, mais une erreur technique a fait que le message d’erreur s’affiche quand on veut y accéder.
- Un site extérieur pertinent a créé un backlink vers le vôtre, mais en utilisant une optimisation URL contenant une erreur. Il est conseillé de consulter le webmaster responsable pour l’informer de l’erreur.
- Vous n’avez pas qu’une ou deux erreurs sur votre site, mais plusieurs. Les moteurs d’analyse vont avoir des difficultés à analyser correctement votre site. Cela va grandement sanctionner l’expérience utilisateur. Il est, en effet, désagréable de penser trouver une information pertinente, mais de tomber sur une page introuvable. Cela va donner une mauvaise image à votre site, il sera perçu comme non mis à jour. Si c’est un site marchand, cela va diminuer vos ventes.
Pour avoir un site web bien référencé, il faut d’abord que les bases de données des robots des moteurs de recherche les indexent. Et pour ce faire, un des critères est l’absence quasi totale d’erreur 404. Mais comment allez-vous trouver les erreurs 404 cachées de votre site web ?
La première option est d’utiliser ce qu’on appelle un analyseur de site. Cet outil permet de trouver tous les liens, externes ou internes, qui sont contenus dans votre site web et qui pointent chacun vers un code d’erreur 404. Il existe plusieurs outils d’analyse de site en ligne.
Google a le sien, appelé « Google Webmaster Tools », et qui a récemment pris le nom de « Search Console ». Vous pourrez créer un compte Search Console et profiter de cette option recherche d’erreurs 404. Quand vous aurez ouvert votre compte, allez dans l’onglet Exploration, puis dans «Erreur d’exploration ». Vous y trouverez la liste des URL qui ont envoyé un code d’erreur, ainsi que le code correspondant, avec sa date de détection. Ces URL peuvent être téléchargées et ouvertes dans un tableur sous forme de liste. C’est la liste des URL redirigeant vers l’extérieur.
Quand la liste des URL est téléchargée via Google Webmaster Tools, effectuez ensuite ce qu’on appelle « crawl » de votre site. Un crawl consiste à laisser un robot d’un moteur de recherche explorer un site web, pour qu’il découvre en intégralité les pages du site, comme si on le laissait y naviguer. Vous allez donc essayer de détecter les erreurs internes. Le crawl permet de trouver des liens cassés ou les pages qui renvoient un code 404. Un outil de crawl efficace est Screaming Frog. Entrez-y votre URL de site et lancez le crawl. Vous obtiendrez la liste des erreurs par le biais du bouton « Bulk Export 4xx ». Les URL ainsi générées vont être ajoutées à la liste Excel. C’est la liste des URL internes à votre site.
Combinez ces deux listes, puis débarrassez-vous des URL en doublon. Vous aurez au final la liste des URL renvoyant vers de page d’erreurs 404.
Comment corriger les erreurs 404 de votre site ?
Vous avez maintenant la liste des erreurs 404. Les corriger est un jeu d’enfant. Mais, cela va prendre énormément de temps. Vous avez le choix entre : redirigez les URL sujettes aux erreurs vers de nouvelles via un code 301 dans un fichier .htaccess, ou déclarer que ces pages ont été supprimées pour de bon, via un code 410.
Pour la redirection de chacune des erreurs 404, il vous faudra indiquer la nouvelle page. Si vous avez dans votre liste une centaine d’URL qui ont besoin d’être redirigées vers de nouvelles pages, vous allez le faire pour chacune d’elle.
Certains pensent qu’il faut rediriger les pages d’erreurs vers la page d’accueil. En effet, il n’y a pas de mal à cela, tant que le nombre de redirections est raisonnable. Par contre, plus il y a de redirections vers la page d’accueil, pire, ce sera pour le référencement de votre site. Pour Google, beaucoup de redirections vers la même page sont synonymes de faible qualité. Et si Google n’apprécie pas la qualité de page d’accueil (celle vers laquelle beaucoup d’erreurs sont redirigées), il y a peu de chances que Google la référence.
Si vous ne voulez pas rediriger certaines URL, vous allez évidemment les supprimer définitivement. Mais avant cela, soyez sûr qu’elles ne reçoivent pas de backlink. Le backlink rappelons-le est un lien qui se trouve sur un site web différent du vôtre, mais qui pointe vers le vôtre. Ils ont pour objectif de générer un plus gros trafic sur votre site. Vérifiez donc que la page que vous êtes sur le point de supprimer n’en contient pas, au risque de vous faire perdre des prospects.
Personnaliser vos pages d’erreur 404
Les pages d’erreurs sont inévitables, quelles que soient les précautions que vous prenez. Mais, au moins, vous avez le choix de ne pas l’afficher sous sa forme par défaut si frustrante aux yeux des visiteurs. En effet, il est possible de rendre vos pages d’erreurs plus personnalisées. Et ce, pour que les visiteurs les trouvent plus agréables à regarder. Même si la page n’existe vraiment pas, et que le visiteur en sera déçu, au moins vous essayerez de le retenir sur votre site.
De plus, pour personnaliser votre page d’erreur, vous devez créer un fichier que vous allez nommer « .htaccess ». Une fois créée, insérez-y le code : errorDocument 404/mapage.html. C’est un code qui va rediriger le visiteur vers la page « mapage.html » s’il clique sur le lien vers une page qui n’existe pas. C‘est-à-dire qu’au lieu de tomber sur la page d’erreur, il atterrira sur la page « mapage.html ».
Les erreurs 404 peuvent rapidement devenir une plaie pour l’expérience utilisateur et un frein à votre référencement.
Conseils pour une page d’erreur web bien personnalisée :
- L’URL de la page personnalisée doit commencer par un slash au lieu de http ou https. Le serveur vous renverra ainsi un code d’erreur, et non un code de redirection temporaire.
- La page d’erreur personnalisée devrait être conçue dans le même design que votre site web. Le menu, les barres latérales, le pied de page doivent rappeler l’apparence graphique du site. Les visiteurs auront ainsi l’impression de toujours être dans votre site.
- Votre page d’erreur personnalisée doit être légère. Elle ne devrait pas inclure d’éléments longs à exécuter ou dont le chargement va prendre du temps. Le cas échéant, votre serveur en sera saturé.
- Le visiteur qui s’est retrouvé sur la page d’erreur devrait être rassuré : invitez-le à vous contacter pour expliquer le désagrément qu’il a rencontré en naviguant sur votre site. En même temps, proposez-lui de se rendre sur votre moteur de recherche interne, ou dirigez-le vers quelques liens vers les pages principales.
- Faites en sorte que votre page d’erreur ne génère pas d’autres pages d’erreur !
- Si votre page web est présentée sous forme d’une structure site web en plusieurs sous-domaines, personnalisez une page d’erreur pour chacun d’eux.
- Informez-vous sur la manière la plus optimale pour configurer votre instrument de mesure d’audience. Cela vous permettra d’obtenir le maximum de renseignements sur les erreurs 404. Ces derniers vous aideront par exemple à créer des notifications qui vous préviendront si le nombre d’erreurs dépasse un certain seuil. Et vous devez déjà les corriger, et ne surtout pas attendre qu’elles aient atteint un nombre trop élevé.
- Personnalisez vos pages d’erreur 404, mais aussi les autres, comme : 400 (erreur de syntaxe dans l’adresse de la page), 403 (serveur qui refuse l’accès à la page), 410 (page qui n’existe plus), 500 (erreur interne de votre serveur), et 503 (service non disponible).