Erreur 404: c’est quoi, comment la corriger ?

Lorsque votre navigateur affiche une page web avec un message du type : « 404 Not found », cela indique que le serveur HTTP n’a pas trouvé la ressource demandée. En d’autres termes, la page, la ressource web recherchée n’existe pas ou plus.

Les codes de réponse HTTP (HTTP response status codes) indiquent si une requête HTTP a été exécutée avec succès ou non. Ils sont regroupés en cinq classes et le status code 404 appartient à la classe : « Les erreurs du client (400 – 499)».

D’où proviennent les erreurs 404 ? Comment sont-elles générées ?

Les causes amenant une ressource à renvoyer un code de réponse 404 peuvent être multiples :

  • Une migration/refonte de site web :

Dans le cadre d’une refonte de site internet (https://www.search-foresight.com/solutions-et-produits/seo-search-engine-optimisation/seo-technique/seo-refonte-migration-cms/), si un changement de nom de domaine ou de réécriture des URL intervient et qu’aucune redirection n’est effectuée, cela peut générer un grand nombre d’erreurs 404.

  • La gestion quotidienne d’un site web :

Par-delà l’aspect migration, une erreur 404 peut survenir lors de la suppression d’une page web ou d’une ressource web. Parallèlement, cela peut survenir si la syntaxe de l’URL subit un changement, par exemple :

example.com/vetement-homme -> example.com/vetements-homme

Il est à noter que certains CMS ne gèrent pas la modification de syntaxe d’une URL automatiquement. La passerelle n’est donc pas effectuée entre l’ancienne URL et la nouvelle URL ce qui génère une erreur 404 si l’on souhaite accéder à l’ancienne URL.

  • Une internaute maillant une URL erronée depuis son site web :

Sur cet aspect, les éditeurs de site ne peuvent malheureusement pas agir. Nul n’est donc à l’abri qu’un.e utilisateur.trice intègre sur son site web ou partage une URL erronée :

Par exemple : bonne syntaxe de mon URL -> mauvaise syntaxe de mon URL

example.com/vetement-homme -> example.com/vetement-hommeùùùù

  • En modifiant la syntaxe de l’URL :

Si vous vous êtes déjà amusés à modifier la syntaxe d’une URL en rajoutant des caractères à la fin de celle-ci, vous devriez normalement voir apparaître, dans votre fenêtre de navigateur, une page web qui renvoie une erreur 404. Néanmoins, ce comportement est logique puisque le serveur indique qu’aucune ressource web n’est associée à l’adresse erronée que vous avez rentrée.

L’impact des erreurs 404 sur le SEO :

Les erreurs 404 ne sont pas pénalisantes en tant que telles pour le SEO. Néanmoins, elles peuvent être un frein sous plusieurs aspects :

  • Perte de la popularité, de l’historique de l’URL :

Si vous supprimez une page qui possédait des liens externes, cette page, devenue 404, ne transmettra plus la popularité qu’elle recevait à l’ensemble du site.

  • Nuit à la qualité de crawl des robots d’indexation :

Si votre site possède beaucoup de pages web en erreur 404, les robots d’indexation vont donc crawler des ressources, pages web non pertinentes alors qu’ils pourraient passer du temps à crawler des ressources, pages web essentielles à votre stratégie SEO.

  • Une expérience utilisateur dégradée :

Une erreur 404 peut tout simplement « frustrer » un.e internaute lors de sa navigation sur un site. Pour pallier la mauvaise expérience utilisateur, pensez à personnaliser votre page d’erreur 404. Les bonnes idées ne manquent pas, jetez un œil sur Google avec la requête : « meilleures pages personnalisées 404 ».

Comment identifier une ressource renvoyant une erreur 404 ?

Il existe une multitude d’outils SEO (faire lien interne : https://www.search-foresight.com/quels-outils-seo-choisir-selon-chantiers-optimisation/) afin de détecter une ressource en erreur 404 :

  • Depuis la Google Search Console :

Dans : Couverture > Exclues > Introuvable (404). Attention, les données centralisées dans la Google Search Console sont limitées ; vous ne pourrez exporter que 1 000 lignes. Si vous avez une forte volumétrie d’URL en erreur 404, vous n’aurez pas l’exhaustivité des données et il faudra corriger ce premier lot de 1 000 URL afin de consulter les suivantes :

  • Avec des outils d’analyse de crawl tels que Screaming Frog, Botify, OnCrawl, etc.

Attention, seules les ressources maillées au site pourront être détectées dans votre crawl.

  • Certains outils SEO : Ahrefs, Majestic SEO, Semrush etc.

Là encore, les données ne sont pas exhaustives car seules les ressources maillées depuis des sites tiers seront identifiées par les outils Ahrefs et Majestic SEO. Avec Semrush, seules les URL renvoyant une erreur 404 maillées depuis le site seront détectées.

  • Les logs du serveur : une source fiable et exhaustive !

Plus la période de rétention sera longue, plus vous aurez d’exhaustivité au niveau des données ! Le bénéfice SEO offert par les logs serveur réside dans la connaissance des ressources en erreur 404 consultés par les internautes et par les robots d’indexation (Googlebot, Bingbot, etc.). Il faudra juste vous assurez que le format de vos logs serveur comprend la récupération des codes de réponse afin d’identifier les URL en erreur 404.

Comment corriger une erreur 404 ?

Corriger une erreur 404 n’est pas compliqué mais souvent chronophage. Il vous suffira de rediriger, avec un status code 301, ces URL inexistantes vers de nouvelles pages. Il faudra, pour chacune des pages renvoyant une erreur 404, indiquer la nouvelle page cible ; idéalement, la plus proche sémantiquement de l’ancienne URL. Si la page supprimée n’a pas de correspondance exacte, vous pouvez la rediriger vers la page de catégorie depuis laquelle elle était maillée. Évitez à tout prix les redirections massives vers l’URL de la page d’accueil au risque de nuire à ses performances.

Il est à noter que vous n’êtes pas obligés de rediriger systématiquement une URL renvoyant une erreur 404. Afin de statuer, il faut vous assurer que l’URL ne possède pas un fort capital SEO (visites naturelles, backlinks, mots-clés positionnés, etc.). Dans le cas où l’URL possède un historique SEO, redirigez là en 301 au risque de perdre la notoriété acquise par l’URL. Dans le cas contraire, vous pouvez déclarer, avec un status code 410, que l’URL est définitivement « Gone ». Le code de réponse 410 indique au navigateur que la page a bel et bien existé mais que la ressource n’est plus disponible et ce, de manière définitive : la page est « partie ».

Quelle est la différence entre un status code 404 et un status code 410 d’un point de vue SEO ?

Matt Cutts, ancien chef d’équipe de la « web spam team » chez Google, a expliqué dans une vidéo que le moteur réagissait différemment selon le statut code renvoyé. Si le code de réponse HTTP est 404, il y aura un délai de 24 heures avant qu’une action soit effectuée ; comme la suppression de la page web de l’index de Google par exemple. À l’inverse, si le code de réponse HTTP est 410, l’action sera immédiate et sans délai.