Code HTTP : impact SEO et optimisation

Incontournable dans un audit technique SEO, l’analyse d’un code HTTP avec Oncrawl permet en quelques clics de faire un état des lieux des requêtes HTTP au sein de la structure de votre site. Il vous reste alors à vérifier que ces status codes sont bien ceux attendus, le cas échéant à appliquer des corrections, puis à corriger votre maillage interne.
Le présent article vous explique l’impact en SEO des principaux status et comment bien optimiser leur utilisation pour en tirer le meilleur parti. Avant de poursuivre, vous pouvez consulter notre article consacré aux status codes et leur signification.

Code HTTP 200

200 OK

La requête HTTP fait au serveur aboutit, tout est normal. La page en question pourra être crawlée (si pas de blocage par robots.txt) par les bots Google et autres moteurs de recherche.

Attention tout de même, cela ne signifie pas pour autant qu’il n’y a aucune action nécessaire pour cette page et que le status code HTTP est bien celui attendu. Dans certains cas, des pages en erreurs ou inexistantes peuvent répondre en 200 alors que ce n’est pas optimal d’un point de vue SEO.

Ces pages pourront être identifiées sur Oncrawl avec une combinaison de plusieurs critères :

Comme nous le verrons dans la suite de l’article pour ces pages erronées, il faudra non seulement les retirer du maillage interne mais il sera également préférable de faire en sorte qu’elles répondent avec un status code HTTP plus utile pour le SEO.

Bonnes pratiques :

[oc-redirect num=1]

Code HTTP 3XX

301 Moved Permanently

La page demandée a été déplacée et redirigée vers une autre URL de manière permanente. Très utile en SEO, la redirection permanente permet de gérer les cas de migration de site de tout type (changement de domaine, migration http vers https, refonte, etc) mais surtout de modifier l’URL d’une page sans perdre le trafic entrant.
Le bot Google ne pourra plus accéder à la page d’origine et va suivre la redirection pour découvrir la page de destination. Il comprendra que la page a été déplacée et qu’il ne faut plus crawler la page d’origine.
Conséquences pour votre SEO :

Ce dernier point est un atout essentiel de votre stratégie SEO dans le cadre d’une migration ou simplement de la mise à jour du contenu de votre site. Si Google recommande de ne mettre en place des redirections 301 que vers un contenu identique ou similaire, et donc de ne pas rediriger de manière automatique vers la home page, il faut prendre en compte les backlinks que reçoit la page d’origine. Si la page n’existe pas ou plus mais reçoit des backlinks intéressants, il est judicieux à minima de mettre en place une 301. S’il n’existe pas de contenu similaire, la redirection doit se faire vers la rubrique parente en priorité sur la home page en suivant l’arborescence du site (on peut se baser sur le fil d’ariane ou les dossiers dans l’URL). Par exemple, pour une page produit on fera une redirection vers le listing produit plutôt que la home page.

La logique est différente concernant le maillage interne de votre site. Il est préférable de corriger tous liens pointant vers des pages en status codes HTTP 301 mais compte tenu du fait que le jus SEO est transmis, n’en faites pas une priorité. En revanche, toutes les redirections pointant vers des pages qui ne répondent pas en 200 devront être traitées prioritairement.

Les bonnes pratiques :

302 Found

La page demandée est temporairement redirigée vers une autre URL. Comme la redirection permanente 301, la redirection temporaire 302 permet de conserver le trafic entrant avec un expérience utilisateur transparente, mais elle n’offre pas les mêmes avantages en SEO. Le bot Google comprendra que la page d’origine est temporairement inaccessible et qu’elle le sera à nouveau.
Conséquences pour votre SEO :

Il est donc inutile de corriger vos 302 au sein du maillage interne, mais il est recommandé de vérifier régulièrement que les 302, détectées dans votre structure à l’aide d’un crawl ou des logs, sont bien temporaires.

Les bonnes pratiques :

304 Not Modified

La page demandée n’a pas été modifiée depuis la dernière consultation. La page en question n’a donc pas besoin d’être crawlée à nouveau par le bot Google, qui utilisera la version cache. Assez méconnu, ce status code HTTP 304 offre la possibilité d’économiser du budget crawl. Le bot Google va utiliser la version cache et accéder instantanément à la page demandée.
Conséquences pour votre SEO :

La mise en place de ce type de réponse pour les pages “classiques” peut être difficile et demander des développements. En revanche, pour les pages de ressources de type CSS cela peut-être un vrai quickwin.

Les bonnes pratiques :

Code HTTP 4XX

404 File Not Found

Le serveur n’a trouvé aucune page pour l’URL demandée, ce qui signifie que la page n’existe pas. Cela peut-être temporaire ou définitif, généralement la page est accessible via un lien non-fonctionnel ou par un internaute tapant la mauvaise URL.
Conséquence pour votre SEO :

Souvent vue comme l’erreur à corriger à tout prix en SEO, le status code HTTP 404 est en fait très utile pour le référencement. Il permet d’éviter que Google n’indexe des urls erronées ou des contenus qui n’existent plus (même si l’on verra ensuite que le code HTTP 410 est plus efficace dans ce cas). Google est d’ailleurs clair à ce sujet, les 404 ne sont pas problématiques. Au contraire, elles permettent d’éviter que des URLs erronées soient considérées comme de véritables pages de votre site.

Pour offrir une bonne expérience utilisateur, la recommandation est de créer une page d’erreur 404 personnalisée qui :

À noter que les liens présents sur une page 404 personnalisée seront comptabilisés dans le maillage interne. Il est recommandé de corriger tous les liens de votre site pointant vers une 404 pour éviter une dilution de la popularité interne au profit des liens du menu et du footer et pour ne pas gaspiller votre crawl budget.

Les bonnes pratiques :

410 Gone

La page demandée n’est plus disponible et ce de manière définitive. La différence avec le status code HTTP 404 réside dans cette subtilité, la page a déjà existé mais a été supprimée et ne sera pas remplacée. Le message envoyé au bot Google est donc plus précis et définitif. Conséquence pour votre SEO :

Le statut code HTTP 410 est donc à privilégier à la 404 dans le cas où l’on souhaite désindexer rapidement une page. Mais c’est aussi un status code HTTP plus lourd de conséquence en cas d’erreur.

Il existe des moyens manuels de désindexer une page, la mise en place de réponse 410 pour les pages supprimées permet l’automatisation du processus. Il faut également bien s’assurer qu’aucun lien ne pointe vers une page répondant en 410 car l’expérience utilisateur ne sera pas assurée comme avec une 404 personnalisée.

Les bonnes pratiques de HTTP Code 4xx:

Passez à l’action avec Oncrawl

Identifiez les requêtes HTTP de votre site avec le rapport de crawl

Rendez-vous sur le rapport CRAWL REPORT > Indexability > Status Code pour découvrir la répartition des pages par status code HTTP.

dashboard code http

Le rapport suivant permet de prioriser vos actions avec une répartition par status code et segments.

dashboard seo code http

Cliquez sur les données que vous souhaitez récupérer pour ensuite les exporter au format csv.

Pour aller plus loin, vous pouvez également récupérer les status codes via vos access logs.

Rendez-vous sur le rapport LOG MONITORING > Exploration sanity pour découvrir la répartition des pages par status code HTTP rencontré par les bots google.

status code http

Corrigez le maillage interne

Pour corriger le maillage, il faut repérer les liens qui pointent vers des pages qui ne répondent pas avec un status code 200. Vous aurez besoin des pages d’origine, des ancres et du code HTTP de la page de destination.

Rendez-vous dans le data explorer, sélectionnez le dataset Links et écrivez la requête suivante :

Il ne vous reste plus qu’à exporter en csv.
Pour les 301, si vous souhaitez également connaître la page de redirection, consultez l’article pour savoir comment créer un fichier listant tous les liens pointant vers une URL 301, l’ancienne URL et la nouvelle URL ?