Une bonne stratégie d’internationalisation passe par une compréhension de la langue et/ou du pays ciblé.
Bien souvent, les entreprises confondent les deux :

  • soit en voulant cibler les utilisateurs qui parlent une autre langue : Par exemple dans ce cas une entreprise française traduira son contenu en espagnol.
  • soit en voulant cibler les utilisateurs qui vivent dans un autre pays : dans ce cas l’entreprise française voudra se développer en Russie.

En fonction de la stratégie voulue le nombre potentiel d’utilisateur ne sera pas le même.
Dans cet article nous traiterons de la stratégie à adopter sur un site multirégional.
Nous reviendrons sur les bonnes pratiques pour un site multilingue dans un autre article.

Le ciblage international

Bien que faisant partie de notre quotidien les moteurs de recherche ne peuvent pas associer un pays à un contenu sans prendre en compte un certain nombre de signaux pour les remettre en contexte.

Pour les aider, il faut savoir que le country code Top Level Domain est le signal le plus fort qui peut être envoyé. Par exemple une extension de domaine .fr confirme à un moteur et à un utilisateur que le site est bien géré en France et non en Russie. C’est en somme un gage de confiance pour l’utilisateur français qui verra cette page dans la SERP.

Exceptions :

Attention cependant, certains ccTLD deviennent dans le temps des generic Top Level Domain (gTLD), car les internautes et les webmasters les considèrent comme étant davantage génériques que relatifs à un pays précis et donc perdent à terme leur avantage de ciblage géographique auprès des moteurs de recherche.
Par exemple : .io qui était à la base destiné à identifier le territoire de l’océan indien britannique mais ensuite a très vite été repris par le monde du hack et des start-ups.

Aussi, les Top Level Domains ciblant une région sont considérés comme des gTLD, car le ciblage géographique n’est opérationnel qu’au niveau national.

Selon Google si l’ICANN ne considère pas un TLD comme étant un ccTLD, tout TLD de l’IANA sera considéré comme étant un gTLD.
Malheureusement Google ne nous donne pas la liste exhaustive de ces exceptions.

Comment géolocaliser une page qui n’envoie pas de signal ?

Dans le cas où notre extension de domaine n’envoie pas de signal ou bien est considérée comme un gTLD, il faudra passer par l’outil de ciblage international de la Google Search Console.
Voilà comment il faut procéder :

  1. Dans le rapport sur le ciblage international, cliquez sur l’onglet Pays.
  2. Cochez la case Zone géographique ciblée, puis sélectionnez le pays en question. Pour que votre site ne soit associé à aucun pays et à aucune région, sélectionnez Non défini dans la liste déroulante.

ciblage-international-search-console

Attention cet outil sert principalement à restreindre notre ciblage à un pays donné. C’est-à-dire que si on est un site français avec des objectifs de ciblage multirégional, on peut oublier cette méthode. Cependant si on est un restaurant français n’opérant qu’en France cet outil sera idéal.

Conclusion : il faut être sûr de son choix en utilisant cette fonctionnalité.
Si notre domaine a pour objectif de cibler différents pays on évitera donc cette solution.

Comment faire pour géolocaliser un site multirégional ?

Dans le cas où un ciblage via la search console ou un ccTLD est impossible, Google prendra en compte les signaux qu’envoie ou reçoit notre domaine.
Pour déterminer les signaux de géolocalisation, il est préférable de passer d’abord par la case étude de marché, pour être sûr que nos adaptations culturelles et géographiques correspondent réellement aux habitudes de recherches locales.
Mais globalement les principaux éléments qui vont aider les moteurs de recherche sont :

  • L’adresse IP, qui est un signal fort, car il permet de déterminer la localité du serveur et donc potentiellement du public cible. Cependant attention, ce n’est pas toujours vrai, car l’utilisation d’un Content Delivery Network (CDN) ou d’un serveur dans un pays différent de notre cible sont des éléments à prendre en compte.
  • Les meta tags, le nom des produits et la description des produits ne sera pas la même pour un site qui cible les anglais des Etats-unis versus les anglais de Grande-Bretagne.
  • L’utilisation d’un format de date, de mesure, de devise et enfin d’adresse et de numéro de téléphone locaux sont autant de signaux qui permettent d’associer un domaine à une région.
  • Enfin, une fiche Google My Business est aussi un signal fort comme peut l’être un annuaire local.

Les inconvénients du ccTLD

L’utilisation d’un ccTLD est le signal le plus fort qu’on peut envoyer aux moteurs de recherche pour lui dire que notre contenu est fortement associé à un pays.
Néanmoins l’usage d’un ccTLD présente différents inconvénients.
Le linkjuice que reçoit par exemple le domaine fr ne sera pas transmis aux autres pays. Cela signifie que pour chaque version de pays il faudra mettre en place une stratégie de construction d’autorité puissante.
L’achat de certains ccTLD il faut être citoyen du pays visé. Voici la liste des ccTLD contenant une restriction.
Avoir un ccTLD est une option coûteuse en termes de prix et de développement. Donc si vous avez la possibilité financière d’entreprendre un chantier de développement international, vous n’aurez pas de problème. Cependant si vous avez un budget restreint, vous avez toujours la possibilité d’utiliser un sous-domaine ou un répertoire pour identifier le ciblé.

Les alternatives au ccTLD

L’utilisation d’un sous domaine ou d’un répertoire dédié à une langue et son pays peut être une option. Ils présentent l’avantage de faciliter la segmentation de notre site et peuvent potentiellement bénéficier de la force de lien du domaine principal. Cependant, ils ne bénéficieront de la confiance que peut donner un ccTLD et de la puissance de lien que peut donner un domaine racine avec un ccTLD fort.
Pour compenser il existe toujours l’option du ciblage géographique de la Search Console en plus d’une stratégie de construction d’autorité forte et adaptation locale la plus précise possible.

Vous remarquerez qu’on ne revient pas sur les paramètres, pour principalement deux raisons. d’abord ce n’est pas très esthétique et on peut vite les rendre caducs en utilisant des balises canoniques.

Erreurs courantes dans la géolocalisation du contenu

Souvent dans le cas des sites multilingues, pour forcer la géolocalisation les webmasters mettent en place une redirection par IP. C’est-à-dire que par exemple lorsqu’un visiteur situé en France arrive sur le site il sera redirigé vers la version française du site.

Qu’en pense Google ?

Cette pratique est fortement déconseillée et peut même nuire au crawl et à l’indexation des pages qui ne seront pas redirigées.
Pourquoi ? Tout simplement parce que c’est la meilleure pratique pour “frustrer” un utilisateur et enfermer un bot dans une sorte de boucle de redirection à chaque fois qu’il voudra changer de pays et de langue.

Il faut aussi savoir que Google crawl principalement avec une IP américaine et dans certains cas avec une IP locale, Google lance aussi des requêtes HTTP sans le header Accept-Language et dans certains cas avec le header Accept-Language.
Google est donc capable de reconnaître grâce à ces deux points :

  • Les contenus différents sur la même URL en fonction du pays de l’internaute.
  • Les contenus différents sur la même URL en fonction de l’en-tête HTTP.

Il est possible de vérifier les crawl “géo-distribués” en faisant du reverse DNS. L’intérêt est de s’assurer que les hits que nous prenons pour du Googlebot en soient bien ! Il est possible pour des spammers (ou nous…) de crawler en UA GoogleBot.

Les étapes pour s’amuser à faire ça :

Faire un host sur une IP trouvée dans les logs et vérifier que le domaine retourné est soit : googlebot.com ou google.com.

Refaire un host sur le domaine retourné et vérifier que l’IP est bien la même.

Comment éviter les redirections par IP qui bloquent Google ?

Définir une page défaut qui permettra de choisir la langue souhaitée (penser à ajouter un hreflang x-default).

selection-pays-airfrance
Si on veut absolument faire de la redirection par IP , il est toujours possible de passer par une solution en Javascript qui ne bloquera pas le robot dans une boucle de redirection qui les empêchera de crawler et d’indexer les autres versions de langue.
Enfin après avoir défini sa page par défaut il est possible d’utiliser un cookie qui permettra de savoir quelle est la langue de préférence de l’utilisateur après sa visite, pour lui envoyer sa version de langue.

Dernièrement, John Mueller de Google a confirmé que le Googlebot généralement n’utilisait pas de cookies pour crawler les pages. “Généralement”, car ce n’est pas toujours le cas s’il veut récupérer toutes les pages disponibles.

Liens utiles :

https://support.google.com/webmasters/answer/62399
https://en.wikipedia.org/wiki/List_of_Internet_top-level_domains