Les porte-parole de Google ont communiqué ces derniers jours des informations plutôt contradictoires sur les données structurées.
Le 26 octobre dernier, Gary Illyes a déclaré au SMX East « qu’il voulait vivre dans un monde où les données structurées seraient moins importantes que maintenant ». Et appelé de ses voeux une évolution où Google serait capable d’extraire des informations de pages web sans avoir à recourir au balisage Schema.org

Et voilà que le même Gary Illyes à la conférence Pubcon annonce que « l’année prochaine, la première des choses sur lesquelles les webmasters devaient se concentrer était les données structurées[…]. Attendez-vous à voir apparaître plus de fonctionnalités comme celles sur l’emploi, les recettes, les produits, etc. »Alors où est la vérité sur ce sujet? Les données structurées ont-elles réellement de l’avenir ? Faut-il suivre les conseils de Gary Illye, ou considérer que de toute façon, à terme, les moteurs se débrouilleront sans ?

smx-east-données-structurées-gary-illyes-blog-search-foresight

La montée en puissance des données structurées

Sans l’aide des données structurées, les moteurs de recherche ont dans le passé connu des difficultés pour identifier correctement la nature de l’information présente sur une page web, et répondre à des questions du type : « ce paragraphe est-il une adresse ? Si oui, où est le nom de la ville, le code postal ? Ce bout de phrase fait-il partie du nom de la société, ou est-ce le début de l’adresse ? Et où placer cette adresse que je ne connais pas sur une carte ?

La mise en place du standard schema.org entre les grands moteurs de recherche et quelques grands acteurs du web a permis de créer plusieurs méthodes de balisage (la dernière en date étant JSON.LD) qui connaissent aujourd’hui un niveau d’adoption certain. Le succès de ces balisages repose avant tout sur le fait que les moteurs ont décidé assez tôt d’exploiter les informations issues des données structurées pour créer des fonctionnalités nouvelles, comme les « rich snippets ».

Aujourd’hui, les pages d’un moteur comme Google sont remplies de « rich snippets », de « rich cards », de blocs et de carroussels qui ne pourraient pas exister sans données structurées.

Google est devenu dépendant aux données structurées

Les fonctionnalités s’appuyant sur les données structurées améliorent l’expérience utilisateur de manière incontestable. Les pages de Google, notamment en usage mobile, auraient une allure totalement différente sans elles.

Mais du coup, Google est confronté à trois problèmes :
– le spam : les moins scrupuleux des webmasters ont compris qu’en falsifiant les données structurées présents sur leurs pages, ils pouvaient améliorer leur visibilité à moindre coût
– les erreurs de balisage : ajouter des données structurées à son code demande de la rigueur et des ressources techniques. A la fin, les balises ne sont pas toujours lisibles parce que mal implémentées, ou leur contenu erroné
– et le niveau de couverture : même si de plus en plus d’éditeurs de sites ajoutent des données structurées sur leurs pages, souvent pour être « aussi visibles que les concurrents », un nombre considérable de pages webs qui mériteraient d’être taggées, ne le sont pas !

Google va avoir besoin d’une cure de désintox

En vingt ans d’histoire, les moteurs de recherche ont appris (souvent à leurs dépens) que dépendre des informations communiquées par les webmasters pour les fonctionnalités d’un moteur de recherche. C’est ce qui explique aujourd’hui que la balise « meta keywords » ne soit plus exploitée par les grands moteurs de recherche : rapidement spammé, peu fiable, exploiter le contenu de cette balise s’est vite avéré contre-productif.

Dans ce contexte, on peut comprendre que Gary Illyes (qui exprime probablement une opinion partagée par pas mal de monde au sein de la firme de Mountain View) s’inquiète de la situation, et voudrait que Google améliore sa capacité à extraire de l’information sans données structurées. Adieu les problèmes de couverture, les données spammées, les balises illisibles !

Sauf que ce n’est pas pour demain…

Je suis sûr que des gens chez Google travaillent d’arrache-pied pour sortir le moteur de son addiction aux données schema.org, mais pour le moment, le moteur a encore besoin de sa dose, et même d’une dose de plus en forte avec le temps qui passe…

En attendant, Google a besoin de toujours plus de données structurées…

Le fait que Google annonce qu’en 2018, il y’aura encore plus de fonctionnalités à base de balises schema.org, et qu’il faut donc se concentrer sur la mise en place de ce balisage si on est un éditeur de site, n’est pas du tout surprenant. C’est cohérent avec sa stratégie du « mobile first » car les carrousel et les rich cards améliorent l’expérience de recherche sur mobile. Et le futur de la recherche a besoin de données structurées : par de recherche prédictive sur Google Now sans ça, pas de recherche conversationnelle sur Google Assistant sans ça, pas de résultats vocalisés sur Voice Search ou Google Home sans données structurées.

 donnees-structurees-mobile-seo-blog-search-foresight

Conclusion : oui, il faut s’intéresser aux données structurées maintenant

Certes, on peut d’ores et déjà, en théorie, bénéficier de rich snippets sans avoir de balisage schema.org. C’est possible, on trouve quelques exemples sur le net. Mais en règle générale, sans balisage « ad hoc », impossible d’apparaitre dans les résultats de Google dans une rich card ! Et cela ne changera probablement pas dans les mois qui viennent…

Donc, en 2018, prévoyez de la bande passante pour implémenter les balisages schema.org utiles sur votre site. Vous êtes prévenus !