Pour le SEO, le contenu généré par les utilisateurs (UGC : User Generated Content) peut être tout à la fois une bénédiction ou une malédiction.
Une bénédiction car il ajoute du contenu sur vos pages, dans des commentaires ou des avis par exemple, vous permettant de vous positionner sur de nouvelles requêtes, tout en renforçant l’intérêt de votre contenu web pour les utilisateurs.

Mais aussi une malédiction, car l’UGC, lorsqu’il est de mauvaise qualité peut envoyer des signaux négatifs sur vos pages web, qui risquent de nuire à leur bon positionnement. C’est d’autant plus vrai si vos commentaires, vos forums ou vos avis sont spammés.

Mais comment s’en prémunir ?

Google a récemment publié un article sur son blog destiné aux webmasters sur le sujet. Voici un aperçu des principales mesures efficaces .

Empêchez les robots et les programmes de poster des contenus

En règle générale, les contenus « spammy » sont postés massivement sur des centaines ou des milliers de sites à lafois à l’aide de programmes et de bots. Certaines mesures se révèlent efficaces contre la plupart de ces outils :

  • mettez en place un captcha : en théorie, seul un humain saura lire le captcha et pourra poster du contenu
  • bloquez les utilisateurs suspects : certaines extensions de forums ou de CMS empêchent la saisie en masse, en détectant des comportements qui ne sont pas ceux d’un utilisateur humain « normal ». D’autres essaient de détecter des « signatures » suspectes. La plus connue de ces extensions est Akismet, qui propose des solutions pour de nombreux CMS et forums.

Modérez vos contenus UGC

Dès que vous publiez des contenus générés par des utilisateurs sur votre site, il est important que les posts soient modérés. Vous pouvez opter pour de la modération à posteriori, à condition de pouvoir agir en temps réel, 24h sur 24, 7j sur 7. Ou pour une modération a priori, en ne validant et en ne publiant que les contenus approuvés.

Dans tous les cas, c’est une mauvaise idée d’autoriser les « posts » anonymes, il est important d’obliger vos contributeurs à créer un compte avant de pouvoir publier quoi que ce soit. Et surveillez l’activité de vos nouveaux utilisateurs, et la présence de « posteurs fous », qui se mettent à créer beaucoup de posts d’un seul coup, ou à déterrer de vieilles discussions dans un forum (ce qui est éminemment suspect.

Une autre solution consiste à bloquer les posts contenant certains termes (comme Viagra ou Cialis ou Payday loan ou GOT Streaming… Tiens je viens peut-être d’allumer un « flag » quelque part chez Google qui va faire passer cet article pour un post de spammeur… Mais sans lien, c’est mieux !)

Filtrez et sélectionnez vos contenus UGC

Certains des contenus UGC peuvent poser des problèmes de qualité, sans être réellement du spam. La présence massive de posts ou d’avis mal écrits, remplis de fautes de grammaire ou d’orthographe, ou de langage SMS, ou d’un lexique traduisant un niveau de langage très bas, peut finir par empêcher la qualité de votre propre contenu d’être appréciée à sa juste valeur.

Il est donc important de « filtrer » les contenus UGC, et de ne rendre crawlable et indexable que le contenu présentant un niveau de qualité suffisant, ou de limiter la quantité de contenu UGC crawlable et indexable (en chargeant le reste en ajax par exemple).

Ne laissez pas la porte ouverte aux hackers

Ces mesures ne servent à rien si un hacker réussit à prendre le contrôle de votre CMS ou de votre forum. Garder vos logiciels parfaitement à jour, appliquer les patches de sécurité sans délai constituent une obligation pour tous les webmasters aujourd’hui.

Et ne tentez pas les spammeurs !

Une autre mesure est d’empêcher l’inclusion de liens dans les contenus postés par les utilisateurs, ou l’ajout d’attributs nofollow systématiques sur les liens. On peut aussi réserver l’ajout de liens à certaines catégories d’utilisateurs de confiance uniquement.

Pour en savoir plus :

https://webmasters.googleblog.com/2017/01/protect-your-site-from-user-generated.htm