La lutte contre le spam contextuel s’organise

On connait tous le spam sur les boites mails. Qui n’a jamais reçu un mail pour acheter du viagra ou autre pilule miracle ? Le phénomène « blog » n’a pas été à l’abri de ce genre de publicité très longtemps. En effet, il est maintenant courant de trouver, au milieu de commentaires pertinents sur un billet d’un blog, des messages (le plus souvent en anglais) qui nous invitent à nous rendre sur d’autres sites, ou vous pourrez toujours retrouver des pilules miracles ou tout autre article on ne peut plus interessant. Le but des spammeurs est ici légèrement différent : en effet, en étant présent sur votre blog, ils améliorent d’autant leur référencement. Google (pour ne citer que lui) considère que vous avez fait ce lien de bon coeur, et donc que le site lié est forcément digne d’interêt. Imaginez l’effet en terme d’image pour l’algorithme de Google si le vilain petit spammeur utilise la même astuce sur des milliers de blogs … Plusieurs solutions ont maintenant été mises en place, et je vous les détaille dans ce billet 🙂

* La première consiste à dire à informer GoogleBot (en quelque sorte l’agent secret de Google qui passe et repasse sur votre site pour mettre à jour la base de données) que « ce lien dans les commentaires, je le connais pas alors dans le doute je te dit que tu ne lui créditeras aucun « point ». Cela se fait de manière simple, en ajoutant à la volée le paramêtre « rel=nofollow » dans le lien HTML. Dotclear 2 le fait d’ailleurs par défaut pour tous les commentaires postés. Cette solution est loin d’être parfaite, puisque certes le site pirate n’aura plus aucun interêt à venir polluer votre site, mais la pollution visuelle, elle, reste. Et c’est jamais agréable d’avoir ce genre de message qui traine sur son blog… * L’autre solution consiste à mettre en place une liste noire de mots clefs qui ne doivent pas se trouver dans un commentaire. La liste est constituée de mots comme « casino », « sex » « drugs » etc. L’excellent spamplemousse est basé sur ce concept. Ce système nécéssite de mettre à jour la liste noire régulièrement, pour rajouter des termes. De plus, il peut poser soucis si votre blog parle de poker (imaginez si on interdit le mot « casino » …) ou alors tout simplement posez vous la question de ce que devient le commentaire souvent : « Tu as raison, mais ton critère de sélection ne prend pas en compte le sexe de l’individu ». Il faut avouer que cette phrase est particulièrement obscène ! * Dernière solution retenue : appliquer ce qui marche plutôt bien pour les mails à nos blogs, c’est à dire mettre en place de gigantesques bases de données d’adresses IP de spammeurs. Ces listes sont appelées [« RBL » (Real-time Blackhole List)|http://en.wikipedia.org/wiki/DNSBL|en]. Le risque est cette fois les faux positifs si par exemple vous utilisez une ip dynamique (ce qui reste le cas général, du moins en France). Pour peu qu’une personne qui ne vit pas loin de chez vous (et utilise le même FAI) soit un spammeur avéré, vous risquez de passer pour coupable et donc d’être interdit de « postage de commentaire ». Le risque était peu élevé avec les mails (concerne finalement peu de personnes, et est limité dans le temps), il l’est encore moins avec le « spamblog » puisque cette pratique est beaucoup moins répandue que le spam classique par mail. Un exemple de liste RBL spécialisée « messages frauduleux sur des blogs »: bsb.spamlookup.net * J’oublais une autre solution : combiner ces 3 méthodes 🙂 C’est ce que fait le projet [SpamLookup|http://bradchoate.com/projects/spamlookup|en].

2 réflexions sur « La lutte contre le spam contextuel s’organise »

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *