Newsletter Novalem Actualités et Tendances SEO-SEA !

Le formulaire anti-scraping de Google

Le "scraping" consiste à récupérer les contenus d'un site, pour les republier sur un autre. Comparable à du "vol" de contenu, cette pratique est très fortement déconseillée par Google.
Auteur
Clément Du-Crest
Chef de Projet Référencement

Qu’est-ce que le scraping, quel impact pour mon site, que faire si j’identifie un autre site qui réutilise mon contenu ?

Qu’est ce que le scraping?

Définition

Historiquement, le « scraping » (to scrap) en anglais désigne l’envoi à la casse, au ferrailleur, l’abandon de l’objet. Depuis quelques années, il peut aussi faire référence à la technique artistique de collage. Aujourd’hui, ce terme est aussi utilisé dans le secteur numérique pour faire référence à la récupération et l’exploitation de données via un outil informatique.

Les consignes de Google

Utiliser un outil pour extraire des données d’un site n’est pas pénalisant, mais reprendre ce contenu pour enrichir sa propre plateforme l’est.
Il n’est pas normal qu’un site puisse vous voler votre travail de recherche et de rédaction afin de le ré-utiliser sur son propre site. De plus, au yeux de Google, cela génère de la duplication de contenu, pratique condamnée par le moteur de recherche. La copie et ré-utilisation est parfois identifiée par l’algorythme mais l’intelligence artificielle du moteur n’est pas infaillible. Il arrive que Google pénalise les 2 sites, ou qu’aucun des sites ne soit touché. C’est pour cette raison que Google met en place un formulaire, afin d’être averti de ce type de pratique.
Les consignes sont claires :  » Si vous voyez une URL de scrap qui se positionne mieux que celle correspondant au contenu initial, prévenez-nous »

Comment fonctionne le scraping report ?

Comment peut-on identifier un contenu scrapé via un logiciel ?

La détection automatique de plagiat s’opère en 2 phases. La première consiste à accéder et enregistrer un contenu éditorial. La seconde à détecter les similitudes entre ce nouveau contenu et une base de données déjà constituée. Dans le cas de Google, celui-ci compare les nouveaux contenus qu’il enregistre avec son index de sites déjà existants.

Le principe du formulaire

Pour dénoncer le vol d’un contenu, il vous suffit d’indiquer :

google-scraper-report
Mais Google n’indique pas ce qu’il compte faire des URL soumises via ce formulaire pour le moment. Il est probable que cela ait un impact sur le référencement mais ce n’est pas officiel pour le moment.
Le formulaire scraper report

Les autres formulaires de Google

Google met à disposition des internautes de nombreux formulaires pour signaler des URL particulières au groupe :

L’ensemble de ces liens peuvent être retrouvés sur le mémo des formulaires Google de LIJE interactive.

Sources :
https://twitter.com/mattcutts/statuses/439122708157435904
http://searchengineland.com/google-scraper-tool-185532

Newsletter Mars 2014