Newsletter Novalem Actualités et Tendances SEO-SEA !

Big Data : influence et perspectives en SEO et SEA

Présenté comme le grand défi des années à venir, le Big Data n'est pourtant pas une solution précise à certaines problématiques marketing. Le point sur les usages et opportunités.
Auteur
Lucas Salome
Consultant Search Intelligence

A l’origine du Big Data, se trouvent le tri, la recherche et le traitement de données en grand volume. Les moteurs de recherche (Google et Yahoo principalement) en sont aujourd’hui à la fois les créateurs et les utilisateurs, qu’il s’agisse de techniques ou d’algorithmes. Grand consommateur de ressources (temps processeur, volume de données), le Big Data est au final un domaine qui se révèle indispensable au traitement non discriminatif de données. En Search Engine Marketing (SEM : SEO et SEA), le volume toujours plus important de données appelle à réfléchir à des techniques différentes de traitement de l’information, qui trouveront un écho dans les techniques de Big Data. Quelles sont donc les évolutions à venir dans le domaine du SEO et du SEA?

Les usages actuels du Big Data

Concernant le Big Data, il est possible de séparer en trois piliers les domaines des technologies, des outils ainsi que des usages.

Dans le domaine du SEM, les usages sont bien entendu les plus importants et les plus visibles, tandis que les outils et les technologies, bien qu’utilisées par les professionnels, ne seront pas obligatoirement connus du grand public.

Un des premiers usages du Big Data est connu sous forme d’algorithmes de classement, comme par exemple pour les plus connus tels que les algorithmes de Google : Penguin ou Panda. Pour ces deux outils qui procèdent en partie à l’évaluation des sites Internet, le volume de données traitées est tel, qu’il est inconcevable à l’heure actuelle de lancer ces évaluations en continu, ce qui explique en majeure partie les écarts de temps entre les vagues de pénalités.

Du point de vue du moteur, le Big Data est ainsi utilisé pour l’évaluation en masse à la fois des contenus des milliards de sites web référencés, mais également des différentes relations qu’ils entretiennent (les liens externes, qui représentent un des outils de la popularité d’un site). Cela est ainsi à l’origine des pénalités (en cas d’abus par exemple, comme affiché dans Google Webmaster Tools), ou à l’inverse des améliorations qu’il est possible de constater. Avec un bémol cependant : le taux de rafraîchissement des données à l’origine des positions et pénalités, qui peut ainsi prendre plus de 6 mois dans le cas de Penguin.

Pour un administrateur ou une agence web, le Big Data représente également une véritable opportunité dans certains domaines :

 

Les outils à disposition pour exploiter les données

Selon les objectifs, différents logiciels existent afin de réaliser l’exploitation des données provenant de votre site, ou d’un service tierce-partie (on pense notamment aux services d’analytics tels que Google ou AT Internet, mais également Amazon Web Services pour l’infrastructure technique).

Pour la partie « performance », qui inclut également de nombreuses données de pertinence du point de vue du référencement (niveaux d’indexation, erreurs…), plusieurs solutions open-source existent. La plus connue, utilisant Logstash (tri des données), Elastic search (moteur de données) ainsi que Kibana (interface graphique), est à l’heure actuelle un excellent moyen pour un administrateur de surveiller un site, même de très grande importance.

L’exploitation de telles données est cependant à considérer de façon indépendante de toute action SEM, car la mise en place d’un tel outil peut nécessiter plusieurs semaines de déploiement. Il s’agit en revanche d’une formidable opportunité pour des sites extrêmement conséquents (dans le cas d’un site e-commerce avec plusieurs milliers d’articles, par exemple) de réaliser une surveillance semi-automatisée.

logstash search

 

 

 

 

 

 

 

 

 

 

 

Concernant les critères essentiels du référencement au niveau du contenu texte, le Big Data est également un outil global dont la montée en puissance est de plus en plus visible. Qu’il s’agisse des outils mis à disposition par les moteurs eux-mêmes (Google Analytics, Webmaster Tools mais également Adwords) ou par des services tiers (Xiti, SeeURank…), de plus en plus de solutions sont disponibles afin d’analyser en volume certaines données.

Tandis qu’il y a peu, l’analyse d’un cocon sémantique pertinent pour un site web nécessitait une extraction de données entièrement manuelle, il est désormais possible d’établir rapidement une liste des principales recherches et orienter le travail des équipes œuvrant à la réalisation d’une étude lexicale. Cependant, dans ce cas précis, le Big Data n’est pas encore une solution idéale : conçu pour le traitement en masse de données, la compilation et l’analyse des termes lexicaux les plus pertinents pour un site web n’en sera pas pour autant facilitée. Avec le tri des données, les recommandations ainsi que l’analyse des concurrents, de très nombreux éléments restent encore à charge, sans compter la rédaction qui, elle, n’est pas prête d’être automatisée ! Des gains qui ne sont cependant pas à minimiser, car l’intérêt des éditeurs de solutions pour cette problématique précise est largement porteur de promesses.

seo benchmark

 

 

 

 

 

 

 

 

 

 

 

 

 

Les promesses du Big Data en SEO et SEA

Une véritable réflexion est ainsi en train de se développer autour des deux problématiques du SEM : performance et pertinence, tant au niveau des technologies que des contenus.

Avec pour avantage des outils permettant une surveillance améliorée de certains paramètres essentiels à la performance du Search, les gains principaux résultent en une réactivité améliorée, ainsi qu’un périmètre d’action élargi, et ce quel que soit le domaine. Ces outils et techniques attribués au Big Data apportent également un nouvel essor dans la compétition, ce qui risque de modifier considérablement le paysage du SEM dans les mois et années à venir (grâce à une utilisation croisée et semi-automatisée des données). Une stratégie gagnante tant pour les entreprises, que les agences web, pour lesquelles l’intelligence des choix stratégiques effectués sur les outils et techniques prendront le chemin de la Big, mais surtout, « Smart Data ».

 

Newsletter Février 2015