BLOG

Colibri, le nouvel algo Google

30 Sep 2013, Posté par D. Bocquelet dans Digital, Regard sur l'actualité

La nouvelle est tombée vendredi. Google vient de lancer (et de souffler ses 15 bougies) son dernier algo, Colibri (« Hummingbird »). L’annonce a été faite par Amit Singhal (prte-parle senior de la recherche) en comité restreinte, dans le garage de Menlo Park, loué il y à 15 ans par Brin et Page, maintenant la maison de Susan Wokcinki.

Contrairement à Panda et Pinguin qui s’attaquaient au spammeurs sortaient le gourdin contre les abus de SEO, le dernier-né des algorythme concocté par Mountain view en revient à l’essentiel : La Recherche. Ou plutôt, la longueur et la spécificité sémantique des requêtes tapées par les internautes. Et il touche déjà 90% des requêtes mondiales.

Avant de rentrer dans le vif du sujet, une remarque esthétique. Contrairement aux précédent bestiaire noir et blanc, le colibri est multicolore, sans doute une référence au logo google lui-même, et le symbole d’une retour aux sources, peut-être pour contrer la critique grandissante de « Google, flic du web », pour lequel le noir et blanc est en effet de rigueur (référence aux white hat/black hat, le bien/le mal.. etc.). Rappelons quand même la devise de la firme « don’t be evil ». Mais bon, on s’égare peut-être.

Le concept sous-tendu est la « recherche conversationelle »:

Our algorithm had to go through some fundamental rethinking of how we are going to keep our results relevant

Colibri en effet est annoncé comme une suite de modifications visant les requêtes et recherches longues tapées par les internautes. On sait que les SEO ont longtemps profité de ces requêtes pour mettre en place une politique d’URL « long tail », en utilisant au mieux leurs outils SEO, des balises ajustées,  et une URL réécrite via htaccess ou autre. C’était notamment très utilisé au niveau des E-commerces. Prestashop et Magento permettaient notamment lors de la rédaction d’une fiche produit de créér des URL incluant tous les mots-clés et caractéristiques produit ce qui les rendaient plus proches d’un « exact match » par rapport à une requête (pas une URL dynamique liée à une recherche sur le site, mais bien une URL « en dur »). D’autres ont abusé (et abusent toujours) de la « long tail », les pseudo-dictionnaires chargés de pubs google et autres fermes de liens. Certes, Google et Panda se sont chargé d’abattre quelque uns de ses sites dont le contenu (pauvre) était grossièrement et automatiquement traduit. Le but de ces usines a contenu était de faire de « l’exact match » en version industrielle pour récolter du trafic payant.

C’est là que le changement va être important, car plutôt que de se focaliser sur une « exact match », Google va chercher à affiner la sémantique de cette requête, (chaque mot est en effet traité comme un indice) avec pour objectif de savoir  « qu’est ce que l’internaute avait en tête ». L’effort est louable, mais bien sûr cela n’est pas anodin sur le plan financier. Il vise a diminuer le taux de rebond sur les liens commerciaux des pubs adwords en relation avec cette requête, donc les taux de transformations. Google tenterait-il je justifier ce progrès par une future augmentation de marge ?

Seul l’avenir nous le dira.

En attendant sur un registre plus « léger », Google en à profité pour annoncer un petit « plus » dans les requêtes, un comparateur, Knowledge Graph. Ce dernier se lance à partir d’une requête intégrant « vs » (versus) entre les deux mot-clés ou mots-clés composé. Pour ceux qui ne le savaient pas encore, Google avait déjà créé des utilitaires bien pratique à partir de la requête « to » faisant de la conversion par exemple d’inches  en centimètres, ibs en kilos, etc, ou encore « define » pour obtenir une définition d’un terme.