Pressentie comme l’une des tendances incontournables de l’année 2019 sur la sphère digitale, l’intelligence artificielle a le vent en poupe. Le monde du SEO n’est pas épargné par ces profondes mutations. C’est ce que prouve notamment l’importance croissante de l’algorithme RankBrain, un système intelligent greffé à Google qui a vocation à mieux décrypter les requêtes des internautes. Son but ? Que le moteur de recherche apporte des réponses encore plus pertinentes aux utilisateurs en se plaçant au plus proche de ses intentions de recherche.
Retour sur l’historique et le fonctionnement de l’algorithme, son impact sur le SEO en général ainsi que les bonnes pratiques à suivre pour dompter RankBrain.
Qu’est-ce que RankBrain ?
Introduit dès 2015 par Greg Corrado, Senior Research Scientist chez Google, RankBrain est devenu un pilier fondateur du SEO en quelques années seulement. Cet algorithme est d’ailleurs intimement lié à Hummingbird. Nous pouvons dire avec certitude que l’algorithme est devenu aujourd’hui l’un des ranking factors les plus importants. Depuis de nombreuses années, la firme de Mountain View investit massivement dans les recherches liées au machine learning et à l’intelligence artificielle. RankBrain est l’un de ses premiers produits lancés sur le marché et testé à grande échelle.
Un cerveau artificiel mis au service de vos recherches
L’analyse du nom RankBrain nous permet d’entrevoir en quoi consiste ce fameux algorithme. Au programme : un savant mélange d’apprentissage automatisé et d’intelligence artificielle qui repose sur un réseau neuronal. Le principal enjeu de RankBrain est d’améliorer la compréhension de la façon dont les utilisateurs interagissent avec le moteur de recherche et pourquoi ils choisissent de consulter tel résultat de recherche plutôt qu’un autre. Sa mission consiste à traduire la requête de l’internaute pour mieux l’interpréter.
Grâce à cette IA, RankBrain fait le lien entre plusieurs requêtes qui semblent d’apparence différentes mais qui convergent vers les mêmes résultats.
Mieux comprendre les requêtes des utilisateurs
Au-delà du sens des mots-clés, RankBrain se concentre plus précisément sur le sens réel des requêtes complètes, et par extension des phrases ou questions dans leur ensemble. L’analyse sémantique prend alors tout son sens.
Aujourd’hui, Google est devenu capable de comprendre et d’interpréter des requêtes qui n’ont jamais été faites auparavant via un système très poussé de corrélation. Particulièrement intéressant et puissant sur des requêtes de longue-traîne, RankBrain arrive à re-situer un mot ou un concept à l’intérieur d’un corpus de mots. Un sacré pas en avant pour les internautes qui peuvent désormais compter sur les performances de Google pour comprendre ce qu’ils attendent encore mieux qu’un humain !
Le fonctionnement de RankBrain
En tant qu’utilisateur du moteur de recherche, impossible donc de savoir si une de nos requêtes est traitée par RankBrain ou non. Ce que nous savons, c’est que l’algorithme traite actuellement 15% des requêtes. Ce pourcentage est évidemment voué à augmenter au cours des prochaines années.
Moteur de recherche : comment ça marche ?
Pour mieux appréhender le fonctionnement de RankBrain, il est important de comprendre celui d’un moteur de recherche.
Avant de pouvoir proposer des résultats de recherche suite à une requête, les Googlebots doivent explorer et indexer des milliards de pages. Pour cette raison, l’optimisation du budget de crawl est très importante pour le SEO de votre site ! Ensuite, une analyse pointue des contenus assortie d’une évaluation basée sur les principaux ranking factors permet d’établir un classement.
Source : OnCrawl
Pour en savoir plus sur ce volet, consultez notre guide dédié aux moteurs de recherche.
Côté utilisateur, on distingue 3 types de requêtes : transactionnelles, informationnelles et navigationnelles. Si Google n’est pas encore en mesure de comprendre le contenu au sens littéral du terme, il arrive aisément à en dégager les grands axes et les thèmes abordés. Comment est-ce possible ? RankBrain détecte les entités nommées et constitue des matrices qui serviront notamment à définir le classement des résultats. Chaque type de requête correspond donc à un résultat de recherche différent. De même, l’algorithme évalue la similarité entre deux contenus.
Exemples :
- ” Nike Air Max ” est une requête qui sert à atteindre la page produit du site de la marque Nike (requête navigationnelle).
- ” Sneakers Nike blanches femme pas chères ” va mener vers des résultats de sites e-commerce qui vendent des baskets Nike en promotion car il y a une vraie intention d’achat derrière cette requête (requête transactionnelle).
- ” Comment entretenir mes baskets Nike en cuir ? ” va conduire l’utilisateur vers des pages apportant des conseils sur l’entretien du cuir et des baskets en général du type Wiki (requête informationnelle).
L’IA de Google prend la relève
Jusqu’à l’arrivée de RankBrain, les ingénieurs Google étaient en charge d’effectuer les mises à jour d’algorithmes. Mais depuis, c’est bel et bien l’algorithme qui est mis à contribution. Et les résultats sont au rendez-vous : RankBrain permet de fournir des résultats environ 10% plus précis qu’un ingénieur. Les équipes techniques misent de plus en plus sur cet algorithme qui est amélioré en permanence par le biais du machine learning pour satisfaire au mieux les requêtes des utilisateurs.
Pour affiner sa connaissance des usages et attentes des utilisateurs du moteur de recherche, RankBrain multiplie les tests pour déceler quels sont les résultats les plus pertinents. Au même titre qu’un expert en webmarketing va mettre en place des campagnes d’A/B testing sur un site pour identifier quel design, quel bouton, quelle couleur, quel texte permettent d’obtenir le plus de conversions, RankBrain va fournir différents résultats pour une même requête et analyser ce qui fonctionne le mieux, ce qui plaît le plus aux utilisateurs.
Là où RankBrain se différencie, c’est au niveau de ses facultés d’auto-apprentissage. Elles lui servent entre autres à ré-orienter ses résultats de recherche lors de recherches ultérieures. L’objectif est toujours le même : proposer une expérience utilisateur personnalisée et en phase avec les attentes de l’internaute.
Appliquée au domaine du SEO, la notion d’IA intégrée à RankBrain est complétée par le machine learning, qui donne à l’algorithme toute sa puissance.
Machine Learning et Deep Learning : l’avenir de la recherche
À l’horizon 2020, le monde des nouvelles technologies est de plus en plus modelé par le machine learning et le deep learning. Aujourd’hui, les SERPs sont ajustées automatiquement par le biais du machine learning qui repose sur toutes les données collectées jusqu’à présent pour établir le classement le plus pertinent.
Le deep learning est actuellement le domaine le plus prometteur de l’univers du machine learning. Il est basé sur des réseaux de neurones qui ont besoin d’un grand volume de données pour auto-apprendre, tel un autodidacte. Les réseaux neuronaux ont été introduits pour la première fois dans les années 1930, mais ils se développent véritablement depuis seulement 3 ou 4 ans, au fur et à mesure que la puissance de calcul des ordinateurs augmente.
Ce schéma très parlant met en lumière le fonctionnement de Google avec RankBrain :
Source : Oncrawl
Selon Greg Corrado, créateur de RankBrain, la conjugaison du machine learning et de l’IA pourrait être aussi révolutionnaire pour notre société que la création d’internet. Ces nouvelles technologies révolutionnent complètement le traitement des données et ouvrent de nouvelles perspectives à la recherche.
RankBrain est à l’heure actuelle l’algorithme le plus sophistiqué et le plus abouti que Google ait mis au point. Pour arriver à constituer un algorithme de machine learning, une immense quantité de données est nécessaire à la production et à l’entraînement des différents modèles d’analyses.
Comment optimiser son site pour RankBrain ?
Pour faciliter le travail de RankBrain et maximiser vos chances de ressortir dans les résultats de recherche lorsque cet algorithme est mis à contribution, quelques bonnes pratiques sont à assimiler.
Privilégier les synonymes aux répétitions de mots-clés
Derrière RankBrain se cache une analyse sémantique très pointilleuse et une vraie notion de TAL (Traitement Automatique du Langage). Le temps où le bourrage de mots-clés avait encore ses chances de fonctionner est bel et bien révolu !
Pour multiplier vos chances de positionner votre site sur des SERPs générées par l’algorithme intelligent, nous vous conseillons vivement de diversifier au maximum votre univers sémantique, tout en restant cohérent, évidemment.
L’enjeu consiste à comprendre exactement quels types de requêtes permettent aux internautes d’atterrir sur votre site et d’optimiser votre site en conséquence. Avec RankBrain, la SERP proposée sur une requête transactionnelle est totalement différente de celle proposée sur une requête informationnelle.
Voici un exemple de résultats de recherche sur une requête transactionnelle :
Et voici la SERP générée par une requête informationnelle :
Généralement, la priorité est donnée aux requêtes transactionnelles pour les SERPs de RankBrain. Pour maximiser vos chances de vous positionner, vous pouvez utiliser les Rich Snippets pour mettre en avant les prix et avis. L’utilisation du balisage Schema.org est vivement conseillée.
Pour ressortir sur une requête informationnelle, préférez des articles de fond, agrémentés de sources fiables et de listes à puces pour une meilleure lisibilité. Un h1 qui contient une question pourra plus facilement aller chercher la position zéro.
Pour la requête navigationnelle, étudiez précisément les volumes de recherche de vos mots-clés stratégiques pour optimiser votre balise Title en conséquence.
RankBrain est capable de comprendre les relations entre les différentes entités, ce qui élargit clairement le champ des possibles. Google accède à un dictionnaire presque exhaustif – en tout cas mis à jour en temps réel et en permanence – de tous les synonymes possibles pour chaque mot. Il est également capable d’identifier les liens entre différents mots, concepts, groupes de mots… Cela permet d’aboutir à la construction des entités nommées :
Source : OnCrawl
Des outils comme Semji s’appuient eux aussi sur l’Intelligence Artificielle pour vous aider à rédiger des contenus pertinents pour Google et pour les internautes. Envie d’en savoir plus sur notre solution ? Demandez-nous une démo !
Analyser les contenus des concurrents positionnés dans le Top 3 Google
Au-delà de l’analyse du comportement de l’utilisateur face aux résultats proposés sur la SERP, RankBrain tient compte de tout le chemin parcouru : temps passé sur le site, visite d’autres sites puis retour sur le premier, CTR, taux de rebond, liens cliqués… Google met tout en oeuvre pour que l’internaute trouve du premier coup ce qu’il souhaite et n’ait pas à poursuivre ses recherches. Google veut clairement s’imposer comme l’outil capable d’apporter LA meilleure réponse.
Avec RankBrain, votre score sémantique est calculé en fonction des performances des concurrents. Il est donc pertinent d’étudier quelles typologies de pages concurrentes ressortent sur telle requête pour construire sa stratégie de contenus.
Grâce notamment à Ahrefs, vous pouvez facilement identifier de nouveaux mots-clés et enrichir votre champ sémantique.
Source : Ahrefs
Prenons l’exemple d’un site e-commerce qui vend des compléments alimentaires pour chien. Il s’inscrit logiquement dans une SERP e-commerce qui propose des sites spécialisés dans les produits et compléments alimentaires pour animaux. Cependant, personne (ou presque) n’effectue de requêtes transactionnelles à proprement parler sur ce marché de niche.
Par contre, on constate que les acheteurs de ce type de produits vont plutôt atteindre un site par le biais d’une requête informationnelle du type “ Comment rendre le poil de mon chien plus brillant ? “ ou “ Comment soigner les coussinets de mon chien ? “. Ces données nous indiquent qu’il est préférable d’opter pour des contenus enrichis et experts qui couvrent la thématique du site. Au contraire, l’erreur sera de tout miser sur les fiches produits qui peineront à se positionner sur les mots et requêtes clés de ce e-commerce.
Nourrir au maximum le champ lexical et champ sémantique
La connaissance de Google s’étend un peu plus chaque seconde. Avec plus de 450 millions de nouvelles requêtes chaque jour, les ingénieurs ont largement de quoi entraîner intensément leur algorithme !
Avant d’aborder la question du “ Pourquoi ? “, penchons-nous déjà sur les différences entre champ lexical et champ sémantique. Souvent confondues mais pourtant différentes, ces deux notions se distinguent par quelques subtilités.
Le champ lexical regroupe tous les mots qui tournent autour du même thème. Par exemple, le champ lexical du SEO se compose par exemple de : mot-clé, netlinking, backlinks, balises, site, trafic…
Le champ sémantique quant à lui englobe toutes les définitions d’un même mot qui change selon son contexte. Par exemple :
- je mange une orange -> fruit
- je pars en vacances à Orange -> ville
- j’ai un tee-shirt orange -> couleur
- j’ai un abonnement internet chez Orange -> marque
Pour chaque entité nommée, Google est capable d’identifier :
- les phrases qui contiennent cette entité,
- son contexte habituel,
- les mots et expressions qui l’accompagnent le plus souvent,
- le contexte d’utilisation avec une seconde entité.
Source : Oncrawl
Grâce à cet amas de connaissance, RankBrain est donc capable d’orienter les résultats de recherche en fonction du contexte de chaque requête.
Ainsi, pour une requête donnée, Google essaye au maximum de situer le contexte de l’utilisateur qui formule la requête pour pouvoir lui proposer la réponse la plus adaptée.
Pour chaque expression travaillée, il est désormais crucial de tisser autour un champ lexical le plus riche et exhaustif possible. Ce travail de fond permet aussi à l’algorithme d’étendre sa connaissance d’un domaine et de consolider certains liens, ou d’en créer des nouveaux.
Clusteriser stratégiquement les contenus et thématiques du site
Pour séduire RankBrain, il est important de construire un site et son contenu en tenant compte des attentes des Googlebots, évidemment, mais aussi et surtout des internautes. Cela implique de cartographier avec précision les différents types de contenus présents sur votre site ainsi que les catégories de pages.
Google prend de mieux en mieux en compte le siloing et le maillage interne des sites. Pour faciliter le crawl, vous pouvez siloiser l’architecture technique avec un méga menu en structure d’entonnoir.
Un bon moyen de différencier votre contenu de celui des concurrents est de vous concentrer davantage sur le sujet à traiter que sur les mots-clés stratégiques qui le définissent. Cela revient tout simplement à laisser un humain écrire pour un humain…
Pour mettre davantage votre contenu en valeur, la construction en cluster thématique ou en silos est donc fortement appréciée.
Cette démarche prend du temps c’est pourquoi des outils comme Semji sont désormais capables de vous livrer en quelques secondes les principaux clusters thématiques à aborder dans un contenu. Demandez-nous une démo et découvrez comment Semji vous aide à rédiger des contenus plus performants en moins de temps !
Le plus gros challenge de RankBrain consiste à rendre l’ensemble des mots et expressions utilisés par des humains compréhensibles et surtout interprétables par des robots. En effet, Google concentre toutes ses forces dans l’utilisation du Word Embedding qui consiste à vectoriser les mots par le biais d’un réseau de neurones.
Source : SEO Quantum
D’une façon plus générale, siloing et cocon sémantique permettent de gagner en performance SEO. Alors, pourquoi s’en priver ?
En 2019, quel sera l’impact de RankBrain sur la recherche ?
À la question “ Est-ce que RankBrain bouleverse les codes du SEO ? “, la réponse est : Oui, mais à un degré différent.
RankBrain repose essentiellement sur 3 concepts clés :
- les signaux appliqués aux requêtes : il est plus que jamais indispensable de distinguer l’intention de recherche qui se cache derrière une requête et d’y faire correspondre le contenu le plus adéquat. Est-ce que l’utilisateur cherche une information fraîche ou au contraire un contenu très expert et fouillé sur un sujet de niche ?
- les signaux liés à la réputation de votre site web : RankBrain va se servir de la réputation et l’environnement que vous avez bâti autour de votre site. Cet indicateur sert à déterminer dans quel contexte vos contenus seront proposés à l’utilisateur.
- les mots-clés associés à chaque page : le SEO se transforme doucement à ce niveau-là. La technique du regroupement de mots-clés logiquement liés au sein d’une seule et même page est désormais vu comme étant plus pertinent que le fameux “ un mot-clé par page “. Gardez à l’esprit que Google devient de plus en plus intelligent et qu’il sera de plus en plus difficile de le berner. Sinon, gare aux pénalités Google !
Avec la qualité du contenu et le netlinking, RankBrain se place désormais parmi les 3 critères de classement les plus importants pour Google. Par nature, l’algorithme RankBrain apprend de lui-même et est donc voué à se transformer en permanence. Votre stratégie SEO doit se calquer sur le même modèle, c’est-à-dire être capable de s’adapter rapidement aux évolutions et rester en phase avec les attentes réelles des utilisateurs. Vous savez ce qu’il vous reste à faire !