Comprendre le fonctionnement de l’algorithme de Google

Si vous avez aimé l'article, partagez-le svp :
  •  
  •  
  •  
  •  
  •  
  •  

Google, qu’est-ce que c’est ?

Bonjour à tous, nous allons voir aujourd’hui comment fonctionne Google. il est important de savoir comment marche la machine, même si on ne va pas regarder tout très précisément dans ses rouages les plus infimes, mais il faut avoir une vision d’ensemble du fonctionnement de Google, comprendre comment Google réfléchit pour réfléchir à votre tour de la même façon et enfin pouvoir tirer votre épingle du jeu avec votre site internet visible sur Google sur les mots clés qui vont intéresser vos prospects. Pour commencer est ce que vous savez à quelle date est né Google ? En quelle année tout du moins. C’est en 1998, le 4 septembre plus précisément. Il faut savoir également que les créateurs sont deux associés: Larry Page et Sergeï Brin. Google a été racheté par sa maison mère, la société Alphabet, en 2015. Voilà pour un historique rapide. Intéressons-nous maintenant au succès de Google.

A quoi est due la popularité de Google ?

Est ce que vous savez pourquoi Google a tant de succès ? Déjà connaissez-vous la courbe d’évolution de la société Google ? 70 milliards de dollars en moins de 20 ans. 15% d’évolution chaque année. Les dépenses publicitaires sur Google ont même dépassé les dépenses publicitaires télévisés en 2014. C’est pour dire la puissance financière de cette société.

Comment Google maîtrise le web ?

Pour que vous aussi vous puissiez profiter de cette force de Google, je vais vous expliquer comment Google parcoure le web. C’est une sorte d’araignée qui va parcourir de fil en fil tout un réseau. Ces réseaux c’est la toile d’araignée. Chaque nœud de la toile d’araignée c’est une page web. Ces nœuds, ce sont les liens qui permettent de passer d’une page à une autre. Donc en fait on a une araignée qui tisse sa toile, cette araignée en fait c’est un robot, le « Googlebot », le robot de Google qui parcourt les pages de liens en liens. Dès que le robot croise un lien, il va voir ce qui se passe derrière ce lien et il ouvre une nouvelle page, et ainsi de suite. C’est pour ça qu’il faut avoir des liens vers votre site pour que Google puisse arriver sur le vôtre et prendre en considération votre contenu.

Mais alors, qu’est ce que Google fait de tous ces documents qu’il parcourt ? Il va en extraire les moindres informations. Quels sont les mots utilisés ? Quelles sont les images ? Quels sont les liens ? A quelle date la page a-t-elle été créée ? Etc, etc… Et ensuite ils décident : est-ce que je dois indexé cette page ? Qu’est-ce que l’index ? L’index de Google c’est la bibliothèque dans laquelle il range tous les documents qu’il a parcouru et qu’il a trouvé intéressant. Au passage pourquoi un document pourrait ne pas être intéressant pour Google ? Tout simplement parce que c’est du contenu dupliqué par exemple. Si vous reprenez le contenu déjà présent sur une autre page, Google ne veut pas s’embêter à revenir sur un site qui reprend des informations qu’il connaît déjà. Voilà pourquoi il est extrêmement important que toutes les pages de votre site ai un contenu unique. Nous y reviendrons plus tard.

Comment savoir qu’un site est connu de Google ?

L’indexation, c’est donc le fait d’indexer une page de faire en sorte que Google ai les pages de votre site dans sa bibliothèque. Pour savoir si une page est indexé il y a une requête à faire sur le moteur de recherche, c’est la requête « site : votre nom de site » et vous verrez ensuite comme ici qu’aucun document ne correspond au terme de recherche spécifié. Cela veut dire que Google ne connaît pas le site du nom « mon-nouveau- site.fr ». Normal j’ai pris un exemple qui n’existaient pas pour vous montrer ça. Si jamais le site existe ça va donner ce type de résultat. Donc on voit qu’il y a huit résultats et on voit ensuite le listing de ces différentes pages.

Comment Google positionne-t-il mon site ?

Mais alors est-ce que indexation et positionnements sont la même chose ? Pas du tout parce que Google peut très bien connaître votre site mais ne pas l’afficher sur les mots clés tapés par les utilisateurs. Dans l’exemple que nous avons tout de suite le site est connu par Google, il est indexé dans ses résultats pour autant si on tape la requête « yoga Toulouse » le site « chemin-yoga- toulouse.com » n’apparaît pas sur la première page, du coup personne n’ira le visiter en tapant ce terme là. Donc une requête, pour vous définir ça, une requête sur Google c’est le fait de taper un mot clé tout simplement ou une suite de mots clés dans le moteur de recherche. On appellera ça une requête.

Google est composé de plein d’algorithmes

Mais alors comment Google fait pour décider si ce site doit apparaître sur la première page de Google et comment influencer cela ? Alors il y a une formule mathématique très simple comme vous pouvez le voir ici. Alors on va l’étudier très précisément, on va en avoir pour 1h45.

Non je rigole. C’est vrai qu’il y a des algorithmes derrière Google très importants, des gros algorithmes mathématiques, pour autant on va pas se focaliser là dessus, le but c’est vraiment que vous compreniez comment ça fonctionne sans pour autant aller démonter tout le moteur et étudier pièce par pièce. Pour bien comprendre : Google a donc dans sa bibliothèque tout un tas de documents. Si on lui pose une question, donc une requête, un mot clé, comme ici « écran ergomètre pm5 », Google va parcourir tous ces documents pour savoir de quoi on parle. Ici on voit qu’il y a environ cinquante mille six cents résultats. Cela signifie que dans la bibliothèque de Google cinquante mille six cents documents parlent d’écran d’ergomètre pm5. Alors qu’est ce que c’est qu’un écran ergomètre pm5 me direz vous. C’est très simple pour Google car en comparant ces résultats il va voir les termes qui reviennent le plus souvent dans les documents trouvés. Et il va nous afficher les résultats en conséquence. Ici on voit qu’en tapant ce mot clé là il nous sort des résultats de vente d’un rameur concept 2. Donc l’écran pm5 c’est en fait l’écran digital qui sert sur les rameurs concept 2 et un ergomètre c’est un mot synonyme on va dire du rameur. Vous voyez déjà toute l’importance d’avoir ces mots clés là dans son contenu pour pouvoir ressortir sur des requêtes des utilisateurs qui ne seraient pas directement le nom du produit lui même. On y reviendra plus tard pour optimiser justement votre contenu et pouvoir ressortir surtout les mots clés liés aux produits ou services que vous vendez.

Les pages ont des scores

Le Pagerank c’est l’algorithme développé par Larry Page notamment, on a vu que c’était un des fondateurs de Google pour pondérer justement les résultats des documents retrouvés dans sa bibliothèque en fonction de la notoriété de ces documents. Je vais vous montrer comment ça fonctionne Je vais vous expliquer la notion de « surfer aléatoire ». On part du principe qu’un document a un score. En haut à gauche on voit que le score est de 100. Si cette page fait deux liens à deux pages différentes, la moitié de son score va être distribué à ces deux pages. Donc cent divisé par deux sa donne 50, on voit qu’il y a une flèche qui distribue 50 à une page est une autre 50 à une autre page. D’accord ? En dessous le document vaut 9 il fait 3 liens, 9 divisé par 3 est égal à 3, du coup chaque lien va distribuer un score de 3 aux pages vers lesquels il fait des liens, d’accord ? C’est comme ça qu’on augmente notre popularité. Plus on va avoir de liens depuis des pages fortes, qui font peu de liens du coup pour qu’ils nous renvoient beaucoup de force, plus notre page va augmenter en force. Ça c’est la version simpliste. Si on prend en compte le surfeur raisonnable qui est effectivement celui qui est pris en compte par Google on voit que chaque lien ne se vaut pas. Là pour l’exemple la page à un poids de 1. Il fait deux liens, on aurait pu penser que chacun des liens auraient valus 0.5 mais non un vaut 0,6 et l’autre 0.4. Ce qui signifie qu’il y a d’autres éléments à prendre en compte qui vont influencer sur la qualité d’un lien et sur le poids possiblement donné par ce lien à une autre page. On reviendra plus tard sur ces critères pour que vous aussi vous puissiez avoir des liens qui pointent vers votre site qui vous envoient beaucoup de popularité. C’est ce qu’on appelle le jus de lien.

Une méthode simple pour savoir si Google connaît votre site

Je vais maintenant vous montrer comment regarder dans Google combien de pages Google connaît deux vous et a rentré dans son index. On va pivoter sur le navigateur internet sur un exemple d’un site m’appartenant. C’est une boutique en ligne. Voilà. « site : http : slash www.deguiz-fetes.fr ». On voit le nombre de résultats ici 10200 résultats. Donc ça peut paraître beaucoup c’est normal c’est une boutique en ligne. On voit un chiffre là, 0,24 secondes ce n’est pas la peine d’y accorder de l’importance. C’est juste le temps de génération des résultats par Google. Donc il y a beaucoup de pages parce que c’est une boutique en ligne, on peut faire un autre test avec mon site de consultants de référencement. Donc voilà on voit que c’est un site vitrine y a beaucoup moins de pages déjà, on est à 164.

On va prendre un exemple d’un site qui n’existe pas. Si vous avez cette réponse là, « aucun document ne correspond au terme de recherche spécifiés », et que vous ne vous êtes pas trompés sur l’écriture de votre nom de domaine, c’est qu’il y a un problème Google ne connais pas votre site. Il vous sera donc impossible de ressortir sur la moindre recherche de l’internaute.

Pour récapituler…

Nous avons vu aujourd’hui comment fonctionne Google donc il y a un robot qui parcourt les différentes pages et qui va de lien en lien. Il rentre ensuite les documents dans sa bibliothèque, ce qu’on appelle l’index, et il décide ensuite de vous positionner, ou pas, sur les mots clés tapés par les internautes. Pour cela, il va comparer les documents entre eux pour savoir lequel est le plus pertinent d’après les mots clés qu’il va retrouver dans tous ses documents, et ensuite il va pondéré ça avec votre popularité c’est à dire le nombre de liens qui ont un poids important qui pointe vers votre site.


Si vous avez aimé l'article, partagez-le svp :
  •  
  •  
  •  
  •  
  •  
  •  
  •  
    6
    Partages
  • 4
  • 2
  •  
  •  
2 réponses
  1. David
    David says:

    Petite question l’opérateur site: ne semble pas toujours donné la bonne réponse en matière de pages/ressources indexées par google. de temps à autre les résultats sont différents sur un même sites, d’autre fois il donne un résultats très élevé mais a partir de la page 10 il n’y a plus rien.
    Partagez vous ces constatations ?

    Répondre
    • Matthieu
      Matthieu says:

      Bonjour David,

      je partage en effet ces constatations. Il faut savoir que Google utilise de nombreux datacenters pour afficher les résultats, ce qui explique certaines variations des résultats lorsque l’on refait la même recherche à 1 seconde d’intervalle.

      Quant aux résultats qui se limitent une fois que l’on arrive à la page 10, je le constate également, et ma supposition est qu’il connaît d’autres pages, mais auxquelles il accorde moins d’importance, et qui appartiendraient donc à l’index secondaire de Google. Ce sont des pages qu’il connaît, mais qu’il ne trouve pas pertinentes et qu’il ne fera donc pas ressortir sur des requêtes d’internautes.

      Répondre

Répondre

Want to join the discussion?
Feel free to contribute!

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *