Google : des documents secrets dévoilent comment la firme décide qui est visible sur Internet

Une fuite massive de documents interne à Google montrent comment le géant du Web choisit qui s'affiche ou non dans ses résultats de recherche. De nombreux critères apparaissent alors que la firme a toujours nié leur utilisation.

Google
Crédits : 123RF

C'est un véritable séisme qui fait trembler le monde du SEO (Search Engine Optimization, où les méthodes pour être bien placé dans la recherche Google). Mais les secousses ne se limitent pas à ce secteur puisque les implications sont bien plus larges. Une fuite massive de documents internes à Google lèvent le voile sur l'un des secrets les mieux gardés de la firme : comment fonctionne son moteur de recherche ? Et plus précisément, comment décide-t-il qui doit apparaître dans les premiers résultats ?

Lire aussi – Google veut révolutionner la recherche sur smartphone grâce à l’IA

De très nombreux éléments de réponse ont été donnés par l'expert SEO Rand Fishkin après qu'il a reçu les fichiers d'une source à l'origine anonyme et désormais connue, Erfan Azimi, fondateur de EA Eagle Digital. Environ 14 000 critères sont listés, et toutes les personnes ayant pu jeter un œil dessus sont unanimes : beaucoup contredisent les discours tenus par la société. Fishkin résume d'ailleurs les informations ainsi : “Je pense que le plus important à retenir est que ce que disent les représentants publics de Google et ce que fait le moteur de recherche Google sont deux choses différentes“.

14 000 critères de classement révèlent le fonctionnement de la recherche Google

Parmi les 2 500 pages publiées, on note par exemple la présence d'un critère nommé “homepagePagerankNs“. Pour résumer, il sert à déterminer si un site est populaire ou non en mesurant les clics effectués dessus, ce que Google s'est souvent défendu de faire. La conséquence est très directe puisqu'un site efficace à ce niveau pourrait être mieux référencé qu'un autre donnant pourtant une réponse plus pertinente à une recherche donnée.

Lire aussi – Google : voici pourquoi les résultats de recherche sont de moins en moins bons

Autre aspect que Google affirme de pas utiliser dans son moteur de recherche : le score d'autorité. Il mesure si un site est digne de confiance sur un sujet précis. Or, les critères “isElectionAuthority” et “isCovidLocalAuthority” apparaissent clairement dans la liste. Le problème est que rien n'indique comment ils sont déterminés. Kristen Ruby, PDG du Ruby Media Group, parle d'une situation problématique. “Comment Google définit-il une autorité dans ces domaines critiques ? Je ne devrais pas avoir à deviner quelle est la réponse. Google devrait prendre les devants et me la donner“.

Bien que Google soit une entreprise privée, donc non tenue d'expliquer en détail le fonctionnement de ses services, l'expert SEO Mike King estime que ce droit ne peut s'appliquer ici. “Je pense qu'il est vraiment important qu'ils fournissent ce genre de discernement en matière d'information, car que cela nous plaise ou non, Google est dans les faits un service public. […] Nous le considérons comme la principale source d'information sur le Web“. La firme ne semble pas le voir ainsi cependant.

Google confirme la véracité des documents, sans préciser si l'on peut s'y fier

Un porte-parole de Google a réagi à la fuite, mais sans véritablement répondre à toutes les interrogations soulevées. L'entreprise invite simplement à la prudence : “Nous vous déconseillons de formuler des hypothèses inexactes sur la recherche [Google] en vous basant sur des informations hors contexte, obsolètes ou incomplètes“. Il est donc pour l'instant impossible de savoir ce qui est vrai ou faux dans les documents, ni même si leur révélation au grand public aura un impact quelconque sur le fonctionnement futur du moteur de recherche.

Lire aussi – Google : les résultats de recherche vont changer, et pas forcément en bien

Cette réponse énerve Rand Fishkin au plus haut point et l'homme n'hésite pas à le faire savoir. Pour lui, c'est “un exemple parfait de la raison pour laquelle les gens n’aiment pas ou ne font pas confiance à Google. Il s’agit d’une non-déclaration qui ne répond pas à la fuite, n’apporte aucune valeur et pourrait bien avoir été écrite par une IA formée sur les déclarations de l’entreprise la plus dépourvue d'âme de la dernière décennie“. C'est dit.

Source : Gizmodo

Voir les commentaires
Ailleurs sur le web