Comment Google redéfinit la notion de pertinence de l’information ?

6 mars 2014 4 06 /03 /mars /2014 11:18

Comment Google redéfinit la notion de pertinence de l’information ?

Google, au centre de toutes les attentions et des usages du web, vient encore de réduire ses filtres de recherche. Est-ce une adaptation aux usages réels ? Une volonté de nous insérer un peu plus dans des « bulles informationnelles » ? Ou affirmer sa volonté (intentionnelle ou non) de nous orienter vers ce qui est pertinent pour l’algorithme (et les portefeuilles des actionnaires) ?

Voici un petit texte rédigé dans le cadre d’un projet d’étudiants de l’IAE de Poitiers et qui devrait paraitre, avec d’autres, dans un livre blanc dans les semaines qui viennent. Il est donc à visée de "vulgarisation" (simplifié en somme -bien qu'il me semble que cela ne soit pas évident pour tout le monde...). Pour des réflexions plus poussées sur ce sujet, suivez les liens insérés dans le billet.

« Si tu ne sais pas, va voir sur Google »… Cette injonction, que nous avons tous entendu un jour, parait révélatrice de la place que le moteur de recherche de la firme de Mountain View occupe aujourd’hui. Comment trouver un restaurant près de chez soi ? A quelle date est sorti tel film ? Comment réparer un sèche-cheveux ? Autant de questionnements variés dont les réponses se trouvent dans le méandre de l’un des plus grands index documentaire au monde.

Comme souvent lorsque nous abordons la question de la recherche d’information, je demande à mes étudiants pourquoi ils utilisent Google et pas un autre moteur. Les réponses sont variées : c’est le plus ergonomique, il est par défaut dans de nombreux navigateurs, on ne connait que celui-ci… Mais la réponse phare est la suivante : parce que les résultats sont pertinents. Et c’est là toute la force de ce moteur. Des années d’affinement et de développement de l’algorithme de classement originel, le PageRank, ont permis à toute une génération d’utilisateurs d’Internet de faire correspondre les résultats du moteur à l’idée « d’information pertinente ». Mais est-ce la hiérarchisation des résultats qui est pertinente dans l’absolu ? Ou le fait de n’utiliser que Google qui, avec le temps et une certaine paresse cognitive, nous fait voir la pertinence par le prisme de l’algorithme du moteur ?

La réponse ne peut bien évidemment pas être si manichéenne. La question doit alors se déporter selon moi sur les critères de pertinence du moteur, tout en gardant à l’esprit que sans parler de « Google addiction » il y a bien dans notre pays une utilisation quasi-exclusive du moteur. Et que la notion même de pertinence[1] informationnelle doit être reconsidérée, et critiquée, à l’aune de ce que Google souhaite définir comme pertinent. De nombreuses recherches s’interrogent aujourd’hui sur le fonctionnement du moteur de recherche et l’emprise qu’il a sur notre quotidien de consommateurs d’information. Cette « anthropologie de l’algorithme » s’intéresse notamment aux fondements philosophiques et politiques ayant amené à la création du PageRank.

Les deux fondateurs de la firme ont, il faut le dire sans ambages, révolutionné le fonctionnement des moteurs de recherche. Leur principe, assez simple dans l’absolu, s’est basé sur la mesure bibliographique : plus une page web recevra de liens en provenances d’autres pages web, plus celle-ci sera bien classée (pour des mots-clés donnés) dans les résultats du moteur. Avec, bien entendu, un ensemble de critères de pondérations (statut de la page émettrice d’un lien, ~~ou audience~~ par exemple). Ce principe étant énoncé, il n’en reste pas moins que les effets du PageRank sur le traitement des données et la « mise en pertinence » des informations reste obscur.

Mais une dominante ressort néanmoins : ce qui est bien classé (le plus visible, donc le plus accessible) n’est pas ce qui est pertinent, mais ce qui est populaire. Par analogie, et toujours dans un contexte d’enseignement, cela reviendrait à demander aux étudiants : « parmi ces définitions, choisissez celle qui vous convient le mieux. Celle qui aura le plus de votes sera considérée comme définition de référence ». Si le principe est louable, et dans les faits relativement efficace, les effets en termes d’appropriation et de choix de l’information le sont moins. L’utopie des « foules intelligentes » et de la « démocratie numérique » que sous-tend en partie le modèle de Google ne résiste pas à des analyses plus profondes. Le statut accordé par l’algorithme à une page web (son volume de liens entrants, etc.) devient synonyme de son autorité, de sa légitimité à informer. C’est donc les sites ayant déjà de nombreuses interactions, faisant le plus de publicités, bref avec le plus de moyens financiers et humains, qui font autorité, laissant les plus petits sites dériver au-delà de la première page de résultats (celles « que personne ne consultent »). Et, contrairement à une certaine vision démocratique de ce fonctionnement, ce qui fait pertinence n’est plus ce qui répond à la question mais ce qui dépend du pouvoir accordé aux sites en fonction de leur respect des règles édictées par le moteur…

A l’heure actuelle, Google développe une nouvelle manière de classer ses résultats. Non plus en s’appuyant uniquement sur le document, mais sur l’auteur de celui-ci (l’AuthorRank). Cette « pertinence » qui fait son attractivité ne sera plus seulement renforcée par l’utilisation effrénée et sans recul du moteur. Mais elle se trouvera centrale dans notre consommation de l’information par l’ajout d’une couche algorithmique qui fait écho à nos besoins d’individuation : les résultats seront pertinents car produits et partagés par des personnes qui nous ressemblent. A force de ne trouver des réponses que par le prisme de nos pairs, ne risque-t-on pas de s’enfermer dans une cage (dorée certes) informationnelle dont seul Google aurait les clefs ?...

[1] Définissable en première instance comme la « Qualité de ce qui est adapté exactement à l'objet dont il s'agit » (selon le Trésor de la langue française informatisé)

Partager cet article

Repost0

Published by Camille A - dans Rayon Etonnement
commenter cet article …

tang

16/03/2014 11:11

La problématique se complique quand on connait ce que seront les accords de Google avec la commission européenne. Dans les faits, 70% des résultats de recherche présents sur la première page pourront être réservés à des publicités. Quand on connait la puissance des géants de l'internet dans l'intermédiation (exemple Booking, tripadvisor pour le tourisme), une Url pourrait se voir rapatrier en dehors des résultats des premières pages définitivement; Pour être explicite, un hotel et un camping pourrait si l'on frappe son nom, ne plus apparaitre dans des résultats sur les premières pages. La question de la pertinence des résultats dans leur présentation est de plus en plus d'actualité.

Christophe

07/03/2014 06:53

Déjà que les internautes ont du mal avec le fonctionnement du web, s'il faut en plus qu'ils comprennent le pourquoi et le comment des résultats qui leur sont proposés... Google a de beaux jours devant lui. <br /> <br /> Pour ma part, j'essaie de sensibiliser mes étudiants au fonctionnement des moteurs et des raccourcis/travers de ces derniers et force est de constater que pour la plupart il s'agit de véritables révélations. Étant des enfants du numérique et habitués à consommer des octets quotidiennement, mes étudiants se posent, pour autant, très peu de questions et notamment "comment font ces entreprises pour gagner de l'argent alors que tout est gratuit ?".

Jean Baptiste Mac Luckie

06/03/2014 12:35

Un bel exemple des travers de l'algorithme de Google sur la pertinence des informations est développé par Gérald Bronner dans La Démocratie des crédules. Il y montre de manière assez intéressante comment le moteur de recherche renforce notre tendance à chercher des informations qui confirment ce que l'on pense déjà (biais de confirmation) et que la popularité des résultats ne fait pas tout. Il prend notamment l'exemple des théories conspirationnistes.

06/03/2014 13:34

La liberté d'usage est certes réelle (quoique), mais Google joue un rôle tellement prépondérant dans nos activités en ligne qu'il est difficile de s'en extraire. <br /> <br /> A titre personnel, bien que je soutienne des initiatives autres en matière d'information (DuckDuckGo, prescription sociale etc.), je ne peux plus me passer des applications/technos Google. Le fait que Google aie fixé ses propres règles du jeu (redéfinition de la pertinence, SEO, authorship, capitalisme linguistique etc.) n'y est pas pour rien en ce qui me concerne.

Camille A

06/03/2014 12:52

(Le tout, encore une fois étant d'être "éduqué" à l'information, aux algos, etc.)

06/03/2014 12:51

Amusemment, car j'en parle beaucoup, de nombreux chercheurs critiquent cette notion de "bulle". Autrement dit, s'il s'agit d'une potentielle intentionnalité de la part de Google (un web en silos), pour autant les usagers ont toujours la liberté de s'ouvrir à d'autres choses (sérendipité, prescription, etc.). Après, la "liberté" (notamment d'usage) s'use quand on ne s'en sert pas...

Comment Google redéfinit la notion de pertinence de l’information ?

commentaires

Le nouveau blog!

Rechercher

Recherche

Gazouillis

Produits Frais

Catalogues

Liens