Dominique Cardon sur le classement de l’information sur le web | Territoires Web

Cet été, peut-être avez vous entendu parler d’Eli Pariser. Activiste, ancien directeur de l’ONG MoveOn.org, il a tenté avec le livre The Filter Bubble : what Internet is hiding from you, d’attirer l’attention sur la question de l’importance des résultats donnés par google. Selon Pariser, il est dangereux que les grands acteurs de la classification du web utilisent ce qu’ils savent de nous pour nous restituer des résultats taillés à la mesure des traces que nous avons laissés dans la mémoire des ordinateurs.

Mercredi soir, à la Cantine, vous n’étiez peut être pas au courant de la conférence : référencement et réseaux sociaux, organisée par le Social Media Club France. Voici une séance de rattrapage d’une partie de la conférence.

Rattrapage du rattrapage

Le référencement est un des secret de la visibilité sur le web. Dans sa version payante ou naturelle, le référencement vise à améliorer la position d’un site web dans les résultats affichés par les moteurs de recherche. Cet activité revêt un enjeu énorme quand on sait que les moteurs de recherche figurent parmi les premiers apporteurs de trafic d’un site web.

Les réseaux sociaux constituent une nouvelle frontière du web : des territoires qui bénéficient d’une attention énorme parce que c’est là que se situerait la valeur. Si vous suivez les courbes de temps passé sur facebook, les blogs ou twitter, vous savez l’importance acquise par ces services auprès des internautes.

Aujourd’hui, google et facebook sont les deux sites qui concentrent le plus d’attention dans le monde (source : alexa).

L’objet de la conférence était de s’interroger sur les enjeux du déplacement du centre de gravité du web depuis les moteurs de recherche vers les réseaux sociaux, notamment en terme de référencement et de visibilité.

Toutefois, ce sont les propos de Dominique Cardon que je voudrais mettre en valeur, car les mots et le recul d’un chercheur qui s’intéresse de près aux transformations de l’espace public, sur une question aussi technique, c’est  assez savoureux. Le public ne s’y est pas trompée : Dominique étant le seul à tenir un discours de portée politique, il a reçu une ovation. Si vous voulez le lire dans le texte, certains de ces articles sont accessibles en ligne et je recommande particulièrement la lecture de son dernier livre : la Démocratie Internet (que je peux prêter).

L’histoire de la classification sur le web

Tout d’abord il faut bien avoir en tête que les moteurs de recherche et les réseaux sociaux incarnent deux manière rivales de classer l’information et donc de nous faire accéder à l’information. Voici les grandes étapes de la classification du web, avant de passer au combat.

  • une logique d’éditorialisation au coeur du yahoo des débuts, de l’annuaire dmoz et de wikipedia.
  • la montée du principe d’autorité des pairs utilisé par google dans son page rank (qui donne aux éditeurs du web, non pas aux lecteurs, le pouvoir de classer le web).
  • l’audience et les pages vues, critère inspiré de la mesure d’audience pour la TV (sachant que Google prend peu en compte l’audience dans son page rank).
  • la vitesse et le real time (notamment la fraicheur d’édition utilisée par le edge rank de Facebook) liée à la notion de flux qui dominent sur twitter ou google actualités.
  • l’affinité entre les utilisateurs basée sur l’idée de graph social.

Pour Dominique Cardon, ces métriques de classements enferment des principes et des valeurs. C’est là que ça devient politique, donc intéressant.

Autorité vs. affinité

A gauche, ceinture rouge, nous avons le triple champion de la recherche google, pour qui les internautes sont d’abord des émetteurs de requêtes auxquels il faut fournir une liste de résultats pertinents en un minimum de temps. Pour faire ça, google dispose de puissance de calcul et de mémoire qui en font le plus gros consommateur d’électricité au monde. Le coup spécial du moteur repose sur son algorithme : les calculs qui déterminent la liste de résultats affichée sur une requête déterminée.

A droite, facebook, challenger, ceinture bleu, qui incarne une autre manière de classer le web en faisant, sans romantisme, appelle aux affinités électives.

Vous aurez compris que ce combat ne couvre pas tous les aspects de l’utilisation de facebook et de google mais seulement leurs manières de décider des résultats qu’ils vous proposent. Or, nous ne demandons jamais rien à facebook, qui a fait de son moteur de recherche une des fonctionnalités les plus pauvre de sa plateforme, par contre nous passons notre temps à interroger google. Ce n’est donc pas l’intégralité de services proposés par ses entreprises dont nous parlerons, mais bien plutôt leurs algorithmes de classement de l’information à savoir le page rank de google et le edge rank de facebook.

Les déterminants du classement

Les résultat proposés par google sont le fruit d’un travail d’ingénieurs. Ceux-ci ont construit une manière de hierachiser le web en se basant sur l’idée de recommandations des pairs.

En s’appuyant sur l’autorité accordée aux scientifiques sur la base du nombre de fois où leurs articles sont cités dans les revues scientifiques, les ingénieurs se sont dit que les meilleur résultats sur une requête sont ceux qui font l’objet du plus grand nombre de votes. Un vote ? Pour google, un vote est un lien entrant (backlink) émis par un site vers un autre. Plus un site reçoit de liens dont le contenu est associé à un champ sémantique, plus il augmente son page rank et donc son positionnement sur une requête appartenant à ce champ sémantique.

Le page rank ne classe donc pas le lexical et le sémantique en premier, il commence par déterminer l’autorité d’un site en fonction du nombre de liens qui pointent vers lui. Du coup, tous les sites sont dotés d’un niveau de page rank, et ce page rank est redistribué aux sites qui font l’objet d’un lien. Recevoir un lien d’un site dont le page rank est nul est peu reditributeur d’autorité, et donc de visibilité dans la liste de résultats.

Ainsi, google calcule l’autorité d’un site à partir de l’intertextualité du web, sur un modèle mathématique basé sur une logique d’agrégation : c’est une somme d’actions non coordonnées qui va permettre de classer et de donner les meilleurs résultats.

Les racines théoriques plongent jusqu’au théorême du jury de Condorcet selon lequel il ne faut pas qu’il y ait des échanges entre les votants pour garantir le meilleur résultat. Or c’est le contraire que l’on observe puisque l’industrie du référencement s’est construite contre cela.

A ce stade, il faut bien avoir en tête que google ne s’intéresse qu’aux éditeurs du web. Si vous ne publiez pas de page, vous n’entrez pas dans les métriques de classement élaborées par google.

On mesure ici à quel point google est loin des critères d’audience élaborés pour la télévision. Cela apparait comme un remède et un mal : un pharmakon. L’avantage est de produire un nouvel ordre de classement, délié de celui élaboré par la télévision, ce qui a permis l’entrée de nouveaux éditeurs. L’inconvénient est une distribution inégale du page rank : des contenus de grande qualité restent inaccessibles et finalement on observe un attachement préférentiel entre sites disposant de page rank similaires (effet Mathieu) ce qui empêche l’arrivée de nouveaux entrants et génère des oligopoles.

Ainsi le page rank est loin d’être démocratique : certains éditeurs sont des poids lourds, d’autres ont très peu de poids et les lecteurs sont absents de ce calcul de l’autorité. Le page rank avantage les premiers entrants, la fréquence d’édition, et il entraine une course au respect des normes techniques imposées par google. Aussi, il n’a pas été pensé pour prendre en compte les lecteurs.

Dominique Cardon a rappelé que dans la taxonomie, il y a une tendance à accorder de la qualité  au document, et une tendance à accorder de la qualité à la personne. Google incarne la première tendance, facebook et les réseaux sociaux incarnent la seconde. Et tandis que google fait tout pour garder secret son algorithme, facebook est plus ouvert pour expliquer le edge rank.

Les déterminants du classement des résultats de facebook sont aussi le fruit d’un travail d’ingénieurs mais ceux-ci ont mis les interactions et les relations entre les utilisateurs au centre de leur manière de classer.

Facebook concentre sa valeur dans l’immensité des bases de données d’interactions associées aux publications de chaque utilisateur. Les textes et les photos publiés, les personnes qui réagissent, les types de réactions, leur fréquence, la somme de vos interactions par mail, chat, publications sur murs, partage de liens, affinités croisées avec des pages… Toutes ces actions sont des « edge » pour facebook et ce sont autant d’éléments que l’algorithme va étudier pour choisir ce qu’il va vous montrer de l’activité de vos « amis » sur votre mur.

Ainsi, le edge rank détermine ce qui est le plus important pour l’utilisateur : il y a donc un enjeu majeur à savoir comment facebook choisit ce qui est important pour nous.

  • Premier critère : le score d’affinité. Vous avez une multitude de contacts sur facebook, mais facebook sait très bien qui sont vos meilleurs amis. L’agrégation de vos interactions permet à l’algorithme de suivre l’évolution de votre affinité avec d’autres utilisateurs sur la fréquence de vos échanges. Pour l’instant, l’algorithme n’est pas capable d’étudier la nature de ces échanges : des insultes quotidiennes risquent donc de jouer contre vous et d’être entretenues par facebook qui ne cessera de vous exposer aux publications de votre meilleur ennemi.
  • Second critère : le poids d’affinité. Les vidéos, les photos et les liens publiés pèsent plus que les textes seuls ou les « j’aime ». Si vous passez beaucoup de temps à regarder les photos des autres, les photos ont plus de chances d’être affichées dans votre flux d’informations.
  • Troisième et dernier critère : la date. Plus une publication est ancienne moins elle a de chance d’apparaitre.

Pour facebook, l’enjeu est que vous restiez le plus longtemps, et que vous agissiez un maximum sur les publications, afin que les bases de données soient le mieux qualifiées possibles et vous offrent un meilleur service, et surtout, que ces données puissent être promises aux annonceurs les plus offrants.

Ainsi, nous comprenons l’importance de notre réseau d’amis et de pages et l’importance de la fréquence et des types de contenus que nous partageons et sur lesquels nous interagissons, car tout cela détermine ce qui s’affichera demain dans notre newsfeed.

Facebook a réussi à abaisser les barrières à l’entrée et à démocratiser la publication en faisant d’un plus grand nombre d’internaute un éditeur et une source d’information pour les annonceurs.

Désormais, ce qui se joue sur facebook est l’ouverture et la curiosité des internautes à aller se relier avec des pages ou des profils d’utilisateurs qui ne sont pas déja connus, qui ne partage pas nécessairement les mêmes valeurs ou connaissances. Fonder son utilisation de ce service sur la création d’affinités plutôt que sur les affinités déja existantes, s’ouvrir au débat contradictoire avec des internautes qui ne partagent pas votre vision du monde, voici des approches que nous pouvons avoir sans attendre que facebook ne nous les serve. Sachant que cela dépend largement de l’avantage commercial que la plateforme pourra en tirer.

Il doit y avoir une troisième voie, ou une manière d’utiliser le meilleur service rendu par les deux plateformes.

Je n’ai pas complètement rendu hommage à la richesse de l’intervention de Dominique Cardon mais j’intégrerai les liens vers ses publications, dés que celles-ci seront disponibles. Et pour vous faire patienter, en attendant que l’un d’entre vous réalise le même travail sur facebook, je vous recommande The Political Economy of Google, qui n’a rien à voir avec notre sujet mais pose des questions intéressantes.

http://www.territoiresweb.com/dominique-cardon-classification-web-google-facebook

Laisser un commentaire

Entrez vos coordonnées ci-dessous ou cliquez sur une icône pour vous connecter:

Logo WordPress.com

Vous commentez à l'aide de votre compte WordPress.com. Déconnexion / Changer )

Image Twitter

Vous commentez à l'aide de votre compte Twitter. Déconnexion / Changer )

Photo Facebook

Vous commentez à l'aide de votre compte Facebook. Déconnexion / Changer )

Photo Google+

Vous commentez à l'aide de votre compte Google+. Déconnexion / Changer )

Connexion à %s

%d blogueurs aiment cette page :