26 octobre 2011

Google beaucoup de bruit pour rien

google a 13 ansJe reviens sur Google, dont j’ai déjà souligné les qualités et les défauts, car le moteur de recherche  fête sa 13e année d’existence, déjà ! Je me souviens de mon étonnement devant ses performances à ses débuts, époque bénie sans ces odieux encarts publicitaires ciblés d’après l’adresse IP de l’internaute ou la nature de ses requêtes. Peu nombreuses à l’époque, les réponses étaient à la mesure d’un contenu qui a connu depuis une croissance phénoménale. On peut regretter que les capacités du moteur de recherche n’aient pas suivi cette évolution car aujourd’hui l’abondance des réponses, souvent à côté du sujet, même si l’on interroge en mode expert – ce qui est malgré tout recommandé -, décourage plus d’un surfeur. C’est encore plus flagrant quand on recherche des images. Il est maintenant possible d’en rechercher une à partir d’une semblable que l’on peut faire glisser dans la barre de recherche, une photo personnelle notamment, et cette nouveauté me semble intéressante à plus d’un titre car si Google retrouve les images similaires il semble être aussi en mesure de dénicher des documents identiques à ceux qu’on lui soumet (avis aux plagiaires!). Les autres modalités de recherche ne sont pas entièrement nouvelles puisqu’on pouvait faire la démarche soi-même auparavant (copier/coller l’URL de l’image). Je n’ai pas encore expérimenté complètement cette fonctionnalité mais le mode avancé (portraits, paysages, couleurs) devrait ouvrir de belles perspectives. Cela reste à vérifier.

Bien que Google s’appuie sur les mots clés donnés à leurs billets par les blogueurs ou à leur site par les webmestres, on a la nette impression que le moteur privilégie les mots qu’il a banalement trouvés dans leur contexte. Ainsi, relevant les termes utilisés par des surfeurs parvenus sur mon blog, je me suis demandé pourquoi les mots « cantine dessin » constituaient une entrée figurant dans le top des 20 questions les plus posées. Vérification faite, tout simplement parce que le mot  « cantine »  apparait dans le texte de trois de mes billets ! Les surfeurs à la recherche de représentations de cantines, scolaires ou autres (ils sont apparemment nombreux mais j’ignore si certains ne s’intéressaient pas aussi à la malle du même nom !), ont dû être frustrés de ne pas trouver ce qu’ils cherchaient car tel n’était pas le sujet de mes billets.

On est encore loin d’un Web dans lequel les « métadonnées » joueraient pleinement leur rôle et atténueraient le « bruit » (les informations non pertinentes) reçues en réponse à une requête. Il faut ajouter que Google ne facilite pas les choses quand, croyant bien faire, il propose une orthographe différente de celle qu’on a choisie. Un exemple parmi d’autres : à la requête « écho des basanes », le moteur de recherche propose « écho des bananes » ! On comprend pourquoi car les occurrences sont nombreuses pour la formulation qu’il suggère. Google n’est pas le seul à faire de telles propositions superflues. Qui n’a pas observé cette manie des correcteurs orthographiques des logiciels de traitement de texte qui, lorsqu’ils ne connaissent pas un mot, en proposent un autre approchant ? Je me souviens d’une ancienne version de Word qui proposait « bluff » quand on tapait « Blum » ! Actuellement, l’éditeur de texte dont je me sers pour rédiger ce billet propose « Mogol » lorsque je tape « Google »… !

Ce billet un peu technique n’intéressera pas grand monde, sinon les personnes qui voudraient perdre moins de temps en effectuant une recherche sur le Web et qui n’aiment pas lire les modes d’emploi. Je le conclurai en formulant le vœu que dans les treize années à venir Google, voire d’autres moteurs de recherche, auront inventé des algorithmes plus pointus permettant d’obtenir seulement les réponses pertinentes à une requête donnée. En réalité, ces moteurs auront peut-être été rendus obsolètes par le « Web sémantique » qui semble être la solution d’avenir.

Les commentaires sont clos.