Accueil » Weblife » Actualités du Web » The Google
1

The Google

La requête « the » dans Google est la requête qui fournirait le plus de résultats et qui permettrait de se donner un avis sur la taille de son index.

Elle était à 8 000 000 il y a encore peu mais est redescendue à un peu plus de 3 millions aujourd’hui.

Les explications de Jean Veronis (Technologies du langage) :

« Beaucoup de gens avaient remarqué que, quand on cherchait « the » dans Google avec l’option « tout le web », le résultat était depuis un certain temps exactement de 8,000,000,000. Aujourd’hui, si vous tapez à nouveau « the », il y a de bonnes chances pour que vous constatiez que quelque 5 milliards d’occurrences de « the » ont disparu :
Il est possible, toutefois, que vous obteniez encore l’ancien résultat si vous essayez aujourd’hui. Google « danse » comme un malade depuis une quinzaine de jours. Il ne s’agit pas de la petite « Google dance » à laquelle nous étions habitués de temps à autre, qui durait deux ou trois jours pendant que Google mettait à jour ses bases de données. Cette nouvelle danse est une véritable danse de Saint-Guy : les résultats vont et viennent, apparaissent ou disparaissent comme par enchantement, bref, changent presque tous les jours.
Ce qui se passe, c’est que les Googlers ont été probablement très embarassés par mes calculs début février (voir résumé ici), calculs qui ont fait le tour de la planète et pas mal de bruit dans le Googleplex. Depuis lors, ils s’activent visiblement à essayer de corriger la situation et rendre les chiffres plus crédibles. Cependant, cette fois, il ne s’agit pas simplement de mettre les index à jour. Il faut aussi apporter des corrections majeures aux routines d’extrapolation, à la logique Googléenne, etc. Probablement difficile — et sujet à erreurs. D’où les nombreux essais et modifications que nous observons ces jours-ci.
Je vais attendre que Google soit stable à nouveau (si jamais ça arrive 😉 pour me livrer à une analyse détaillée, mais on peut déjà se donner une idée de la direction dans laquelle le moteur se dirige. J’avais fait remarquer que lorsqu’on cherchait « the » dans les pages anglaises seulement, on obtenait environ 80 millions de résultats, c’est-à-dire 1% du total, ce qui n’avait pas de sens. Aujourd’hui, j’obtiens environ 2,9 milliards, c’est-à-dire un rapport de 90% au total, ce qui maintenant a du sens. »

A propos de Julien Lombard-Donnet