15.02.2006
Google et les centres de données
Avez vous déjà remarqué ce phénomène étrange :
Depuis votre poste de travail, vous lancez une requête sur Google et vous obtenez un nombre "approximatif" total de réponses que remonte le moteur. Ce nombre est bien sur variable en fonction des termes de la requête. Renouvelez la recherche (requête à l'identique) depuis le même poste de travail à quelques jours voire semaines d'intervalle et (surprise !) vous obtenez un nombre total de réponses qui diffère de façon significative de la première recherche.
L'explication de ce phénomène nous est donnée par la revue Bases Publications éditée par Netsources dans son numéro de Novembre - Décembre 2005.
On peut penser que le nombre de réponses évolue avec l'augmentation de la taille de l'index Google par effet mécanique. Pas seulement.
En fait, l'article avance l'explication suivante :
"Lorsque l’internaute interroge Google, le moteur dirige automatiquement la question vers l’un des centres de données (data centers), choisi comme étant le plus rapide en fonction de l’encombrement, de la localisation géographique, etc. Mais les index des centres ne sont pas toujours identiques, ce qui explique qu’une même question sur Google peut obtenir, le même jour et depuis un même poste, des résultats variables selon qu’elle est posée à un centre ou à un autre."
On entre donc dans le coeur du système Google dont l'index est segmenté en morceaux répartis sur des milliers d'ordinateurs eux-mêmes hébergés dans plusieurs centres de données localisés aujourd'hui aux USA et en Europe. Ces centres possèdent cependant une copie de la totalité de l'index.
D'après l'article, le centre de données qui se distingue des autres (tant du point de vue quantitatif que qualitatif des remontées fournies) serait Bigdaddy.
Suggestion faite dans le cadre de l'article : lancer une requête directement sur l'adresse IP de Bigdaddy (http://66.249.93.104/)
11:45 Publié dans La vie en Google | Lien permanent | Commentaires (0) | Envoyer cette note | Tags : google, moteur de recherche, index, recherche d'information, data center, centre de données






Les commentaires sont fermés.