22.06.2006

L’avenir est-il aux moteurs de recherche verticaux ?

Il y a le monde de la recherche en ligne dominé par les moteurs généralistes que sont Google (outrageusement) et Yahoo (dans une moindre mesure) et à l’intérieur de ce monde il y a un sous ensemble appelé : les moteurs de recherche spécialisés, dont les moteurs verticaux (Vertical Search Engines). On pourrait citer aussi les moteurs sociaux, collaboratifs ou communautaires.

Bref, le monde de la recherche en ligne est en effervescence à un point tel que Google annonce le lancement de Google co-op, Yahoo celui de son moteur social, Yoono est depuis peu intégré au navigateur Firefox en tant qu'extension, eurekster décline dorénavant son moteur communautaire en fonction de la taille de l'éditeur qui souhaite intégré le moteur à son site, etc...

La question est : y a t-il la place pour que co-existent ces moteurs spécialisés ou encore offrent-ils une véritable alternative aux deux poids lourds de la recherche en ligne ? C'est en tous cas ce que laisse entendre un article paru dans le Washington Post en octobre 2005 (OK ! c'a date mais l'information est toujours d'actualité). Où il est fait état de l'intérêt manifeste des annonceurs pour ce type de moteurs qui sont de par leur nature sensés remonter des résultats plus pertinents que les moteurs généralistes.

Rappelons que dans le modèle économique qui prévaut pour les moteurs de recherche (Google au premier chef), le client n'est pas le net chercheur, mais l'annonceur qui achète des liens sponsorisés. Il n'est pas difficile d'imaginer l'attrait de ces moteurs verticaux dont l'index se limite à un secteur d'activité ou un thème et qui permettent de la sorte de mener une stratégie de recherche pointue (cela tombe bien, les requêtes formulées par les internautes sont de plus en plus complexes) sur un index limité et dont les liens auront été en amont validés par l'éditeur du moteur.

On touche là l'éternelle question de savoir si la quantité ne nuit pas à la qualité ? Les développeurs de solutions de moteurs verticaux mettent en avant les avantages qui devraient théoriquement faire mouche auprès d'une population de professionnels qui estiment consacrés trop de temps à la recherche d'information et pas assez au traitement et à la prise de décision : index limité en quantité, constitué sur la base de sites identifiés qui rentrent dans une ligne éditoriale définie selon un thème précis, des liens validés et mis à jour régulièrement, la notoriété de l'éditeur qui propose le moteur.

Avec le développement des moteurs verticaux et leur logique éditoriale, et au-delà les moteurs de type "communautaire" (voir le billet sur les swicki) on assiste à un changement de paradigme qui se résume ainsi : avant il y avait les machines et les robots, aujourd'hui il y a les machines, les robots et les hommes.

Je vous recommande vivement la lecture de cet article paru le 09/06 dans Lexpansion.com et qui propose l'avis d'un Research VP du Gartner Group pour qui il doit y avoir complémentarité entre une recherche algorithmique (qui ne tient pas compte du contexte) et une intervention humaine.

Un autre article paru dans le JDN (24/05/06) : "Le marché va se diriger vers les moteurs de recherche verticaux"

Pour compléter, consulter le billet suivant sur les coûts cachés de la recherche d'information en milieu professionnel.

19.06.2006

Revue de presse autour du Web 2.0

Voilà un thème qui occupe de plus en plus d'espace médiatique, c'est le moins qu'on puisse dire.

Web 2.0, vous ne pouvez plus y échapper.

Pour preuve, voici une revue de presse (quotidienne nationale) récente mais non exhaustive :

  1. P. Chappaz (le fondateur de la success story Kelkoo) anime une chronique hebdomadaire dans Libération. Le thème : les nouvelles frontières de l'Internet appelée 2.0
  2. Le Monde n'est pas en reste. Pour preuve, depuis le 12 juin et pour la semaine entière, le quotidien a posé chaque jour la question à ses lecteurs : êtes vous 2.0 ?
  3. un article en date du 15 juin paru dans Les Echos sur le match que se livrent Yahoo et Google sur la recherche d'information en langage naturel avec en toile de fond le ... Web 2.0

Voilà donc revenu le temps des faiseurs de rêves à base de technologies et d'innovation marketing. Où l'on reparle de start-up, d'acquisitions, de nouveaux modèles économiques (qui se cherchent toujours, même si les revenus publicitaires semblent y prendre une part prépondérante ; Cf. le billet du 06.12.05). Certains chroniqueurs s'avancent à y voir là la constitution d'une nouvelle bulle financière.

Sans revenir sur ses caractéristiques (voir la rubrique qui lui est dédiée), on retiendra que le Web 2.0 "replace l'internaute ou l'utilisateur au centre du réseau" (c'est dit dans l'article paru dans Le Monde en date du 12.06.06).

Soit ! Mais, dans ce raccourci on donne déjà un premier élément d'appréciation : et si le web 2.0 n'était qu'un concept marketing qui se cache derrière un discours humaniste et universaliste où le partage est la règle d'or, le bénéfice mutuel la raison d'être et le développement des connaissances l'objectif d'une société de l'information devenue vertueuse ? Car après tout, dans l'environnement sémantique qui est le sien, il est bien question de : financement, marché, modèle économique, utilisateur, client, annonceur, acquisition, part d'audience, etc ...

Faut-il crier gare au loup ? ou encore y voir une supercherie orchestrée par les marketeurs des poids lourds de la net économie ?

C'est en tout cas, un discours qui aujourd'hui rencontre un échos proportionnel au buzz que génère le Web 2.0. C'est notamment l'argument développé par K. Dubost qui dans la-grange.net assimilait ouvertement le web 2.0 à un "piège à ...". C'est aussi reprendre l'idée que le Web 2.0 va permettre de constituer des bases de données extrêmement fines (à des coûts minimisés) à des fins commerciales, on s'en doute et que derrière la gratuité se cache un système intrusif.

Dis moi qui tu es ? ce que tu fais ? à quelle communauté appartiens tu ? ce que tu veux ?

Bienvenu dans le Web 2.0 

Pour compléter l'information : Why Web 2.0 will end your privacy

medium_web_2.0_chart.jpg

 

 

 

 

14.06.2006

Google Co-op

medium_google_coop.gifInutile d'être sorti major d'une promotion d'une école de management pour comprendre que ce qui se cache derrière le dernier né des projets de la firme de Mountain View est en fait un moteur inscrit dans une logique de coopération.

Nom de code : Google Co-op Co-op pour coopération, c'est écrit une ligne au-dessus

Le constat initial : les moteurs de recherche réputés "généralistes" occupent l'espace numérique. On serait tenté de dire sans partage (2 éléments d'appréciation permettent pour corroborer cette idée : 1/ l'accès aux pages d'un site internet se fait dans un cas sur trois par l'intermédiaire d'un moteur de recherche 2/ Google en particulier avec plus de 80 % de part d'audience généré sur la France).

Donc, d'un côté un moyen privilégié d'accéder à l'information en ligne par l'intermédiaire des moteurs de recherche et de l'autre une insatisfaction croissante (pour ne pas dire frustration) des internautes quant à l'usage de ces moteurs. Il faut dire que pour reprendre l'adage répandu selon lequel "trop d'information, tue l'information", on a vu jusqu'à un passé récent les principaux moteurs surenchérir sur la taille de leur index. A vouloir jouer les gros bras sur le nombre de pages internet balayées par ces moteurs, on en arrivait à se demander si la croissance régulière de la taille de l'index avait encore un sens, d'autant que des études démontrent aujourd'hui que les internautes (dans une très large proportion, voir le billet "Chercher, c'est trouver !") ne dépassent pas la première page de remontée de résultats des moteurs.

Le principe de Google Co-op :

On est dans un système communautaire dans lequel les membres (ce qui nécessite une inscription) proposent du contenu, des liens, associent des sites à des labels, ou catégories pré-définis. Bref, un appel à la contribution des utilisateurs du moteur pour en améliorer l'efficacité. Mais répétons-le, tout ceci se passe sur la base de la déclaration : un éditeur de site n'apparaîtra dans les pages de résultats que si il a au préalable enregistré les données de son site. On est, au final, assez proche de ce qui se passe dans le domaine du Web 2.0 (tag, système de notation par les internautes, partage, suggestion de liens apparentés). Google propose déjà dans le cadre du projet "Google Health", ce système de remontée de résultats "certifiés".

Assite t-on à une stratégie de verticalisation du moteur Google ?

Certains ("Google co-op is a vertical search killer") y voient déjà une stratégie défensive de Google pour contrer les nouvelles tendances qui émergent notamment chez les éditeurs de presse et autres média qui développent des moteurs de recherche verticaux susceptibles un jour de venir jouer sur le terrain de jeux de Google et donc de venir détourner une partie du marché des ressources publicitaires. CQFD

En savoir plus sur Google Co-op

Une explication détaillée de WebRankInfo

Pour rappel : le billet sur les Swickis

un exemple de moteur vertical : le moteur de recherche Web entreprise du site oseo.fr

09.06.2006

Google : l'avenir est aux formats de fichiers ouverts

Juste le temps de poster un billet "Google enfonce le clou ...  avec un tableur" et voilà que le débat s'anime dans des termes plutôt manichéens.

Ce matin, Good Morning Silicon Valley revient sur l'annonce du début de semaine faite par Google sur le lancement de la phase test de son tableur en ligne.

Si la cause est entendue, nombre de chroniqueurs admettent que cet utilitaire (appelons-le ainsi) est destiné à un usage personnel (home office) et non pas professionnel. Ils sont, par ailleurs, unanimes pour reconnaître que l'outil présente de sérieuses lacunes de par ses fonctionnalités limitées. Il faut dire que la comparaison (des fonctions proposées) avec la référence du marché, penche clairement en faveur de l'application proposée par la firme de Redmond. Pour faire un raccourci : il n'y a pas photo !

Mais est-ce vraiment là l'objectif de Google (venir proposer une solution concurrente d'Excel) ? Pas sur ! Un billet paru dans Ars Technica avance une thèse pour le moins percutante. L'intitulé du billet est suffisamment explicite : "Google Office : it's about file formats, not MS Office". Où il est fait état de la motivation de Google de populariser (pour reprendre une terminologie familière du côté de Mountain View) un standard de format de documents accessibles depuis des applications web ; et l'on reparle d'interopérabilité et de Open Document format (ODF) : un format ouvert basé sur du XML pour le traitement de texte, les tableurs, bases de données et fichiers de présentation. Bref un format ouvert de fichiers et documents prêts à être consultés, partagés et édités depuis le net.

Mue par un enthousiasme communicatif et encore un peu naïf,  je m'avance à dire : "Vous l'avez rêvé, Google l'a fait ..." et me souviens d'un commentaire de début d'année de T. Nitot dans son Standblog qui s'interrogeait - entre autre - sur l'évolution du marché des suites bureautiques en comparaison de ce qui se passe dans le domaine des navigateurs.

Je vous restitue - dans le texte - la conclusion du billet de Ars Technica :

"... An open standard for documents is everything Google wants. If DOC and XLS currently rule the day, they may rue the day that modestly robust ODF editing tools for word processing and spreadsheets are only a "feeling lucky" click away. And this is how ODF will become the default file format for Office 2010 or 2012. It's not whether or not you're using Word that matters to Google. It will be whether or not you're using ODF as a file format. The first step in taking away dependence on an application (or suite of applications) is to take away the things that make it proprietary"

Bon résumons :

  1. pour le traitement de texte Google développe autour de Writely, d'autres s'y intéressent aussi (AjaxWrite notamment, voire le billet "AjaxWrite ou les malheurs de Microsoft"),
  2. côté tableur, (suivre l'actualité de la semaine),
  3. pour la navigation sur le net on ne présente plus Firefox (tout est dit dans le billet "Internet Explorer ou Firefox" complété par "Firefox en environnement professionnel"),
  4. reste les outils de présentation graphique. On pense bien sur à Powerpoint. Et là on peut dire que l'avenir s'assombrit aussi du côté de Redmond, bien que Google n'ait pas - encore - fait d'annonces. Pour preuve, quelques start-up investissent le marché des outils de présentation en ligne (voir le billet suivant paru dans CNet blog)

Quelques commentaires et avis :

Google Spreadsheet beta doesn't quite add up (InformatioWeek)

Google Spreadsheet hands-on (the Cnet Blog) 

 

 

08.06.2006

Google enfonce le clou avec ... un tableur

C'était hier (plus précisément courant mars), Veille et Innovation revenait sur les initiatives de Google pour venir jouer dans la cour de Microsoft.

medium_google_labs.gifIl était dit que la firme de Mountain View était en route sur le sentier de la guerre pour croiser le fer avec celle de Redmond. La hache était déterrée avec l'annonce du rachat de l'application de traitement de texte Web : Writely. Eh bien, on peut dire que Google a de la suite dans les idées et enfonce le clou avec l'annonce du lancement d'un tableur.

Point de démarrage de la réflexion menée par Google : comment partager facilement et rapidement des données en temps réel ?

Réponse du Google Labs : la mise à disposition d'un tableur sur le web ou l'accès à vos données produites à partir d'un tableur depuis n'importe quel poste connecté au net.

Pour faire encore plus simple : plus nécessaire d'avoir recours à des applications bureautiques propriétaires payantes (on ne citera pas le leader du marché, c'est déjà fait). Il suffit d'une connexion à internet pour accéder au document depuis un navigateur.

On en devine très vite l'intérêt (ou plutôt les intérêts) :

  • l'accès au document à distance, à tout moment
  • le partage des données avec des personnes invitées (saisie des e-mail) à consulter, modifier le document dans une logique de travail collaboratif (c'est tendance). L'application permet de définir divers profils d'invités en fonction des droits qui leurs sont alloués (visualisation uniquement ou édition)


Condition pour participer à la validation de la version béta : disposer d'un compte Google. C'est ici

Mais attention, le tableur  Google n'a pas vocation à proposer des fonctionnalités aussi élaborées que celles du standard du marché (on ne le citera pas, c'est dit plus haut). Par exemple, les imports et éditions de graphiques depuis l'application ne sont pas proposés - tout du moins dans l'immédiat. La version béta doit permettre de faire remonter au Google Labs l'ensemble des besoins (réputés basiques) exprimés par les utilisateurs finaux.  

Il permet malgré tout d'importer des feuilles de calcul sous format .xls, ainsi que des données au format .csv. L'enregistrement des documents réalisés depuis l'application peut se faire sur le poste de travail sous 3 formats (xls, csv et html).

Le public visé par Google est - a priori - celui des particuliers qui souhaitent utiliser l'application dans une configuration "simple" pour produire des documents (plannings de réunion, feuilles de calcul) et les partager.

A considérer que la firme de Redmond génère une partie importante de ses revenus sur les entreprises, on peut malgré tout penser qu'il s'agit d'un sérieux pavé dans le modèle économique de Microsoft.

Et l'on reparle d'un univers informationnel dominé par Google qui l'organise comme un réseau global de connaissances qui concentrera tous les savoirs (numériques) produits par l'homme et accessible à tous ou presque depuis internet.

 

Pour en savoir plus : le Google Spreadsheets Sneak Peek tour

Source de l'info : SiliconValley.com (Mercury News)

pour compléter le billet :

Google va t-il déclarer la guerre à Micosoft ?

AjaxWrite ou les malheurs de Microsoft 

 

 

06.06.2006

Chercher, c'est trouver !

C’était le mois dernier : SearchEngineWatch nous révélait la parution de deux études parues simultanément sur l’analyse des comportements des internautes lorsqu’ils effectuent une recherche sur les moteurs.

La première étude est co-réalisée par Jupiter Research et iProspect. Elle propose une analyse des tendances observées sur 3 années (2002 – 04 et 06). Intéressant de constater l’évolution des comportements et des attentes sur une période donnée. Et là l’étude tend à démontrer que le niveau d’exigence des personnes qui cherchent augmente en même temps que leur aptitudes à développer des stratégies de recherche plus ou moins complexes.

Résultats :

  • 62 % des utilisateurs de moteurs de recherche cliquent sur un résultat remonté sur la première page de retour ; 19 % de plus vont jusqu’à la seconde page de retours et 9 % de plus sur la troisième. Au final, 9 de ces utilisateurs sur 10 ont cliqué sur un résultat apparu dans les 3 premières pages de retour que remonte le moteur. En tendance (sur la période considéré), les utilisateurs tendent de plus en plus à limiter leur recherche aux 2, voire 3 premières pages
  • après une recherche jugée infructueuse, 41 % des utilisateurs révisent leur stratégie de recherche (le ou les termes de la requête), voire change de moteur lorsqu’ils ne trouvent pas de résultats satisfaisant dès la première page de retours ; 27 % font de même à la seconde page de retours et 20 % supplémentaires pour la 3ème. Au final, ils auront été 88 % d’utilisateurs à avoir modifié la recherche initiale pour ne pas avoir trouvé de réponse satisfaisante dans les 3 premières pages de retours. En tendance, les utilisateurs sont de plus en plus nombreux à modifier leur stratégie de recherche si les résultats des moteurs ne sont pas jugés satisfaisants dès les premières pages
  • pour poursuivre dans le registre de la recherche infructueuse, 82 % des utilisateurs optent pour une modification des termes de la requête initiale ; quand 13 % changent de moteurs. En tendance, il semble que les utilisateurs demeurent de plus en plus fidèles au moteur initialement utilisés
NB. l’enquête a été réalisée en janvier 2006 sur un panel d’internautes US

 

La seconde étude a été menée par Harvest Digital en partenariat avec Metro Research et s’intéresse plus particulièrement aux utilisateurs «expérimentés» de l’internet (au Royaume-Uni) dans leur stratégie de recherche d’informations sur les moteurs de recherche (est considéré par l’étude comme «expérimenté», l’internaute qui navigue sur le net depuis au moins 3 ans et y consacre au minimum 10 heures hebdomadaires)

Résultats :

  • la moitié de ces utilisateurs avisés passent au moins 3 heures par semaine a effectuer des recherches en ligne et ils sont 69 % à déclarer trouver réponse
  • 94 % des répondants déclarent utiliser … Google (que reste t-il aux autres ? la réponse est en partie dans la rubrique La vie en Google de ce site. Je peux cependant vous dire que selon l’étude les 3 suivants Yahoo, Ask Jeeves et MSN tournent à environ 40 % de déclarants) …
  • … mais (parce que leur avenir n’est pas aussi bouché qu’il n’y paraît) l’espoir demeure. Pour preuve, seulement 24 % des répondants déclarent n’utiliser qu’un seul moteur. 30 % en utilisent 2 ; 26 % utilisent 3 moteurs ; il y en a même 9 % qui utilisent plus de 4 moteurs
  • dans le même temps les répondants reconnaissent que si les résultats ne sont pas à la hauteur, c’est que souvent les termes de la requête sont inadéquates ou que la requête même est jugée trop spécifique et que l’information n’est peut être pas disponible dans les moteurs. La présence de liens sponsorisés est avancée dans un cas sur quatre comme cause de recherche infructueuse
  • 5 % des répondants utilisent 1 mot seul dans la requête ; 27 % d’entre eux utilisent 2 mots ; 40 % 3 mots
  • 43 % cliquent sur un résultat de la première page
  • 32 % cliquent sur un résultat parce que la description qui remonte du moteur est en adéquation avec leur attente
  • la moitié des répondants estime devoir améliorer leur technique de recherche


Conclusion : mieux vaut apparaître dans le haut des résultats ou tout du moins sur les premières pages. Au-delà les résultats deviennent quasi invisibles pour les utilisateurs des moteurs de recherche. CQFD (mais qui en doutait encore ?)

iProspect Search Engine User Behavior Study (Avril 2006)

attitude to search amongst experienced internet users (Avril 2006)

Pour compléter ce billet, je vous invite à consulter le billet que j'ai réalisé il y a peu sur une étude comparative sur 6 moteurs

medium_google_people.2.jpg

 

01.03.2006

Google et la recherche d'information presse

Aujourd'hui, c'est de notoriété (cf le billet daté du 16.01.2006 "Google et l'information professionnelle") : les entreprises utilisent de plus en plus les moteurs de recherche - et Google en particulier - pour repérer des contenus presse.

On peut penser que dans ce contexte les acteurs classiques de "l'information professionnelle" ne resteront pas sans réagir. D'ailleurs, la réaction s'organise déjà :

  1. d'un point de vue légal, du côté des éditeurs qui intentent des actions en justice à l'égard du moteur de recherche au motif que ce dernier permet à tout internaute d'accéder gratuitement à un contenu commercialisé par ailleurs par ces mêmes éditeurs et leurs intermédiaires
  2. d'un point de vue marketing, avec le développement de plates-formes d'agrégation de fils d'information, de dépêches et plus largement de contenus presse, voire de rumeurs.

Première élément d'appréciation : jusqu'à récemment l'information produite par les éditeurs était diffusée sur le marché par l'intermédiaire de services d'agrégation. Les principaux étant proposés par les sociétés Lexis Nexis, Thomson Business Intelligence et Factiva.

Arrêtons nous quelques instants sur cette dernière (filiale de Reuters et Dow Jones) dont le positionnement est on ne peut plus clair : réorienter les recherches en environnement professionnel effectuées par les "iWorkers" vers des solutions professionnelles qui garantiront un accès à une information non accessible depuis des sites internet gratuits. Dans ce contexte, Factiva développe via un livre blanc ("The Hidden Costs of Information Work" - avril 2005) un argumentaire déjà servi par d'autres acteurs de l'information professionnelle (c'est de bonne guerre) sur les coûts cachés en matière de recherche et de gestion de l'information suivant le principe que mieux vaut souscrire à un service d'agrégation qui remonte des informations validées que de rechercher sur le "web ouvert" (nonobstant gratuit) des informations que l'on ne trouve pas et qui engendrent des coûts (temps homme) non négligeables.

La solution proposée par l'agrégateur a pour dénomination : Factiva Search 2.0. L'interface de recherche est proche de celle que propose les principaux moteurs de recherche et la partie résultat est agrémentée de filtres qui permettent d'organiser plus efficacement l'information remontée par catégorisation de celles-ci, le tout dans un contexte de navigation simple. Cette interface balaie un fonds constitué de près de 9.000 sources de presse et plus de 3.500 sites d'actualité en ligne. Des alertes sont paramétrables par ailleurs.

Précision : ce type de service - qui à l'origine s'adresse à des veilleurs et documentalistes en entreprise - est proposé aujourd'hui dans un contexte d'ouverture de la cible à des non-professionnels de l'information avec l'idée que ces personnes retrouveront une interface déjà connue (celle des principaux moteurs de recherche). Attention cependant le droit d'accès indique clairement que ce service s'adresse aux entreprises (compter plus de 2.800 euros par mois pour 15 utilisateurs). A ce prix là, pas sûr que l'argument des coûts cachés en "open web" soit suffisant pour recruter de nouveaux clients. La plate-forme est proposée depuis janvier en version bêta. A suivre ...

Deuxième élément pour étayer la réflexion : on peut penser que la réaction ne relève pas que du seul fait des intermédiaires et diffuseurs d'information professionnelle, mais aussi des éditeurs eux-mêmes. Force est de constater que ces derniers - les gros éditeurs tout du moins qui fondent leur notoriété sur des titres de presse reconnus dans leur domaine - sont engagés dans une tendance qui consiste à reprendre la maîtrise de la relation directe avec le client final (l'entreprise).

Assiste t-on sur le marché de l'information professionnelle à un match tripartite avec d'un côté les moteurs de recherche, de l'autre les éditeurs de contenus et les diffuseurs ou agrégateurs qui eux-mêmes jouent leur match ?

On peut aussi se demander si au final, Google n'est pas l'arbitre - pas franchement neutre - qui organise la confrontation et le marché au demeurant ?

Pour télécharger le livre blanc "The Hidden Costs of Information Work"

27.02.2006

la carte européenne des start-up tendance web 2.0

J'avais commencé ce mois par un billet vous informant sur l'initiative d'une société US (Fourio) de cartographier l'implantation des sociétés qui développent des web applications tendance Web 2.0. au niveau mondial. Tout en notant la forte prédominance des sociétés US, j'avais alors alerté le lecteur que le service (Web 2.0 Innovation Map) était en cours de lancement et que l'éditeur invitait les sociétés concernées à venir s'y inscrire.

Qu'en est-il un mois après ?

Eh bien, l'Europe apparaît dorénavant sur la carte mondiale des web app 2.0. On ne peut toujours pas parler d'exhaustivité, on notera au passage quelques problèmes de localisation (la balise Bilbao est positionnée au niveau de ... Perpignan, les basques et catalans apprécieront !).

Autre initiative du même ordre : european web2 startups dont le principe de fonctionnement est équivalent au précédent avec cependant une plus forte exhaustivité sur l'Europe et la France en particulier.

Pas certain, cependant, que toutes les références qui y figurent sont à classer au registre des start-up ou des applications tendance Web 2.0.

A vous de juger

20.02.2006

Après Google ?

Va t-on vers un calendrier numérique qui déclinera des dates en un avant Google et un après Google ?

C'est la question qu'on peut se poser à la lecture - ces derniers mois - d'un certain nombre d'articles, de chroniques et essais dont l'épicentre est ...

... Google.

Wired s'était déjà interrogé en décembre dernier sur le fait de savoir qui devait avoir peur de Google ? Réponse sans équivoque : tout le monde.

Certains commentateurs se sont risqués à voir en Google un big brother, quand les anti-Google se sont structurés autour de sites (exemple : Google Watch) et de weblogs. A la Googlemania est venue sa contre-partie : la Googlephobia.

Des annonces de lancements de projets susceptibles à terme de concurrencer Google ont été récemment relayées par la presse (les plus médiatiques : le projet européen baptisé Quaero et le projet japonais sous l'impulsion du Miti).

Et puisqu'il est question de calendrier et donc de dates, il est toujours intéressant de se projeter dans le futur. C'est d'ailleurs ce que fait le magazine Business 2.0 qui a interrogé des experts en TIC sur des scénarii possibles quant au devenir de Google.

Résultats, 4 scénarii se profilent :

  1. en 2025, Google est devenu un média pour ne pas dire Le Média. Au démarrage de l'aventure, il y avait Google News (c'est aujourd'hui), puis vint le rachat de réseaux câblés par la firme de Mountain View, prémices de la Google TV véritable vidéothèque numérique. Google assure alors la convergence de divers moyens de diffusion TV, téléphonie mobile, papier électronique et organise son modèle économique autour de la publicité contextuelle
  2. en 2015, Google est devenu le Réseau. D'ailleurs, il n'est plus question d'Internet, mais de GoogleNet. Que l'on se connecte au réseau gratuitement via un accès sans fil, ou que l'on se connecte à un service de téléphonie mobile, la plate-forme d'échange, le réseau de communication demeure GoogleNet dont le point d'entrée unique est Gbrowser. Tous les systèmes d'exploitations connus à ce jour sont devenus obsolètes. Google est Le système d'exploitation
  3. en 2020, Google est mort. Victime de son succès, le célèbre moteur a concentré sur lui toutes les attaques des spammers, des concurrents, des divers groupes de pression et au final des citoyens qui reprochent à Google son caractère intrusif
  4. en 2105, Google est devenu Dieu. Au 21ème siècle, Google a digitalisé et indexé tout contenu produit par l'homme qu'il s'agisse de textes, d'images animées ou non, de sons. A partir de cette formidable base de données universelle, seule une intelligence artificielle est capable de comprendre l'homme, c'est Google. God save Google !
medium_michelangelo.gif


Lire l'article de business 2.0


15.02.2006

Google et les centres de données

Avez vous déjà remarqué ce phénomène étrange :

Depuis votre poste de travail, vous lancez une requête sur Google et vous obtenez un nombre "approximatif" total de réponses que remonte le moteur. Ce nombre est bien sur variable en fonction des termes de la requête. Renouvelez la recherche (requête à l'identique) depuis le même poste de travail à quelques jours voire semaines d'intervalle et (surprise !) vous obtenez un nombre total de réponses qui diffère de façon significative de la première recherche.

L'explication de ce phénomène nous est donnée par la revue Bases Publications éditée par Netsources dans son numéro de Novembre - Décembre 2005.

On peut penser que le nombre de réponses évolue avec l'augmentation de la taille de l'index Google par effet mécanique. Pas seulement.

En fait, l'article avance l'explication suivante :

"Lorsque l’internaute interroge Google, le moteur dirige automatiquement la question vers l’un des centres de données (data centers), choisi comme étant le plus rapide en fonction de l’encombrement, de la localisation géographique, etc. Mais les index des centres ne sont pas toujours identiques, ce qui explique qu’une même question sur Google peut obtenir, le même jour et depuis un même poste, des résultats variables selon qu’elle est posée à un centre ou à un autre."

On entre donc dans le coeur du système Google dont l'index est segmenté en morceaux répartis sur des milliers d'ordinateurs eux-mêmes hébergés dans plusieurs centres de données localisés aujourd'hui aux USA et en Europe. Ces centres possèdent cependant une copie de la totalité de l'index.

D'après l'article, le centre de données qui se distingue des autres (tant du point de vue quantitatif que qualitatif des remontées fournies) serait Bigdaddy.

Suggestion faite dans le cadre de l'article : lancer une requête directement sur l'adresse IP de Bigdaddy (http://66.249.93.104/)

Lire l'article

Toutes les notes