22.06.2006

L’avenir est-il aux moteurs de recherche verticaux ?

Il y a le monde de la recherche en ligne dominé par les moteurs généralistes que sont Google (outrageusement) et Yahoo (dans une moindre mesure) et à l’intérieur de ce monde il y a un sous ensemble appelé : les moteurs de recherche spécialisés, dont les moteurs verticaux (Vertical Search Engines). On pourrait citer aussi les moteurs sociaux, collaboratifs ou communautaires.

Bref, le monde de la recherche en ligne est en effervescence à un point tel que Google annonce le lancement de Google co-op, Yahoo celui de son moteur social, Yoono est depuis peu intégré au navigateur Firefox en tant qu'extension, eurekster décline dorénavant son moteur communautaire en fonction de la taille de l'éditeur qui souhaite intégré le moteur à son site, etc...

La question est : y a t-il la place pour que co-existent ces moteurs spécialisés ou encore offrent-ils une véritable alternative aux deux poids lourds de la recherche en ligne ? C'est en tous cas ce que laisse entendre un article paru dans le Washington Post en octobre 2005 (OK ! c'a date mais l'information est toujours d'actualité). Où il est fait état de l'intérêt manifeste des annonceurs pour ce type de moteurs qui sont de par leur nature sensés remonter des résultats plus pertinents que les moteurs généralistes.

Rappelons que dans le modèle économique qui prévaut pour les moteurs de recherche (Google au premier chef), le client n'est pas le net chercheur, mais l'annonceur qui achète des liens sponsorisés. Il n'est pas difficile d'imaginer l'attrait de ces moteurs verticaux dont l'index se limite à un secteur d'activité ou un thème et qui permettent de la sorte de mener une stratégie de recherche pointue (cela tombe bien, les requêtes formulées par les internautes sont de plus en plus complexes) sur un index limité et dont les liens auront été en amont validés par l'éditeur du moteur.

On touche là l'éternelle question de savoir si la quantité ne nuit pas à la qualité ? Les développeurs de solutions de moteurs verticaux mettent en avant les avantages qui devraient théoriquement faire mouche auprès d'une population de professionnels qui estiment consacrés trop de temps à la recherche d'information et pas assez au traitement et à la prise de décision : index limité en quantité, constitué sur la base de sites identifiés qui rentrent dans une ligne éditoriale définie selon un thème précis, des liens validés et mis à jour régulièrement, la notoriété de l'éditeur qui propose le moteur.

Avec le développement des moteurs verticaux et leur logique éditoriale, et au-delà les moteurs de type "communautaire" (voir le billet sur les swicki) on assiste à un changement de paradigme qui se résume ainsi : avant il y avait les machines et les robots, aujourd'hui il y a les machines, les robots et les hommes.

Je vous recommande vivement la lecture de cet article paru le 09/06 dans Lexpansion.com et qui propose l'avis d'un Research VP du Gartner Group pour qui il doit y avoir complémentarité entre une recherche algorithmique (qui ne tient pas compte du contexte) et une intervention humaine.

Un autre article paru dans le JDN (24/05/06) : "Le marché va se diriger vers les moteurs de recherche verticaux"

Pour compléter, consulter le billet suivant sur les coûts cachés de la recherche d'information en milieu professionnel.

16.05.2006

Blog Oh Sphere !

medium_sphere.gif

On connaît l'intérêt croissant des professionnels de l'information pour la blogosphère (on citera l'exemple de Factiva pour illustrer ce propos et le renvoie au billet "Blogs et veille informationnelle"). On sait que les moteurs de recherche sont un des points d'entrée privilégiés pour accéder à cette information ce qui m'amène régulièrement à aborder la question des moteurs dédiés aux weblogs et des diffrérents services qu'ils proposent au-delà de la recherche pure.

Ont déjà été cités dans le cadre de ce site : Technorati ("Veille sur les blogs" et son système de veille en temps réel), Blogpulse ("Un outil pour traquer les tendances" compléter par la fonctionnalité de suivi des commentaires).

Voici un nouvel outil qui se démarque quelque peu des autres par son algorithme. Au-delà de la popularité d'un site jugée sur la quantité de liens qui pointent vers ce site la notion de pertinence y est calculée par le croisement de 3 critères :

  • le nombre de liens entrants / sortants
  • son organisation générale, soit une moyenne du nombre de billets postés, de leur fréquence, de leur taille,
  • une analyse sémantique des billets publiés qui permet de donner un sens aux mots dans leur contexte d'emploi

Résultats : la recherche est intuitive dans une interface simplifiée et les résultats retournés par le moteur doivent logiquement être moins exposés au bruit, donc l'internaute devrait y gagner en pertinence.

Pour les services additionnels liés à la recherche, on retrouve moyennant quelques variantes ce que propose un outil comme Blogpulse, notamment :

  • une représentation graphique des résultats qui permet d'observer une tendance (fonction : custom range, les plages de période y sont cependant plus souple que sur Blogpulse, on peut ainsi remonter une recherche jusqu'à une heure, 12 heures ou la dernière journée, voire semaine)
  • l'opportunité d'adosser un fil RSS à une requête, idéal pour être en alerte permanente sur un thème donné
  • un lien vers le profil des weblogs qui remontent dans les résultats (prochaine étape le profil du blogger)

Mais aussi des fonctions qui lui sont propres telles que :

  • une sélection de weblogs réputés les plus populaires pour un terme donné (reprise du même algorithme dont le principe est exposé plus haut - fonction : featured blogs)
  • la possibilité d'étendre la recherche au-delà des blogs (images, photos, information presse très orientée Yahoo News pour l'instant, bibliographie, podcasts - fonction : related media)
  • la fonction qui permet de faire analyser (en temps réel) par l'outil le contenu d'une page jugée intéressante et de se voir proposer par celui-ci une sélection de weblogs qui traitent du même thème (fonction : Sphere it !)
A essayer dès maintenant


09.05.2006

un nouveau moteur pour ce site

Cela fait pas mal de temps qu'en navigant sur divers sites et weblogs qui gravitent autour de mes centres d'intérêt (TechCrunch et Outils Froids pour ne citer que mes favoris) j'utilise - sans y prêter attention (c'est une erreur que je vais réparer au plus vite) - le moteur que me proposent ces sites : il s'agit en l'occurence d'un Swicki. Pour avoir une idée de ce que propose cette nouvelle génération de moteurs de recherche qui s'enrichissent avec les pratiques de la communauté, je vous invite à lire le billet paru sur Outils Froids fin novembre dernier.

Pour revenir à la notion de moteur communautaire ou collaboratif, je vous propose le raccourci suivant : c'est comme reprendre l'équation "plus on est de fous, plus on rit" ; appliqué au domaine de la recherche en ligne, cela donne "la pertinence des résultats fournis par le moteur est proportionnelle à la croissance de la communauté et donc au développement des usages de l'outil".

J'ai voulu l'essayer et comme le disent les marketeurs : l'essayer c'est l'adopter !

Côté fonctionnalités, je vous renvoie au billet d'Outils Froids. Du point de vue du module d'administration de l'outil, cela s'avère particulièrement intéressant pour la publication : l'interface de gestion est extrêment simple et conviviale et côté module d'analyse, c'est franchement le paradis : je vais enfin tout savoir des requêtes formulées par les lecteurs de ce site.

Autre élément bluffant (je suis en train de devenir un Swicki addict !), c'est au niveau de la page de remontée des résultats. La fonctionnalité qui permet de comparer sur la même page 2 colonnes de résultats (l'une pour swicki, l'autre pour des "moteurs traditionnels") est intéressante. Pour ceux qui estiment (il y en a beaucoup notamment dans le contexte de l'entreprise) que les moteurs traditionnels perdent en pertinence et génèrent trop de bruit (ou plus simplement dit que la quantité nuit à la qualité des résultats), la comparaison avec Swicki est déroutante. Jugez plutôt, j'ai mené une recherche en parallèle sur le Swicki et Google, puis Yahoo, puis MSN et enfin Ask.com pour une requête sur un produit (testé dans le cadre de ce site). Les résultats sont :

  • 168 pour le Swicki
  • environ 41 800 pour Yahoo
  • 4 860 pour Ask.com
  • environ 92 900 pour Google !


Je me risque à qualifier ce type d'outil de moteur communautaire et en devine assez bien ses domaines d'application dans un environnement professionnel en matière de partage des connaissances et de pertinence accrue des résultats remontés. Là où des portails sectoriels ou thématiques et autres vertical seach engines imposent une ligne éditoriale voulue et définie par l'éditeur de l'outil (donc forcément partiale), ce type d'application bénéficie des pratiques qu'en fait la communauté des utilisateurs. En ce sens, le Swicki s'inscrit dans une tendance web 2.0 dans laquelle le feedback (en temps réel) permet à l'éditeur et aux utilisateurs d'enrichir le moteur et donc sa pertinence.

Qui a parlé d'intelligence collective ?

Pour compléter : un billet paru sur Elanceur

le site Eurekster qui propose le Swicki

A essayer vite ...

... sur ce weblog, bien sûr ! (c'est dans la partie droite : Rechercher dans ce blog et d'autres)

26.04.2006

Yoono : moteur "social"

C'a y est !

Le lancement d'un nouveau moteur de recherche dit "social" (on est dans la tendance web 2.0 ou internet collaboratif) est annoncé le 23 mars dernier. Le moteur en question c'est : Yoono

Oui, mais Veille & Innovation en parlait déjà dans un billet daté du 24.11.05 ("Un outil pour partager l'information"). Alors, quoi de neuf dans le monde merveilleux du social bookmarking ?

Pour les fonctionnalités, je vous renvoie au billet de novembre et des tests réalisés à cette occasion, tout en rappelant le principe de base : la popularité d'un site qui remonte via le moteur n'est plus liée à la notion de pageRank (soit le nombre de liens qui pointent vers un site) mais se mesure au nombre de fois qu'un site a été référencé par l'ensemble de la communauté des utilisateurs de Yoono pour une requête donnée.

Précisons que le lancement officiel du moteur permet aujourd'hui de télécharger une extension Firefox qui vient ajouter une barre d'outils Yoono au navigateur et rend son usage plus simple. Ajoutons à cela le fait que Yoono permet d'identifier des "experts" rattachés à une requête. L'expert est un membre de la communauté dont le dossier favoris sur un thème donné est consulté par nombre d'utilisateurs. Le degré d'expertise est fonction de l'audience cumulée.

Pour résumer, avec Yoono, on entre dans le partage d'expérience avec la possibilité d'identifier des experts sur une recherche donnée.

L'outil offre une alternative intéressante aux moteurs de recherche traditionnels dans le sens où l'objectif n'est pas d'indexer le plus grand nombre de sources (quitte à ce que l'information pertinente soit noyée dans la masse des résultats remontés par le moteur), mais de référencer les bookmarks de ses utilisateurs.

Cette démarche - qui s'inscrit dans une logique de pré-qualification de l'information - n'est pas sans risque. Il faudra s'assurer que les bookmarks partagés soient de qualité et mis à jour régulièrement ; de même que l'outil ait atteint une masse critique en terme d'utilisateurs (le nombre de 10 000 utilisateurs circule actuellement), sans quoi la notion d'expert devient toute relative.

Retrouvez l'interview d'un des co-fondateurs du moteur

06.01.2006

Un nouveau moteur de recherche sémantique

Vu l'actualité des TIC de ces dernières semaines occupée par les thématiques liées à la recherche d'information (le projet Quaero, l'intermédiation dans la recherche avec Yahoo Answer, les diverses déclinaisons du moteur Google), on peut légitimement se demander si l'enjeu qui se dessine sur le web n'est pas le point d'entrée sur le Net depuis un moteur de recherche. Question que Google ne se pose plus depuis un certain temps avec son accueil page personnalisée.

Voici un moteur de recherche Hakia qui se distingue de la masse en ce sens qu'il s'attache au sens de la requête qui s'effectue dès lors en texte plein (ou langage naturel) et non plus sur des mots-clés ou enchaînement de mots-clés. Intérêt supplémentaire du système :

  • la requête apparaît surlignée dans le champs de réponse que remonte le moteur
  • le moteur renvoie des suggestions pour affiner la recherche

Quelques exemples de requêtes sont fournis par l'éditeur US de ce moteur. J'en ai testé quelques une :

A la question : comment trouver une aiguille dans une botte de foin ? Vous serez surpris par le nombre de personnes qui se posent la même question. Quant à savoir ce que signifie Google, mieux vaut poser la question en anglais pour obtenir réponse, mais peut-être est ce lié au fait qu'il n'y a pas de site en français suffisamment bien référencé qui apporte la réponse.

Sourde de l'info : l'excellent Outils Froids

05.01.2006

Quaero versus Google

Le moteur de recherche Google aura t-il un compétiteur européen ? Rappelons que Google génère plus de 80 % des requêtes effectuées depuis un moteur de recherche en France.

La guerre des moteurs aura t-elle lieu ? C'est la question qui agite la planète Web en ce début d'année 2006.

Résumé des faits :

- avril 2005, la France et l'Allemagne annoncent lors d'un conseil des ministres franco-allemand la mise en place du projet "Quaero" (traduire "je cherche" en latin). Il s'agit de développer un outil intégré de gestion de contenus multimédia ; pour faire simple : un moteur de recherche qui traite à la fois des données textuelles, graphiques et audio-visuelles. L'objectif est clairement d'apporter une réponse locale (européenne) à la suprématie américaine que représente Google en matière de recherche d'information sur le Net.

- le projet est piloté et financé pour partie par la nouvelle Agence pour l'Innovation Industrielle (AII)

- entre temps, diverses sources nous apprennent que le projet à réussi à fédérer des entreprises innovantes (Exalead, LTU ou Vecsys) ainsi que des acteurs majeurs des TIC (Thomson, France Télécom, Deutsche Telekom, le nom de Thales est aussi avancé)

- dernière nouvelle : le projet doit être présenté à l'AII dès la mi-janvier

Certains commentateurs n'hésitent pas à se référer au projet "Quaero" sous le vocable "Airbus du numérique". Ce qui permet d'en souligner le caractère transnational, ainsi que l'implication des états européens au côté des acteurs privés pour soutenir le projet.

Rappelons que le Japon est engagé dans une réflexion similaire.

A suivre ...

19.12.2005

Yahoo répond à Google

medium_yahooanswerslogo.jpg
Voila la réponse de Yahoo à Google dans le domaine des services d'intermédiation de questions / réponses : Yahoo Answers.

Le principe est simple : depuis la plate-forme Yahoo Answers vous posez une question et obtenez la réponse. Il s'agit d'un service gratuit de personne à personne. Seule condition : créer un compte Yahoo. Dans le détail, vous postez une question, vous la catégorisez. Une fois la ou les réponse(s) transmise(s) par le ou les répondant(s), la communauté des utilisateurs du service vote pour la réponse jugée la plus pertinente. Celle-ci est au final archivée sur la plate-forme et accessible à toute nouvelle question de même nature.

Là où la plate-forme d'interrogation proposée par Yahoo diffère de celle de Google c'est que cette dernière est payante. En effet, si le principe reste à peu de chose près identique, Google fixe un tarif d'entrée (2,50 $) pour obtenir la réponse, mais le célèbre moteur de recherche ne s'arrête pas là puisqu'il est possible de sur-enchérir jusqu'à 200 $ pour obtenir une réponse si la question initiale s'avère trop compliquée, car derrière la plate-forme point de communauté d'utilisateurs mais des "experts" labellisés par Google et rétribués pour les réponses apportées. Selon l'expression consacrée : "time is money" et plus la recherche est longue plus c'est cher.

De mémoire, il y a quelques années une société française a développé une plate-forme interactive de questions / réponses. Cette solution - dans une configuration B to B - est aujourd'hui déployée au sein d'organisations et d'entreprises. Le principe de la solution eQuesto Q&A repose sur la mise en relation entre demandeur d'information et des spécialistes dans l'organisation à même de lui répondre. Les réponses sont ensuite archivées dans une base de connaissances adossée à un moteur de recherche. La solution repose sur une technologie web et vient s'interfacer avec un réseau intranet pour partager l'information.

Plus généralement, c'est l'émergence d'un nouveau marché dans le B to B qui a pour nom ERM (Employee Relationship Management).

Pour tester Yahoo Answers

Pour tester Google Answers