DSI. Le carnet des sites de recherche

par Marc Duval
Service de recherche documentaire DSI
Boucherville. Québec


Index abrégé du site de DSI : Les actualités des sites de recherche / Les brèves de DSI
Les fiches techniques: AlltheWeb, AltaVista, AntiSearch, Google, HotBot, MSN Search, Northern Light, Voila - Tout le web francophone
/ Chronique de la recherche / Classement des automates de recherche / Les langages des automates de recherche
/ Le mot-clé / La nature du web / Le nom de domaine

[Archives] / [XML]

2004-04-30

Google et Yahoo mettent les actualités en images

Google et Yahoo ont intégré les images d'actualités à leur recherche d'images.  Tandis que Google Images affiche un échantillon d'images d'actualités en première ligne sur le modèle de la recherche de pages web avec un lien vers Google News, Yahoo! Images intègre toutes les images d'actualités provenant de son réseau sans lien avec Yahoo! News.
D'autre part, la recherche d'images dans les actualités chez Google est étendue à ses interfaces nationales, du moins en français, alors que celle chez Yahoo! est restreinte aux États-Unis pour le moment.
Yahoo! Images ne semble pas être aussi au point que Google Images pour la recherche de photos de John Kerry (John Kerry sur Yahoo! Images / John Kerry sur Google Images).

posté par Marc Duval, #référence - 14:52

Ujiko, évaluation rapide

J'ai comparé Ujiko avec Yahoo! France.  Malgré la gestion du résultat de recherche, Ujiko a été décevant.  La page d'Ujiko est grande.  Vous avez besoin d'un écran d'au moins 21 pouces pour profiter d'Ujiko.  Plus petit, vous devez déplacer le curseur.
Les dix requêtes les plus populaires sur Yahoo! France - vendredi 30 avril 2004 - ont été cherchées sur les deux sites de recherche.  A chacune des requêtes, Ujiko a trouvé la moitié des pages affichées sur Yahoo!  Ceci n'en fait pas un mauvais site de recherche parce que les pages d'accueil des sites correspondant aux requêtes s'affichent en premier et sont identifiées par l'icône d'une page colorée.
Aux requêtes «pages jaunes», «horoscope», «meteo», Yahoo affiche un formulaire de recherche pour les pages jaunes et l'horoscope, et le raccourci pour accéder à la météo d'une ville.  Ce qui constitue un atout supérieur à la gestion des pages.

Je n'attends plus d'un site de recherche qu'il me donne une liste de pages que je peux gérer.  J'attends qu'il me donne la réponse à une question pratique en moins de trois clics d'où qu'elle puisse venir (pages web ou banques de données).  Un clic pour la requête, un deuxième pour raffiner la recherche (formulaire de recherche, suggestions de recherche hiérarchiques, aperçu des pages, raccourcis, etc.) et un dernier pour atteindre l'information.

Prenons l'exemple de la requête «thé».  Le résultat de recherche n'est pas impressionnant pour aucun des deux.  Ujiko ajoute une liste de mots pour raffiner la requête qui n'a aucun rapport avec la boisson.  Yahoo! me fournit ses rubriques sur le thé qui ont une plus grande pertinence: certaines sur le commerce et une sur la boisson.  Rien n'étant parfait, Yahoo! a la fâcheuse habitude de ne pas réévaluer les sites de son répertoire et surtout il a retiré son Yahoo! Encyclopédie - bien que Yahoo! France Encyclopédie ait été reléguée dans un recoin de Yahoo!.

Ujiko est un laboratoire de recherche sympatique, un démonstrateur pour sa version commerciale.  Il a le mérite de donner des idées aux autres grands de la recherche.  Est-ce suffisant pour qu'il devienne populaire sur le web?

posté par Marc Duval, #référence - 12:41

2004-04-29

Google à la SEC

Google inc. a déposé aujourd'hui son prospectus donnant ses états financiers à la Security Exchange Commission.  Il révèle des revenus de 961,874  M$US en 2003 pour un bénéfice de 105,648 M$US.  Durant le premier trimestre de 2004,  les revenus se sont élevés à 389,638 M$US  avec un bénéfice de 63,973 M$US.  Il est prévu d'émettre des actions pour une valeur de 2,718,281,828$US.
Selon le manuel destiné aux investisseurs,  Google n'a pas l'intention de se sacrifier sur l'autel de la rentabilité.  La société continuera à investir dans des projets risqués.

Voici quelques articles traitant du sujet:
Google Inc. Files Registration Statement with the SEC for an Initial Public Offering, Google inc, Communiqué, 29 avril
Google en Bourse: c'est parti ! 2,7 milliards à la clé?, Silicon.fr, 29 avril
La très attendue entrée en Bourse de Google se fera aux enchères, Libération, 29 avril
Google lève le voile sur une très prometteuse introduction en Bourse, AFP, 29 avril
Google files for unusual $2.7 billion IPO, CNet News, 29 avril
Co-founders release Google 'owner's manual', CNet News, 29 avril

posté par Marc Duval, #référence - 18:43

Ujiko, un nouveau site de recherche qui flashe

Un nouveau site de recherche vient de voir le jour en terre de France.  Il se nomme Ujiko, un jeu de lettres voisines du clavier formant un W.
Ujiko est animé par le logiciel de Flash6 de Macromedia tout comme le méta-chercheur Kartoo, tout deux du même concepteur.  Ujiko s'appuie sur Yahoo! Search pour livrer les résultats de recherche.
L'affichage du résultat de recherche est dans un cadre attrayant, loin de l'affichage épuré d'un Google.
Ujiko a la particularité de permettre la gestion d'un résultat de recherche.  Une page peut être jetée à la corbeille, enregistrée comme coup de coeur, classée dans un dossier et notée.  Cette gestion réorganise la position des notices.
Ujiko comprend plusieurs filtres qui permettent de retrancher ou de surligner des pages: domaines, sites, url, parentaux.
L'opérateur logique par défaut est AND.  Ujiko supporte aussi OR et NOT (-).
Les liens commandités ont l'inscription (sponsor).  Ils ne peuvent être retirés du résultat de recherche ni surlignés ; ce qui constitue un irritant compte tenu des filtres existants.
Le résultat de recherche peut être imprimé ou envoyé par courriel
Quelques tests ont révélé que la gestion du résultat de recherche est intéressante.  Toutefois, le filtre parental ne semble pas être efficace à première vue.

posté par Marc Duval, #référence - 14:54

2004-04-28

CrossRef, le communiqué

La semaine dernière j'ai scoopé CrossRef qui vient d'émettre leur communiqué.  Le voici en complément :
CrossRef Launches Pilot Program of CrossRef Search, Powered By Google, Business Wire, 28 avril.

posté par Marc Duval, #référence - 15:15

2004-04-27

Google en quatre temps

A l'approche des rumeurs insistantes sur l'entrée en bourse de Google en mai, la revue Business Week publie une série d'articles sur Google dans son numéro du 3 mai.  Les articles ne révèlent rien mais font le point sur la compagnie.
Google. Why the world's hottest tech company will struggle to keep its edge
Pourquoi la société de haute technologie la plus à «la page» luttera pour garder sa suprématie.  L'auteur compare le modèle commercial d'achat intégré de Yahoo à celui compartimenté de Google.
Google fait face a des assauts de ces concurrents.  Tandis que Yahoo prend le pas avec la personnalisation de la recherche, MSN introduit dans sa mise à jour de son logiciel de messagerie l'installation par défaut de sa barre d'outils dans Internet Explorer, facilitant l'accès à ses services, dont celui de la recherche web.*
Google's Goal: "Understand Everything"
Entrevue fade avec Larry Page.
What Eric Schmidt Found at Google
Entrevue avec Eric Schmidt.  Selon M. Schmidt, l'innovation vient de l'invention qui ne peut être programmée.  Voilà le secret.
Google's Gmail Is Great -- but Not for Privacy
Le service de courriels qui offrira un espace de stockage important prête flancs aux critiques sur la protection de la vie privée.
----------------------
*Le nouveau MSN Messenger s'attaque à Google, Branchez-vous, 25 avril

posté par Marc Duval, #référence - 13:23

2004-04-21

Google le tout-puissant

Depuis la sortie de GMail, Google alimente des visionnaires.  D'aucuns le voient proposer un traitement de texte à sa barre d'outils de fureteur et à sa barre d'outils de bureau - permettant de passer naturellement de la recherche web au texte.  Les documents seraient entreposés dans sa batterie de serveurs.  De 1Go, l'espace disque de stockage passerait à 100Go.  D'autres spéculent sur la vente d'ordinateurs personnels Google avec Linux, logiciels de recherche et de gestion d'information (Google Search Appliance) inclus.  Les heureux propriétaires seraient directement branchés sur le site de Google sans passer par un fureteur - la Google Deskbar.
Ses spéculations viseraient le monopole de Microsoft autant sur le terrain des systèmes d'exploitation que sur celui des logiciels de traitement de l'information et d'accès à Internet.
Source: Google eyes Net operating system, The Argus, 19 avril.

posté par Marc Duval, #référence - 23:34

Real s'allie à Google

La version 10 de RealPlayer a ajouté à son offre la barre d'outils de Google selon le communiqué de RealNetWorks.  Une fonction de RealPlayer permet de charger la barre d'outils.  Or, Google n'a pas de catalogue audio-visuel.  Cette alliance permet à Google de combler cette lacune à court terme.  Serait-ce le premier pas de Google dans la recherche de documents audio-visuels?
posté par Marc Duval, #référence - 10:17

2004-04-19

CrossRef Search Pilot powered by Google

Google collabore depuis quelques mois au projet pilote CrossRef Search.  CrossRef est un regroupement de 290 éditeurs, 288 bibliothèques et une vingtaine d'entreprises et d'organismes comme les serveurs Dialog et Cambridge Scientific Abstact, l'agence d'abonnement Ebsco, des fournisseurs de documents comme Ingenta.  Ce regroupement constitue le noyau dur du web payant inaccessible aux automates de recherche à moins d'entente.  Ce d'aucuns appellent le web invisible. Il a permis à Google d'indexer le contenu intégral des publications de neuf éditeurs dans le cadre du projet pilote.  Chaque article reçoit un numéro dans son URL.  L'attribution de ce numéro permet une identification unificatrice.  En plus d'un système unique d'indentification, chaque article reçoit de l'éditeur des métadonnées permettant une recherche efficace.  La revue Nature fait partie de CrossRef.  Elle a sur son site le module de recherche actionné par Google.  Finalement, ce projet s'inscrit dans la lignée du web sémantique.  Ce n'est que dans des regroupements spécialisés comme CrossRef que le web sémantique peut se réaliser.  Dans une moindre mesure, le programme Google Print intègre cette orientation en fichant des articles de périodiques identifiés par [magazine] à la gauche du titre dans le résultat de recherche; la description des fiches pouvant être assimilée à des métadonnées.
posté par Marc Duval, #référence - 23:14

Jeeves affiche ses personnalités

Le site de recherche expert Ask Jeeves *** a ajouté officiellement le 13 avril la recherche de célébrités en collaboration avec le site biographique Who2.  L'extrait encadré de la notice biographique est accompagné d'une photo provenant du web.
Ask Jeeves a choisi un partenaire mineur.  Les biographies de Who2 sont limitées à quelques 2 200 entrées comparativement au site biographie.net avec près de 25 000 entrées dont plus de 5 800 en français.
Parmi les premiers ministres canadiens, Jean Chrétien et Pierre Trudeau sont dans Who2.  Mais pas Brian Mulroney ni Paul Martin... ni paradoxalement Pierre Élliott Trudeau - alias Pierre Trudeau ci-devant cité - qui fait un pied de nez à la renommée de Ask Jeeves en tant que moteur de recherche en langage naturel.  Jacques Chirac, Jean-Marie Le Pen et Charles de Gaule ont leur entrée.  Le grand hockeyeur Wayne Gretzki - mais non Gretzki seul - a sa biographie mais pas le célèbre Maurice Richard, ni Louis Lumière... mais Louis Lumiére est dans Who2 ignoré par Jeeves quelque soit l'orthographe.  Moralité: mieux vaut chercher dans Who2 qu'avec Jeeves.  Malgré ces lacunes, ce n'est pas un handicap grâce aux recherches liés d'Ask Jeeves, sinon avec une meilleure requête.
Ask Jeeves aurait pu choisir un partenaire d'envergure par exemple Infoplease.   Ask Jeeves et Infoplease sont complémentaires.   Leur alliance aurait eu plus d'impact que celle avec Who2.  L'entrée de plus en plus intrusive de la publicité dans les résultats des automates de recherche les rendent de moins en moins pertinents.  C'est pourquoi une alliance avec des sites encyclopédiques est stratégique.  MSN a une longueur d'avance sur ce terrain avec Encarta.  Yahoo a tous les outils qu'il faut à condition qu'il sache en tirer partie.   Wikipédia et Google (ou Nutch - à venir) feraient bonne équipe.  Le hic! est que tous ont la publicité commerciale - maintenant locale - dans le collimateur.  Au lieu de voir de l'amélioration, nous sommes témoins de la détérioration avec le retrait de plusieurs fonctions et préfixes de recherche d'AltaVista et d'AlltheWeb, notamment.
***Le noyau d'Ask Jeeves est une banque de données de connaissance de type «questions/réponses»; ce qui lui donne l'apparence d'un moteur de recherche en langage naturel.

posté par Marc Duval, #référence - 20:56

2004-04-18

Amazon lance A9

Le cyber-libraire a lancé un site de recherche appelé A9 en phase d'essai mercredi 14 avril. La page de tons de beige est sobre.  Elle ne comprend qu'une boîte de recherche sans aucune fonction, aucun formulaire comme Amazon ou Google.
Ce service de recherche a pour but d'intégrer la recherche web au site commercial web.  Il utilise la banque de données de Google.com couplée à deux logiciels.  Le premier - A9 - fait un lien entre une page web de Google à la banque de données des produits d'Amazon.com : livres, musique, électronique, etc.  Le second relie la page web a des données statistiques recueillis par la société Alexa, filiale d'Amazon.  Cette fonction est illustrée par la cartouche site info à la fin de chaque notice du résultat de recherche web.

A9 est intimement et uniquement relié à Amazon.com.  Il ne dessert pas encore la clientèle canadienne, française ou britannique.
Le résultat de recherche de A9 est particulier.  Il est constitué de trois sections identifiés par des onglets donnant l'impression de signets de livres.   La première section est le résultat web fourni par Google et encadré par les liens publicitaires de Google.  La deuxième est le résultat provenant d'Amazon lorsque la requête porte sur un produit de son catalogue.  S'il s'agit d'un livre, l'abonné à Amazon aura droit à la fonction de recherche Search inside the book.  La troisième section est l'historique de la recherche pour l'abonné à Amazon.   Cette dernière fonction est la reprise de celle sur le site même d'Amazon.   L'abonné peut «éditer» l'historique pour supprimer des recherches.  Trois jours après la sortie de A9, elle n'était pas encore active.  Les sections peuvent être ouvertes en cliquant sur les onglets ou en réglant les divisions.  Elles forment alors trois colonnes pouvant être fermées à gauche ou à droite.  Enfin, l'internaute peut lancer une recherche à partir de la barre d'adresse d'Internet Explorer en utilisant une requête sous cette forme www.a9.com/requête

Il va de soi  que le service offre une barre d'outils pour Internet Explorer.  On y retrouve les fonctions habituelles: module de recherche, mise en évidence des termes de recherche et bloqueur de fenêtres-pubs. Le module de recherche a trois sections : la recherche traditionnelle sur le web, sur le site et sur la page; la recherche sur les produits en général ou en particulier d'Amazon, et la recherche dans quatre services: Google, le dictionnaire général Merriam-Webster et à son dictionnaire des synonymes, et à la banque de données cinématographiques IMDb.  A9 ajoute trois fonctions de son crû pour les abonnés d'Amazon : l'historique, le carnet (diary) et l'info-site.  Le carnet sert à annoter la recherche.  Précisons que les internautes qui utilisent cette barre d'outils est reliée à Alexa.  Par conséquent, ils participent aux statistiques de l'info-site.

En lançant son propre service de recherche en marge de son propre site,  Amazon entre en concurrence avec Yahoo! et Google.  Amazon compte lancer A9 sur le marché des fournisseurs de service de recherche.  Il ne lui restera plus qu'à laisser Google pour boucler la boucle.  Yahoo! a défriché le chemin.  MSN suivra.  Que fera AOL devant les prétentions de Google?
Articles reliés:
Amazon lève le voile sur son moteur de recherche A9 , ZDNet France, 16 avril
A9, nouvelle arme d'Amazon, LCI, 16 avril
Mise à jour 20 avril: L'historique de la recherche est particulièrement utile. Elle comprend la liste des pages visitées hyperliées et la liste des requêtes aussi hyperliées. Chaque élément de chacune des listes peut être supprimé. Les listes des requêtes sont divisées en dossiers selon les jours de recherche. Il lui manque les alertes pour que cette fonction soit indispensable. A9 est intégré à Amazon avec l'historique de la recherche mais il est moins pratique. La recherche dans les produits d'Amazon est sur une autre page plutôt qu'intégrée à la page de recherche. Votre dossier de recherche vous suit d'Amazone vers A9 et vice versa. Mentionnons aussi la note [New result] à la fin gauche de l'adresse web des notices. Cette note changera en [ Clicked 2 days ago ] par exemple pour vous signalez que vous avez visité la page. Enfin, utilisez l'adresse http://generic.a9.com si vous êtes réfractaires aux fichiers témoins. Source: Help, A9.com

posté par Marc Duval, #référence - 16:24

2004-04-13

Un moteur de l 'info voit le jour

Un nouveau site de recherche d'actualités est en formation.  Le moteur de l'info est l'oeuvre de M. Gilles D'Elia de Gunix.org.  Il comprend neuf thèmes : A la une, International, France, Économie, Multimédia, Science/Tech, Sports, Culture et Santé.
La banque de données est limitée.  Le site n'a ni formulaire de recherche ni tri par dates.  En revanche, certains titres ont une photo.
Le projet du Moteur de l'info est d'archiver les actualités contrairement à Google qui les garde deux mois.  Il est prévu d'être opérationnel au début de l'été.
Source:
Un moteur de recherches d’informations francophones en développement à Nice in Le journal de Nice, 15 mars 2004.

posté par Marc Duval, #référence - 00:30

Les enjeux culturels des moteurs de recherche

La  Bibliothèque publique d'information du Centre Georges Pompidou vient d'ouvrir un lieu public consacré aux débats culturels.  La première conférence traite des Les enjeux culturels des moteurs de recherche.   Le dossier qui en a résulté comprend cinq interventions: Les systèmes techniques des moteurs de recherche, Les sources de revenus de Google et son modèle économique  , Google. Une enquête.  Google et la bibliothèque : quelle autonomie pour l’usager ? Logiques d’enquêtes et moteurs de (la) recherche  ,  Chacune d'entre ont un résumé et son enregistrement MP3.  L'intervention sur l'enquête de Google est la plus intéressante.  Le conférencier donne deux pistes de recherche : l'indexation distribuée et le partage des données.  En complément d'information le projet d'indexation distribuée est représenté par Grub et celui de partage de données par Human Links.
posté par Marc Duval, #référence - 00:02

2004-04-08

Google en manchettes, Inktomi avance


Depuis un mois, Yahoo est dans les grandes manoeuvres en avançant sa tour Inktomi.  Après les sites AlltheWeb puis AltaVista, il remplace petit à petit les portails qui avaient AlltheWeb comme Lycos, Tiscali Recherche (Nomade), Excite Europe.  Yahoo! essaie d'encercler Google.  Aussi, la banque d'images est la même pour Yahoo!, AltaVista, AlltheWeb et Excite Europe.

Du côté de Google, il semble qu'il y ait des ratés avec son service de courriels GMail.  Google prévoit financer ce service en intégrant de la publicité ciblée; ce qui mettrait en péril la vie privée.  D'autre part, sa marque de commerce est contestée par une entreprise britannique.  De l'autre, son offre de 1Go d'archivage est contestée parce que les messages ne pourraient être effacés.  Qu'à cela ne tienne, le site SpyMac a déjà relancé Google à 1Go sans publicité dans les courriels.
Sources:
Un site concurrence Google en offrant un compte de courriel gratuit de 1000 Mo, Branchez-vous, 6 avril.
Gmail: plus difficile que prévu, Journal Les Affaires, 8 avril

posté par Marc Duval, #référence - 23:05

2004-04-02

AltaVista passe à Inktomi

AltaVista est passé à la moulinette de Yahoo après AlltheWeb.  HotBot étant l'étalon de mesure, les trois sites de recherche ont Inktomi alors que Yahoo! a une banque de données beaucoup plus développée.
Le langage de recherche spécifique à AltaVista a été changé par celui de Yahoo! Search Technology.  Ainsi, AltaVista a perdu quatre préfixes de recherche: anchor:, applet:, like:. text: et image:. , les opérateurs NEAR et de troncature.  L'opérateur d'exclusion AND NOT est remplacé par NOT dans le formulaire de recherche, mais demeure dans le tableau de la recherche avancée.   De plus, sa fonction de tri a été retirée.
Sa liste des suffixes de domaines a été retirée du formulaire.  Les types de formats sont identiques à AlltheWeb: PDF, Microsoft Word, Microsoft Excel (.xls), Microsoft Power Point (.ppt), HTML et Text (.txt).  AlltheWeb garde l'exclusivité de Macromedia Flash (.swf).
AltaVista demeure sensible aux accents.  Cependant son système Prisma est remplacé par celui des Recherches associées qui se désactive lorsque la requête est écrite en capitales. Bien que les parenthèses pour les requêtes complexes aient été retirés du tableau de la recherche avancée, elles demeurent actives du moins pour le moment.
Il ne semble pas y avoir eu pour le moment de fusion entre les banques de données, mais un remplacement par celle d'Inktomi.  Avec le retrait des langages de recherche d'AltaVista et d'AlltheWeb qui étaient plus avancés que celui de Google, cela constitue une grande perte.

posté par Marc Duval, #référence - 01:38

2004-04-01

Google sur la lune

Google a l'intention d'ouvrir un centre de recherche sur la lune en 2007.
Plus tôt, les États-Unis et la Chine avaient  lancé leur intention l'un de revenir sur l'astre lunaire et l'autre de s'y établir.  Google les devance.  La société a déjà commencé à engager des informaticiens et des techniciens pour son Centre Copernic.  Leur but est «d'organiser toute l'information utile dans l'univers et de vous la servir sur un craquelin légèrement salé.»
Le programme complet de cet ambitieux projet est disponible sur la page d'offres d'emploi du Centre Copernic de Google.

posté par Marc Duval, #référence - 07:10


This page is powered by Blogger. Isn't yours?
Bienvenue au Carnet des sites de recherche. Vous trouverez dans ce carnet mes observations sur les sites de recherche autant états-uniens, canadiens que français. Si vous découvrez quoi que ce soit sur l'un ou l'autre site, n'hésitez pas à me contacter. Je me ferais un plaisir d'ajouter votre contribution.

www.blogwise.com

[Retour au début]
03/01/2002 - 03/31/2002 04/01/2002 - 04/30/2002 05/01/2002 - 05/31/2002 06/01/2002 - 06/30/2002 07/01/2002 - 07/31/2002 08/01/2002 - 08/31/2002 09/01/2002 - 09/30/2002 10/01/2002 - 10/31/2002 11/01/2002 - 11/30/2002 12/01/2002 - 12/31/2002 01/01/2003 - 01/31/2003 02/01/2003 - 02/28/2003 03/01/2003 - 03/31/2003 04/01/2003 - 04/30/2003 05/01/2003 - 05/31/2003 06/01/2003 - 06/30/2003 07/01/2003 - 07/31/2003 08/01/2003 - 08/31/2003 09/01/2003 - 09/30/2003 10/01/2003 - 10/31/2003 11/01/2003 - 11/30/2003 12/01/2003 - 12/31/2003 01/01/2004 - 01/31/2004 02/01/2004 - 02/29/2004 03/01/2004 - 03/31/2004 04/01/2004 - 04/30/2004


Hit-Parade