DSI. Le carnet des sites de recherche
par Marc Duval
Service de recherche documentaire
DSI
Boucherville. Québec
Index abrégé du site de DSI
: Les actualités des sites de
recherche / Les
brèves de DSI
Les fiches techniques: AlltheWeb,
AltaVista,
AntiSearch,
Google,
HotBot,
MSN
Search, Northern
Light, Voila
- Tout le web francophone
/ Chronique
de la recherche / Classement
des automates de recherche / Les langages des
automates de recherche
/ Le
mot-clé / La nature du
web / Le nom de
domaine
[Archives] / [XML]
2004-04-30
Google et Yahoo mettent les actualités en
images
Google et Yahoo ont
intégré les images d'actualités à leur recherche d'images. Tandis que
Google Images affiche un échantillon d'images d'actualités en première ligne sur
le modèle de la recherche de pages web avec un lien vers Google News, Yahoo! Images
intègre toutes les images d'actualités provenant de son réseau sans lien avec
Yahoo! News.
D'autre part, la recherche d'images dans les actualités chez
Google est étendue à ses interfaces nationales, du moins en français, alors que
celle chez Yahoo! est restreinte aux États-Unis pour le moment.
Yahoo! Images
ne semble pas être aussi au point que Google Images pour la recherche de photos
de John Kerry (John
Kerry sur Yahoo! Images / John
Kerry sur Google Images).
posté par Marc Duval, #référence
- 14:52
Ujiko, évaluation rapide
J'ai comparé Ujiko avec
Yahoo! France. Malgré la gestion du résultat de recherche, Ujiko a été
décevant. La page d'Ujiko est grande. Vous avez besoin d'un écran
d'au moins 21 pouces pour profiter d'Ujiko. Plus petit, vous devez
déplacer le curseur.
Les dix
requêtes les plus populaires sur Yahoo! France - vendredi 30 avril 2004 -
ont été cherchées sur les deux sites de recherche. A chacune des requêtes,
Ujiko a trouvé la moitié des pages affichées sur Yahoo! Ceci n'en fait pas
un mauvais site de recherche parce que les pages d'accueil des sites
correspondant aux requêtes s'affichent en premier et sont identifiées par
l'icône d'une page colorée.
Aux requêtes «pages jaunes», «horoscope»,
«meteo», Yahoo affiche un formulaire de recherche pour les pages jaunes et
l'horoscope, et le raccourci pour accéder à la météo d'une ville. Ce qui
constitue un atout supérieur à la gestion des pages.
Je n'attends plus
d'un site de recherche qu'il me donne une liste de pages que je peux
gérer. J'attends qu'il me donne la réponse à une question pratique en
moins de trois clics d'où qu'elle puisse venir (pages web ou banques de
données). Un clic pour la requête, un deuxième pour raffiner la recherche
(formulaire de recherche, suggestions de recherche hiérarchiques, aperçu des
pages, raccourcis, etc.) et un dernier pour atteindre l'information.
Prenons l'exemple de la requête «thé». Le résultat de recherche
n'est pas impressionnant pour aucun des deux. Ujiko ajoute une liste de
mots pour raffiner la requête qui n'a aucun rapport avec la boisson.
Yahoo! me fournit ses rubriques sur le thé qui ont une plus grande pertinence:
certaines sur le commerce et une sur la boisson. Rien n'étant parfait,
Yahoo! a la fâcheuse habitude de ne pas réévaluer les sites de son répertoire et
surtout il a retiré son Yahoo! Encyclopédie - bien que Yahoo! France
Encyclopédie ait été reléguée dans un recoin de Yahoo!.
Ujiko est un
laboratoire de recherche sympatique, un démonstrateur pour sa version
commerciale. Il a le mérite de donner des idées aux autres grands de la
recherche. Est-ce suffisant pour qu'il devienne populaire sur le
web?
posté par Marc Duval, #référence
- 12:41
2004-04-29
Google à la
SEC
Google inc.
a déposé aujourd'hui son prospectus donnant
ses états financiers à la Security Exchange Commission. Il révèle des
revenus de 961,874 M$US en 2003 pour un bénéfice de 105,648 M$US.
Durant le premier trimestre de 2004, les revenus se sont élevés à 389,638
M$US avec un bénéfice de 63,973 M$US. Il est prévu d'émettre des
actions pour une valeur de 2,718,281,828$US.
Selon le
manuel destiné aux investisseurs, Google n'a pas l'intention de se
sacrifier sur l'autel de la rentabilité. La société continuera à investir
dans des projets risqués.
Voici
quelques articles traitant du sujet:
Google Inc. Files
Registration Statement with the SEC for an Initial Public Offering, Google
inc, Communiqué, 29 avril
Google en Bourse: c'est
parti ! 2,7 milliards à la clé?,
Silicon.fr, 29 avril
La très attendue entrée
en Bourse de Google se fera aux enchères,
Libération, 29 avril
Google
lève le voile sur une très prometteuse introduction en Bourse, AFP, 29
avril
Google files for
unusual $2.7 billion IPO, CNet
News, 29 avril
Co-founders release
Google 'owner's manual', CNet
News, 29 avril
posté par Marc Duval, #référence
- 18:43
Ujiko, un nouveau site de recherche qui
flashe
Un nouveau site de recherche
vient de voir le jour en terre de France. Il se nomme Ujiko, un jeu de lettres voisines du clavier
formant un W.
Ujiko est animé par le logiciel de Flash6 de Macromedia tout
comme le méta-chercheur Kartoo, tout deux du même concepteur. Ujiko
s'appuie sur Yahoo! Search pour livrer les résultats de
recherche.
L'affichage du résultat de recherche est dans un cadre attrayant,
loin de l'affichage épuré d'un Google.
Ujiko a la particularité de permettre
la gestion d'un résultat de recherche. Une page peut être jetée à la
corbeille, enregistrée comme coup de coeur, classée dans un dossier et
notée. Cette gestion réorganise la position des notices.
Ujiko comprend
plusieurs filtres qui permettent de retrancher ou de surligner des pages:
domaines, sites, url, parentaux.
L'opérateur logique par défaut est
AND. Ujiko supporte aussi OR et NOT (-).
Les liens commandités ont
l'inscription (sponsor). Ils ne peuvent être retirés du résultat de
recherche ni surlignés ; ce qui constitue un irritant compte tenu des filtres
existants.
Le résultat de recherche peut être imprimé ou envoyé par
courriel
Quelques tests ont révélé que la gestion du résultat de recherche
est intéressante. Toutefois, le filtre parental ne semble pas être
efficace à première vue.
posté par Marc Duval, #référence
- 14:54
2004-04-28
CrossRef, le communiqué
La semaine dernière
j'ai scoopé CrossRef qui vient d'émettre leur communiqué. Le voici en
complément :
CrossRef
Launches Pilot Program of CrossRef Search, Powered By Google, Business
Wire, 28 avril.
posté par Marc Duval, #référence
- 15:15
2004-04-27
Google en quatre temps
A l'approche des
rumeurs insistantes sur l'entrée en bourse de Google en mai, la revue Business
Week publie une série d'articles sur Google dans son numéro du 3 mai. Les
articles ne révèlent rien mais font le point sur la compagnie.
Google.
Why the world's hottest tech company will struggle to keep its
edge
Pourquoi la société de haute technologie la plus à «la page» luttera
pour garder sa suprématie. L'auteur compare le modèle commercial d'achat
intégré de Yahoo à celui compartimenté de Google.
Google fait face a des
assauts de ces concurrents. Tandis que Yahoo prend le pas avec la
personnalisation de la recherche, MSN introduit dans sa mise à jour de son
logiciel de messagerie l'installation par défaut de sa barre d'outils dans
Internet Explorer, facilitant l'accès à ses services, dont celui de la recherche
web.*
Google's
Goal: "Understand Everything"
Entrevue fade avec Larry Page.
What
Eric Schmidt Found at Google
Entrevue avec Eric Schmidt. Selon M.
Schmidt, l'innovation vient de l'invention qui ne peut être programmée.
Voilà le secret.
Google's
Gmail Is Great -- but Not for Privacy
Le service de courriels qui offrira
un espace de stockage important prête flancs aux critiques sur la protection de
la vie privée.
----------------------
*Le nouveau MSN
Messenger s'attaque à Google, Branchez-vous, 25
avril
posté par Marc Duval, #référence
- 13:23
2004-04-21
Google le tout-puissant
Depuis
la sortie de GMail, Google alimente des visionnaires.
D'aucuns le voient proposer un traitement de texte à sa barre d'outils de fureteur et à sa barre d'outils de bureau
- permettant de passer naturellement de la recherche web au texte. Les
documents seraient entreposés dans sa batterie de serveurs. De 1Go,
l'espace disque de stockage passerait à 100Go. D'autres spéculent sur la
vente d'ordinateurs personnels Google avec Linux, logiciels de recherche et de
gestion d'information (Google Search Appliance) inclus. Les heureux
propriétaires seraient directement branchés sur le site de Google sans passer
par un fureteur - la Google Deskbar.
Ses spéculations viseraient le monopole
de Microsoft autant sur le terrain des systèmes d'exploitation que sur celui des
logiciels de traitement de l'information et d'accès à Internet.
Source: Google
eyes Net operating system, The Argus, 19
avril.
posté par Marc Duval, #référence
- 23:34
Real s'allie à Google
La version 10 de
RealPlayer a ajouté à son offre la barre d'outils de Google selon le communiqué
de RealNetWorks. Une fonction de RealPlayer permet de charger la barre
d'outils. Or, Google n'a pas de catalogue audio-visuel. Cette
alliance permet à Google de combler cette lacune à court terme. Serait-ce
le premier pas de Google dans la recherche de documents
audio-visuels?
posté par Marc Duval, #référence
- 10:17
2004-04-19
CrossRef Search Pilot powered by
Google
Google collabore depuis quelques mois
au projet pilote CrossRef
Search. CrossRef est un regroupement de 290 éditeurs, 288
bibliothèques et une vingtaine d'entreprises et d'organismes comme les serveurs
Dialog et Cambridge Scientific Abstact, l'agence
d'abonnement Ebsco, des fournisseurs de
documents comme Ingenta. Ce
regroupement constitue le noyau dur du web payant inaccessible aux automates de
recherche à moins d'entente. Ce d'aucuns appellent le web
invisible. Il a permis à Google d'indexer le contenu intégral des
publications de neuf éditeurs dans le cadre du projet pilote. Chaque
article reçoit un numéro dans son URL. L'attribution de ce numéro permet
une identification unificatrice. En plus d'un système unique
d'indentification, chaque article reçoit de l'éditeur des métadonnées permettant
une recherche efficace. La revue Nature fait partie de
CrossRef. Elle a sur son site le module de recherche actionné par
Google. Finalement, ce projet s'inscrit dans la lignée du web
sémantique. Ce n'est que dans des regroupements spécialisés comme CrossRef
que le web sémantique peut se réaliser. Dans une moindre mesure, le
programme Google Print
intègre cette orientation en fichant des articles de périodiques identifiés par
[magazine]
à la gauche du titre dans le résultat de recherche; la description des fiches
pouvant être assimilée à des métadonnées.
posté par
Marc Duval, #référence
- 23:14
Jeeves affiche ses
personnalités
Le site de recherche expert Ask Jeeves *** a ajouté officiellement le 13
avril la recherche de célébrités en collaboration avec le site biographique Who2. L'extrait encadré de la notice
biographique est accompagné d'une photo provenant du web.
Ask Jeeves a choisi
un partenaire mineur. Les biographies de Who2 sont limitées à quelques 2
200 entrées comparativement au site biographie.net avec près de 25 000 entrées
dont plus de 5 800 en français.
Parmi les premiers ministres canadiens, Jean
Chrétien et Pierre Trudeau sont dans Who2. Mais pas Brian Mulroney ni Paul
Martin... ni paradoxalement Pierre Élliott Trudeau - alias Pierre Trudeau
ci-devant cité - qui fait un pied de nez à la renommée de Ask Jeeves en tant que
moteur de recherche en
langage naturel. Jacques Chirac, Jean-Marie Le Pen et Charles de
Gaule ont leur entrée. Le grand hockeyeur Wayne Gretzki - mais non Gretzki
seul - a sa biographie mais pas le célèbre Maurice Richard, ni Louis Lumière...
mais Louis Lumiére est dans Who2 ignoré par Jeeves quelque soit
l'orthographe. Moralité: mieux vaut chercher dans Who2 qu'avec
Jeeves. Malgré ces lacunes, ce n'est pas un handicap grâce aux recherches
liés d'Ask Jeeves, sinon avec une meilleure requête.
Ask Jeeves aurait pu
choisir un partenaire d'envergure par exemple Infoplease. Ask Jeeves et Infoplease sont
complémentaires. Leur alliance aurait eu plus d'impact que celle
avec Who2. L'entrée de plus en plus intrusive de la publicité dans les
résultats des automates de recherche les rendent de moins en moins
pertinents. C'est pourquoi une alliance avec des sites encyclopédiques est
stratégique. MSN a une longueur d'avance sur ce terrain avec
Encarta. Yahoo a tous les outils qu'il faut à condition qu'il sache en
tirer partie. Wikipédia et Google (ou Nutch - à venir) feraient bonne
équipe. Le hic! est que tous ont la publicité commerciale - maintenant
locale - dans le collimateur. Au lieu de voir de l'amélioration, nous
sommes témoins de la détérioration avec le retrait de plusieurs fonctions et
préfixes de recherche d'AltaVista et d'AlltheWeb, notamment.
***Le noyau
d'Ask Jeeves est une banque de données de connaissance de type
«questions/réponses»; ce qui lui donne l'apparence d'un moteur de recherche
en langage naturel.
posté par Marc Duval, #référence
- 20:56
2004-04-18
Amazon lance A9
Le cyber-libraire a
lancé un site de recherche appelé A9 en phase
d'essai mercredi 14 avril. La page de tons de beige est sobre. Elle ne
comprend qu'une boîte de recherche sans aucune fonction, aucun formulaire comme
Amazon ou Google.
Ce service de recherche a pour but d'intégrer la recherche
web au site commercial web. Il utilise la banque de données de Google.com
couplée à deux logiciels. Le premier - A9 - fait un lien entre une page
web de Google à la banque de données des produits d'Amazon.com : livres,
musique, électronique, etc. Le second relie la page web a des données
statistiques recueillis par la société Alexa, filiale d'Amazon. Cette
fonction est illustrée par la cartouche site info à la fin de chaque
notice du résultat de recherche web.
A9 est intimement et uniquement
relié à Amazon.com. Il ne dessert pas encore la clientèle canadienne,
française ou britannique.
Le résultat de recherche de A9 est
particulier. Il est constitué de trois sections identifiés par des onglets
donnant l'impression de signets de livres. La première section est
le résultat web fourni par Google et encadré par les liens publicitaires de
Google. La deuxième est le résultat provenant d'Amazon lorsque la requête
porte sur un produit de son catalogue. S'il s'agit d'un livre, l'abonné à
Amazon aura droit à la fonction de recherche Search inside the
book. La troisième section est l'historique de la recherche pour
l'abonné à Amazon. Cette dernière fonction est la reprise de celle sur le
site même d'Amazon. L'abonné peut «éditer» l'historique pour
supprimer des recherches. Trois jours après la sortie de A9, elle n'était
pas encore active. Les sections peuvent être ouvertes en cliquant sur les
onglets ou en réglant les divisions. Elles forment alors trois colonnes
pouvant être fermées à gauche ou à droite. Enfin, l'internaute peut lancer
une recherche à partir de la barre d'adresse d'Internet Explorer en utilisant
une requête sous cette forme www.a9.com/requête
Il va de
soi que le service offre une barre d'outils pour Internet Explorer.
On y retrouve les fonctions habituelles: module de recherche, mise en évidence
des termes de recherche et bloqueur de fenêtres-pubs. Le module de recherche a
trois sections : la recherche traditionnelle sur le web, sur le site et sur la
page; la recherche sur les produits en général ou en particulier d'Amazon, et la
recherche dans quatre services: Google, le dictionnaire général Merriam-Webster
et à son dictionnaire des synonymes, et à la banque de données
cinématographiques IMDb. A9 ajoute trois fonctions de son crû pour les
abonnés d'Amazon : l'historique, le carnet (diary) et l'info-site. Le
carnet sert à annoter la recherche. Précisons que les internautes qui
utilisent cette barre d'outils est reliée à Alexa. Par conséquent, ils
participent aux statistiques de l'info-site.
En lançant son propre
service de recherche en marge de son propre site, Amazon entre en
concurrence avec Yahoo! et Google. Amazon compte lancer A9 sur le marché
des fournisseurs de service de recherche. Il ne lui restera plus qu'à
laisser Google pour boucler la boucle. Yahoo! a défriché le chemin.
MSN suivra. Que fera AOL devant les prétentions de Google?
Articles
reliés:
Amazon
lève le voile sur son moteur de recherche A9 , ZDNet France, 16 avril
A9,
nouvelle arme d'Amazon, LCI, 16 avril
Mise à jour 20
avril: L'historique de la recherche est particulièrement utile. Elle
comprend la liste des pages visitées hyperliées et la liste des requêtes aussi
hyperliées. Chaque élément de chacune des listes peut être supprimé. Les listes
des requêtes sont divisées en dossiers selon les jours de recherche. Il lui
manque les alertes pour que cette fonction soit indispensable. A9 est intégré à
Amazon avec l'historique de la recherche mais il est moins pratique. La
recherche dans les produits d'Amazon est sur une autre page plutôt qu'intégrée à
la page de recherche. Votre dossier de recherche vous suit d'Amazone vers A9 et
vice versa. Mentionnons aussi la note [New result] à la fin
gauche de l'adresse web des notices. Cette note changera en [ Clicked 2
days ago ] par exemple pour vous signalez que vous avez visité la page.
Enfin, utilisez l'adresse http://generic.a9.com si vous êtes
réfractaires aux fichiers témoins. Source: Help,
A9.com
posté par Marc Duval, #référence
- 16:24
2004-04-13
Un moteur de l 'info voit le
jour
Un nouveau site de
recherche d'actualités est en formation. Le moteur de l'info est l'oeuvre de M.
Gilles D'Elia de Gunix.org. Il comprend neuf thèmes : A la une,
International, France, Économie, Multimédia, Science/Tech, Sports, Culture et
Santé.
La banque de données est limitée. Le site n'a ni formulaire de
recherche ni tri par dates. En revanche, certains titres ont une
photo.
Le projet du Moteur de l'info est d'archiver les actualités
contrairement à Google qui les garde deux mois. Il est prévu d'être
opérationnel au début de l'été.
Source:
Un moteur de recherches
d’informations francophones en développement à Nice in Le journal de
Nice, 15 mars 2004.
posté par Marc Duval, #référence
- 00:30
Les enjeux culturels des moteurs de
recherche
La Bibliothèque
publique d'information du Centre Georges Pompidou vient d'ouvrir un lieu public
consacré aux débats culturels. La première conférence traite des Les enjeux culturels des
moteurs de recherche. Le dossier qui en a résulté comprend cinq
interventions: Les
systèmes techniques des moteurs de recherche, Les sources de revenus de
Google et son modèle économique , Google. Une enquête.
, Google et la
bibliothèque : quelle autonomie pour l’usager ? , Logiques d’enquêtes et
moteurs de (la) recherche , Chacune d'entre ont un résumé et son
enregistrement MP3. L'intervention sur l'enquête de Google est la plus
intéressante. Le conférencier donne deux pistes de recherche :
l'indexation distribuée et le partage des données. En complément
d'information le projet d'indexation distribuée est représenté par Grub et celui de partage de données par Human
Links.
posté par Marc Duval, #référence
- 00:02
2004-04-08
Google en manchettes, Inktomi
avance
Depuis un mois, Yahoo est
dans les grandes manoeuvres en avançant sa tour Inktomi. Après les sites
AlltheWeb puis AltaVista, il remplace petit à petit les portails qui avaient
AlltheWeb comme Lycos, Tiscali Recherche (Nomade), Excite Europe. Yahoo!
essaie d'encercler Google. Aussi, la banque d'images est la même pour
Yahoo!, AltaVista, AlltheWeb et Excite Europe.
Du côté de Google, il
semble qu'il y ait des ratés avec son service de courriels GMail. Google
prévoit financer ce service en intégrant de la publicité ciblée; ce qui mettrait
en péril la vie privée. D'autre part, sa marque de commerce est contestée
par une entreprise britannique. De l'autre, son offre de 1Go d'archivage
est contestée parce que les messages ne pourraient être effacés. Qu'à cela
ne tienne, le site SpyMac a déjà relancé Google à 1Go sans publicité dans les
courriels.
Sources:
Un site
concurrence Google en offrant un compte de courriel gratuit de 1000 Mo,
Branchez-vous, 6 avril.
Gmail:
plus difficile que prévu, Journal Les Affaires, 8
avril
posté par Marc Duval, #référence
- 23:05
2004-04-02
AltaVista passe à
Inktomi
AltaVista est passé à la
moulinette de Yahoo après AlltheWeb. HotBot étant l'étalon de mesure, les
trois sites de recherche ont Inktomi alors que Yahoo! a une banque de données
beaucoup plus développée.
Le langage de recherche spécifique à AltaVista a
été changé par celui de Yahoo! Search Technology. Ainsi, AltaVista a perdu
quatre préfixes de recherche: anchor:, applet:, like:. text: et image:. , les
opérateurs NEAR et de troncature. L'opérateur d'exclusion AND NOT est
remplacé par NOT dans le formulaire de recherche, mais demeure dans le tableau de la recherche
avancée. De plus, sa fonction de tri a été retirée.
Sa liste
des suffixes de domaines a été retirée du formulaire. Les types de formats
sont identiques à AlltheWeb: PDF, Microsoft Word, Microsoft Excel (.xls),
Microsoft Power Point (.ppt), HTML et Text (.txt). AlltheWeb garde
l'exclusivité de Macromedia Flash (.swf).
AltaVista demeure sensible aux
accents. Cependant son système Prisma est remplacé par celui des
Recherches associées qui se désactive lorsque la requête est écrite en
capitales. Bien que les parenthèses pour les requêtes complexes aient été
retirés du tableau de la recherche avancée, elles demeurent actives du moins
pour le moment.
Il ne semble pas y avoir eu pour le moment de fusion entre
les banques de données, mais un remplacement par celle d'Inktomi. Avec le
retrait des langages de recherche d'AltaVista et d'AlltheWeb qui étaient plus
avancés que celui de Google, cela constitue une grande
perte.
posté par Marc Duval, #référence
- 01:38
2004-04-01
Google sur la lune
Google a l'intention d'ouvrir
un centre de recherche sur la lune en 2007.
Plus tôt, les États-Unis et la
Chine avaient lancé leur intention l'un de revenir sur l'astre lunaire et
l'autre de s'y établir. Google les devance. La société a déjà
commencé à engager des informaticiens et des techniciens pour son Centre
Copernic. Leur but est «d'organiser toute l'information utile dans
l'univers et de vous la servir sur un craquelin légèrement salé.»
Le
programme complet de cet ambitieux projet est disponible sur la page d'offres
d'emploi du Centre
Copernic de Google.
posté par Marc Duval, #référence
- 07:10
Bienvenue au
Carnet des sites de recherche. Vous trouverez dans ce carnet mes observations
sur les sites de recherche autant états-uniens, canadiens que français. Si vous
découvrez quoi que ce soit sur l'un ou l'autre site, n'hésitez pas à me contacter. Je me ferais un plaisir
d'ajouter votre contribution.
[Retour au début]
03/01/2002
- 03/31/2002 04/01/2002
- 04/30/2002 05/01/2002
- 05/31/2002 06/01/2002
- 06/30/2002 07/01/2002
- 07/31/2002 08/01/2002
- 08/31/2002 09/01/2002
- 09/30/2002 10/01/2002
- 10/31/2002 11/01/2002
- 11/30/2002 12/01/2002
- 12/31/2002 01/01/2003
- 01/31/2003 02/01/2003
- 02/28/2003 03/01/2003
- 03/31/2003 04/01/2003
- 04/30/2003 05/01/2003
- 05/31/2003 06/01/2003
- 06/30/2003 07/01/2003
- 07/31/2003 08/01/2003
- 08/31/2003 09/01/2003
- 09/30/2003 10/01/2003
- 10/31/2003 11/01/2003
- 11/30/2003 12/01/2003
- 12/31/2003 01/01/2004
- 01/31/2004 02/01/2004
- 02/29/2004 03/01/2004
- 03/31/2004 04/01/2004
- 04/30/2004