|
| |
Guide des moteurs de recherche
|
|
|
|
GENERALITES
Internet comporte en 2003 environ 10 milliards de pages Web présentant un contenu valable.Plus de 2 millions sont créées ou modifiées chaque jour
Malgré le rôle essentiel des répertoires ordonnés manuellement par des experts (Yahoo, bibliothèques, universités), il est indispensable de s'appuyer sur les moteurs de recherche fonctionnant à l'aide de robots
Cependant que la totalité des moteurs n'auraient indexé qu'environ 60% des pages Web " statiques" .
" Almost 100% of the database a search engine uses is either out-of-date, or incomplete at any given time. "
Ils ne peuvent évidemment connaître les " pages dynamiques" non préparées à l'avance mais qui sont composées immédiatement (" on the fly" ) à la demande d'un internaute lorsqu'il interroge une banque de données présente sur un serveur. Le nombre de ces pages s'élèverait alors à plusieurs dizaine de milliards
Le domaine des forums est moins bien connu ou indexé, et encore moins celui des listes de diffusion qui fonctionnent par la messagerie.
On ne connaît pas non plus le stock d'informations ou d'idees qui dorment dans le cerveau (reptilien) des 6 milliards d'êtres humains. Et cela vaut sans doute mieux ainsi...
< MOTEUR DE RECHERCHE SUR GEOSCOPIE>
Moteurs intelligents
|
SUR LES OUTILS DE RECHERCHE
En français http://www.idf.net/mdr
Pandia: portail des moteurs de recherche
Tous les moteurs :http://outils.abondance.com/moteurs.htmlTous les annuaires :http://outils.abondance.com/annuaires.html
http://www.lesmoteursderecherche.com
Abondance
Le blog des moteurs de recherche et du référencement
Blog moteurs de recherche
Agentland
Veille
AskTibbs
Abc Doc
Fouineux Tous les outils linguistiques et engins de recherche (***)
Moteurzine:
Conseils de recherche
http://www.webrankinfo.com
En anglais:
Search Engine Watch
TheSpider's Apprentice, help on searching the Web. Analyze and rate the major search engines.
IBM infoMarket Search
Websearch Research Buzz Traffick
Search IQ SearchEngine News
Search Engine Watch
Searchengines.com
Search Engine Forums
RankWrite Roundtable
Spider-food - search engine positioning
SearchAbility Guides To Specialized Search Engines
http://www.annuaire-info-com/
http://www.e-annuaires.com
http://annuaires2004.com/
Librarians'Internet Index websites you can trust
Comprendre les moteurs de recherche
Major search Engines
Inevidence - Accueil Inevidence : traitement avancé de l'information. Intelligence marketing, Intelligence économique, Intelligence média, Innovation, veille concurrentielle, ...
www.inevidence.fr/
Un blog sur les outils de veille INFORIZON
« Outils Froids» (www.outilsfroids.net), l'un des blogs les plus connus autour des thématiques veille et KM. |
UTILITE
Fonction la plus utile sur le web après le mail. Permet de suivre l'information non structurée (90% du web) |
|
MODALITES-OUTILS
LES MOTEURS DE RECHERCHE
Ils recherchent à partir d'un mot ou d'une expression. On les trouvera tous dans ALL IN ONE. la plupart fonctionnent aussi comme des répertoires sauf Alta Vista, Open Text, Four11,HotBot. HotBot permet la recherche directe d'éléments HTML
GOOGLE
|
1°) en anglais
< ALTAVISTA > < HOTBOT > < LYCOS >
< EXCITE > < FOUR11> < INFOSEEK >
< OPENTEXT > < WEBCRAWLER > < INFORMANT > < NLIGHTN > < PlanetSearch >
2°) moteurs en français
< ECILA ou ECILA> < EXCITE > < FRANCITE > < LOKACE > < LYCOS> < Pages Web>
Solutions d'entreprise Google : Google Mini La solution Google Mini, qui intègre tous les éléments matériels et logiciels, est conçue pour vous aider à tirer le meilleur parti de vos actifs numériques
|
Ils rendent de grands services:
en interrogeant très rapidement à votre place plusieurs (voire plusieurs de dizaines de) moteurs dont ils connaissent parfaitement les syntaxes d'interrogation
ils rapatrient les pages trouvées, éliminent les doublons et dans certains cas, évaluent la pertinence (pourcentage d'occurrence des termes de recherche)
après consultation des répertoires thématiques, les métamoteurs sont presque indispensables pour une première découverte. On peut recommander un classique: Copernic, gratuit dans sa version de base
Ces courtiers de recherche effectuent leur travail en interrogeant d'autres robots. Les méthodes et outils évoluent tr ès vite: on peut les suivre sur BOTSPOT
Les meta-moteurs sont des systèmes capable d'envoyer des requêtes à plusieurs moteurs simultanément.
- Dogpile Un moteur qui recherche ses informations dans près de 25 moteurs, répartis en 4 catégories. Les opérateurs booléens sont supportés.
- ProFusion Un meta-moteur de recherche qui peut envoyer des requêtes dans 9 moteurs simultanément. Les résultats renvoyés par les moteurs sont analysés, et recombinés de façon à supprimer les adresses redondantes et les regrouper par degré de pertinence.
- Internet Sleuth Internet Sleuth possede la plus grande collection de moteurs de recherche de l'internet (près de 3000 !). Ce meta-moteur couvre également de nombreuses bases de données. Les moteurs sont organisés en 21 catégories principales et de nombreuses sous catégories.
- Savvy Search Méta-chercheur, Savvy Search envoye ses requêtes auprès de moteurs, de guides, de sites spécialisés ou de boutiques. Près de 200 adresses réparties en de nombreuses catégories.
- Debriefing Un meta-moteur proposant une interface de recherche sur le web français, via Yahoo, PagesWeb, Ecila, Infoseek, Excite, Lokace, ainsi qu'une recherche sur le web mondial (AltaVista, Yahoo, Infoseek, Excite, Webcrawler, Lycos). Les résultats des requêtes sont triés et les liens invalides supprimés.
- Go2Net | MetaCrawler Recherche simultanée dans 9 bases de données différentes.
- Méga Francité Méta-moteur francophone, Francité effectue sa recherche dans plus de 1500 moteurs (bases de données, jeux, mp3, etc...)
- TROUVEZ ! TROUVEZ ! vous permet de chercher simultanément dans 16 des principaux répertoires et moteurs de recherche. Les résultats de recherche s'affichent par ordre décroissant de pertinence.
- SuperSearch III Une interface permettant de rechercher dans plusieurs moteurs à la fois. Vous pouvez choisir la catégorie des moteurs auquels vous soumettez votre requête: Crawlers, Indices, Usenet, People, Meta, Articles, Software, et Unsorted.
|
1°) en anglais
< All in One> < Computer Network CINet>
< CLEARINGHOUSE> < SLEUTH > < METACRAWLER >
< METASEARCH >
< METAFIND> < SAVY SEARCH > < COPERNIC>
REFERENCE: recherche sur Web, newsgroups et listes de diffusion
2°) en français
< All in One> < Francité> < I-search: > < Info Internet>
< General Moteur: > < SAVY SEARCH >
< Debriefing> < 7alpha>
http://www.apocalx.com/ avec services pour webmasters
ARIANE6 a répertorié et classé plus de 1100 moteurs de recherche
affiche 6 titres (maximum possible) en mode "packagé"
|
Moteurs spécialisés
Moteurs sémantiques
Web semantique
WEB2
WEB semantique
Weblog
Wiki
RSS |
< Beaucoup>
Airport Search Engine - ASE database contains airport- codes and a list of links to airport pages on the web.
WebPort City Gateways
Aqueous - dedicated to sites that have water related content.
Aviation Search Engine from Totavia
Funny Site - search engine for humor sites.
MusicSearch - music search engine with over 5,000 links and growing.
Public Safety Search Engine - features law enforcement, fire and related web sites. Add your site or search for your favorite.
Travel-Finder Spider: travel related resources and information.
VirtualTourist
LES MOTEURS SUR THEMES SPECIALISES |
|
|
|
ECHANGES |
|
EVALUATION
-
Choisir son moteur de recherche
- information pour quels usages?
- information structurée 10% de l'info (type BDD) , contre 90% semi structurée (type e.mail, blog ) ou non structurée (type chat, videos etc... )
- La responsabilité des moteurs de recherche Le tribunal de Paris a interdit, mercredi 5 septembre 2001, au moteur de recherche d'annonces d'emploi Keljob de référencer les fiches du site Cadremploi. Keljob a été condamné à payer 1 million de francs de dommages et intérêts. Cette jurisprudence sera, d'importance, car elle préfigure des problèmes qui pourraient arriver avec les index de pages web utilisés par les moteurs de recherche (...)http://www.sam-mag.com/archives/juridique13.htm
|
EVALIR: diagnostics de performance des systèmes d'information et optimisation de systèmes existants
Imi Tiki Les rencontres entre passionnés du monde des outils de recherche à Paris... et ailleurs !
Les moteurs de recherche Ambassade de France en Israel - 6 pages - 1/11/2003
« Outils Froids» (www.outilsfroids.net), l'un des blogs les plus connus autour des thématiques veille et KM. |
PRESENTATION
Organisation de la recherche,
Présentation de l'information |
Moteurs en WEB2
Recherche
- Huckabuck, recherche multi moteur ( mon billet )
- Rollyo, pour créer votre propre service de recherche ( mon billet )
- Wikio, c'est vous qui créez l'info
- Xoolyx, service identique à wikio ( mon billet )
- Yoono, un moteur de recherche français
- Gridwell, recherche sur fil RSS
- Cooliris, un plugin FF permettant de voir ce que vous cherchez su Google ( mon billet )
- Inquisitor, recherche muti moteur (mon billet)
- Gnoos, moteur de recherche de blogs
- RSSmicro, recherche sur les fils RSS
- AlltheWeb, anticipe les mots que vous cherchez
- (::Opso::), recherche muti moteurs
- Gnosh, recherche multi moteurs
- ZabboWabbo, recherche multi moteurs
- Stalkerati, recherche multi moteurs
- MyWeb, le service de recherche Web 2.0 de Yahoo
- Zewol, recherche multi moteurs
- Qelly, moteur de recherche par catégories
- Zero-zero, moteur de recherche entierement consacré au Foot
- EyeSearch, moteur de recherche visuel
- local.ch, recherche en suisse
- Dumpr, recherche de photos similaires sur Flickr
- Foundd
- Cuppin', recherchez des cafés de différents pays
- mnemomap, recherche nouvelle génération
- Tambul, moteur nouvelle génération
- YurNet , multi moteur
- FeedGit, recherche de fil RSS
- TagFetch, multi moteurs
- Ipselon
- Vdoogle recherche de videos
- Quintura
- VideoNik recherche de videos
- Ms Dewey moteur presque interactif
- Google Co-op concevez votre moteur de recherche
- Resultr creez votre moteur
- PureVideo recherche de video
- SearchMash moteur de google
- Ty Bou
- Videoronk recherche et telechargement de video
- ScoopVid recherche de videos
- Ujiko
|
PERSPECTIVES
Le Web est un nœud papillon. A l'aile gauche, les pages ayant un lien vers d'autres pages mais qui ne reçoivent aucun lien . A l'aile droite, les pages pointées par d'autres mais qui ne renvoient à aucune autre (ex: formulaires de la SNCF). Au centre, les pages inconturnables et interconnectées. Il faut chercher l'information au cœur du Web avant d'en explorer la totalité. Donc:
- exploiter les liens entre les pages Pages de référence et Pages pivots
- analyser le contenu des documents: niveaux de langage, types de documents...
- accompagner l'internaute en précisant les requêtes, suggérant autres thèmes associés,
|
|
|
|
|
|