|
 |
GUIDE DES MOTEURS DE RECHERCHE
|
|
|
|
GENERALITES
Internet comporte en 2009 environ 20 milliards de pages Web présentant un contenu valable.Plus de 2 millions sont créées ou modifiées chaque jour
Malgré le rôle essentiel des répertoires ordonnés manuellement par des experts (Yahoo, bibliothèques, universités), il est indispensable de s'appuyer sur les moteurs de recherche fonctionnant à l'aide de robots
Cependant que la totalité des moteurs n'auraient indexé qu'environ 60% des pages Web " statiques" .
" Almost 100% of the database a search engine uses is either out-of-date, or incomplete at any given time. "
Ils ne peuvent évidemment connaître les" pages dynamiques>" non préparées à l'avance mais qui sont composées immédiatement (" on the fly" ) à la demande d'un internaute lorsqu'il interroge unebanque de données présente sur un serveur. Le nombre de ces pages s'élèverait alors à plusieurs dizaine de milliards
Le domaine desforums est moins bien connu ou indexé, et encore moins celui deslistes de diffusion qui fonctionnent par la messagerie.
On ne connaît pas non plus le stock d'informations ou d'idees qui dorment dans le cerveau (reptilien) des 6 milliards d'êtres humains. Et cela vaut sans doute mieux ainsi...
< MOTEURS DE RECHERCHE AVANCEE SUR GEOSCOPIE>
Moteurs intelligents
|
OUTILS DE RECHERCHE
En français
http://www.idf.net/mdr
Pandia: portail des moteurs de recherche
Tous les moteurs :http://outils.abondance.com/moteurs.htmlTous les annuaires :http://outils.abondance.com/annuaires.html
http://www.lesmoteursderecherche.com
Abondance >
Le blog des moteurs de recherche et du référencement
Blog moteurs de recherche
Agentland >
Veille >
AskTibbs >
Abc Doc
Fouineux:Tous les outils linguistiques et engins de recherche (***)
Moteurzine:
Conseils de recherche
http://www.webrankinfo.com
En anglais:
Wikipedia: list of search engines
Search Engine Watch
TheSpider's Apprentice, help on searching the Web. Analyze and rate the major search engines.
IBM infoMarket Search
Websearch
Research Buzz Traffick
Search IQ
SearchEngine News
Search Engine Watch
Searchengines.com
Search Engine Forums
RankWrite Roundtable
Spider-food - search engine positioning
SearchAbility Guides To Specialized Search Engines
http://www.annuaire-info-com/
http://www.e-annuaires.com
http://annuaires2004.com/
Librarians'Internet Index websites you can trust
Comprendre les moteurs de recherche
Major search Engines
Inevidence - Accueil Inevidence : Intelligence marketing, Intelligence économique, Intelligence média, Innovation, veille concurrentielle,
Un blog sur les outils de veille INFORIZON>
Outils Froids» (www.outilsfroids.net), l'un des blogs les plus connus autour des thématiques veille et KM.
|
UTILITE
Fonction la plus utile sur le web après le mail. Permet de suivre l'information non structurée (90% du web) |
|
MODALITES-OUTILS
LES MOTEURS DE RECHERCHE
Ils recherchent à partir d'un mot ou d'une expression. On les trouvera tous dans ALL IN ONE. la plupart fonctionnent aussi comme des répertoires sauf Alta Vista, Open Text, Four11,HotBot. HotBot permet la recherche directe d'éléments HTML
GOOGLE
|
1°) en anglais
< ALTAVISTA > <
HOTBOT > < LYCOS >
< EXCITE >
< FOUR11> <
INFOSEEK >
< OPENTEXT > <
WEBCRAWLER > <
INFORMANT > <
NLIGHTN > <
PlanetSearch >
EXALEAD
ECILA ou ECILA> <
EXCITE > <
FRANCITE > <
LOKACE > <
LYCOS>
< Pages Web>
Solutions d'entreprise Google : Google Mini La solution Google Mini, qui intègre tous les éléments matériels et logiciels, est conçue pour vous aider à tirer le meilleur parti de vos actifs numériques
Créer votre moteur |
LES METAMOTEURS DE RECHERCHE
Ils rendent de grands services:
en interrogeant très rapidement à votre place plusieurs (voire plusieurs de dizaines de) moteurs dont ils connaissent parfaitement les syntaxes d'interrogation
ils rapatrient les pages trouvées, éliminent les doublons et dans certains cas, évaluent la pertinence (pourcentage d'occurrence des termes de recherche)
après consultation des répertoires thématiques, les métamoteurs sont presque indispensables pour une première découverte. On peut recommander un classique: Copernic, gratuit dans sa version de base
Ces courtiers de recherche effectuent leur travail en interrogeant d'autres robots. Les méthodes et outils évoluent tr ès vite: on peut les suivre sur BOTSPOT
Les meta-moteurs sont des systèmes capable d'envoyer des requêtes à plusieurs moteurs simultanément.
- Dogpile Un moteur qui recherche ses informations dans près de 25 moteurs, répartis en 4 catégories. Les opérateurs booléens sont supportés.
- ProFusion Un meta-moteur de recherche qui peut envoyer des requêtes dans 9 moteurs simultanément. Les résultats renvoyés par les moteurs sont analysés, et recombinés de façon à supprimer les adresses redondantes et les regrouper par degré de pertinence.
- Internet Sleuth Internet Sleuth possede la plus grande collection de moteurs de recherche de l'internet (près de 3000 !). Ce meta-moteur couvre également de nombreuses bases de données. Les moteurs sont organisés en 21 catégories principales et de nombreuses sous catégories.
- Savvy Search Méta-chercheur, Savvy Search envoye ses requêtes auprès de moteurs, de guides, de sites spécialisés ou de boutiques. Près de 200 adresses réparties en de nombreuses catégories.
- Debriefing Un meta-moteur proposant une interface de recherche sur leweb français>, via Yahoo, PagesWeb, Ecila, Infoseek, Excite, Lokace, ainsi qu'une recherche sur le web mondial (AltaVista, Yahoo, Infoseek, Excite, Webcrawler, Lycos). Les résultats des requêtes sont triés et les liens invalides supprimés.
- Go2Net | MetaCrawler Recherche simultanée dans 9 bases de données différentes.
- Méga Francité Méta-moteur francophone, Francité effectue sa recherche dans plus de 1500 moteurs (bases de données, jeux, mp3, etc...)
- TROUVEZ ! TROUVEZ ! vous permet de chercher simultanément dans 16 des principaux répertoires et moteurs de recherche. Les résultats de recherche s'affichent par ordre décroissant de pertinence.
- SuperSearch III Une interface permettant de rechercher dans plusieurs moteurs à la fois. Vous pouvez choisir la catégorie des moteurs auquels vous soumettez votre requête: Crawlers, Indices, Usenet, People, Meta, Articles, Software, et Unsorted.
- Seek metamoteur francophone
- Copernic metamoteur francophone canadien
|
1°) en anglais
< All in One> < Computer Network CINet>
< CLEARINGHOUSE> < SLEUTH > < METACRAWLER >
METASEARCH
< METAFIND>
SAVY SEARCH
< COPERNIC>
REFERENCE: recherche sur Web, newsgroups et listes de diffusion
< All in One>
< Francité> <
I-search:
< Info Internet>
General Moteur:
SAVY SEARCH >
< Debriefing>
< 7alpha>
http://www.apocalx.com/
avec services pour webmasters>
ARIANE6 a répertorié et classé plus de 1100 moteurs de recherche>
affiche 6 titres (maximum possible) en mode "packagé"
|
Moteurs spécialisés
Moteurs sémantiques
Web semantique
WEB2
WEB semantique
Weblog
Wiki
RSS |
< Beaucoup>
Airport Search Engine - ASE database contains airport- codes and a list of links to airport pages on the web.
WebPort City Gateways
Aqueous - dedicated to sites that have water related content.
Aviation Search Engine from Totavia
Funny Site - search engine for humor sites.
MusicSearch - music search engine with over 5,000 links and growing.
Public Safety Search Engine - features law enforcement, fire and related web sites. Add your site or search for your favorite.
Travel-Finder Spider: travel related resources and information.
VirtualTourist
LES MOTEURS SUR THEMES SPECIALISES>
|
SERVEURS COMMERCIAUX
|
. |
ECHANGES
|
. |
EVALUATION
|
EVALIR: diagnostics de performance des systèmes d'information et optimisation de systèmes existants
Imi Tiki> Les rencontres entre passionnés du monde des outils de recherche à Paris... et ailleurs !
Les moteurs de recherche Ambassade de France en Israel - 6 pages - 1/11/2003
Outils Froids» (www.outilsfroids.net), l'un des blogs les plus connus autour des thématiques veille et KM. |
PRESENTATION
Organisation de la recherche,
Présentation de l'information |
Moteurs en WEB2
Recherche >
- Huckabuck, recherche multi moteur ( mon billet )
- Rollyo, pour créer votre propre service de recherche ( mon billet )
- Wikio, c'est vous qui créez l'info
- Xoolyx,
- mon billet service identique à wikio )
- Yoono, un moteur de recherche français
- Gridwell, recherche sur fil RSS
- Cooliris, un plugin FF permettant de voir ce que vous cherchez su Google ( mon billet )
- Inquisitor, recherche muti moteur (mon billet)
- Gnoos, moteur de recherche de blogs
- RSSmicro, recherche sur les fils RSS
- AlltheWeb, anticipe les mots que vous cherchez
- (::Opso::), recherche muti moteurs
- Gnosh, recherche multi moteurs
- ZabboWabbo, recherche multi moteurs
- Stalkerati, recherche multi moteurs
- MyWeb, le service de recherche Web 2.0 de Yahoo
- Zewol, recherche multi moteurs
- Qelly, moteur de recherche par catégories
- Zero-zero, moteur de recherche entierement consacré au Foot
- EyeSearch, moteur de recherche visuel
- local.ch, recherche en suisse
- Dumpr, recherche de photos similaires sur Flickr
- Foundd
- Cuppin', recherchez des cafés de différents pays
- mnemomap, recherche nouvelle génération
- Tambul, moteur nouvelle génération
- YurNet , multi moteur
- FeedGit, recherche de fil RSS
- TagFetch, multi moteurs
- Ipselon
- Vdoogle recherche de videos
- Quintura
- VideoNik recherche de videos
- Ms Dewey moteur presque interactif
- Google Co-op concevez votre moteur de recherche
- Resultr creez votre moteur
- PureVideo recherche de video
- SearchMash moteur de google
- Ty Bou
- Videoronk recherche et telechargement de video
- ScoopVid recherche de videos
- Ujiko
|
PERSPECTIVES
Le Web est un nœud papillon. A l'aile gauche, les pages ayant un lien vers d'autres pages mais qui ne reçoivent aucun lien . A l'aile droite, les pages pointées par d'autres mais qui ne renvoient à aucune autre (ex: formulaires de la SNCF). Au centre, les pages inconturnables et interconnectées. Il faut chercher l'information au cœur du Web avant d'en explorer la totalité. Donc:
- exploiter les liens entre les pages Pages de référence et Pages pivots
- analyser le contenu des documents: niveaux de langage, types de documents...
- accompagner l'internaute en précisant les requêtes, suggérant autres thèmes associés,
|
.. |
|
|
| |