Canalblog
Editer l'article Suivre ce blog Administration + Créer mon blog
Publicité
Les algorithmes des moteurs de recherche
Les algorithmes des moteurs de recherche
  • Ce blog décrit les différents algorithmes des moteurs de recherche avec notamment, HIT, PHIT, le pageRank de google et les différents outils qui vont utiliser les fonctions lexicales et le web sémantique
  • Accueil du blog
  • Créer un blog avec CanalBlog
Publicité
Archives
25 avril 2006

Introduction

Internet regroupe de nombreux outils dont la toile (de l’anglais Web) qui comporte de nombreuses pages publiées librement par des millions d’internautes. Du fait de la forte croissance du réseau et du nombre grandissant de documents mis en ligne le besoin s’est fait ressentir de trouver une information sans avoir à tout parcourir.

La recherche d’information sur Internet est un domaine d’application qui a beaucoup évolué ces dernières années. On est passé d’annuaires répertoriant des liens à des moteurs de recherche basiques pour en arriver aujourd’hui à des moteurs utilisant des algorithmes d’indexation et de recherche puissants. Les algorithmes des moteurs de recherche sont tous basés sur des théories différentes mais leurs objectifs est le même : indexer toute la toile, et l’indexer rapidement pour donner un résultat pertinent à l’utilisateur.

Afin de comprendre l’évolution de ces moteurs de recherche et des algorithmes qu’ils utilisent je vais dans une première partie introduire la recherche d’information pour mieux comprendre l’architecture de la toile ainsi que la manière dont on peut l’indexer. Dans une seconde partie je vais présenter les différents algorithmes des moteurs de recherche et plus particulièrement l’algorithme PageRank de Google. Dans une troisième partie je vais montrer vers quels moteurs de recherche nous évoluons aujourd’hui en m’intéressant aux fonctions lexicales et au Web sémantique.

Publicité
Publicité
Commentaires
Publicité