Canalblog
Editer l'article Suivre ce blog Administration + Créer mon blog
Publicité
Les algorithmes des moteurs de recherche
Les algorithmes des moteurs de recherche
  • Ce blog décrit les différents algorithmes des moteurs de recherche avec notamment, HIT, PHIT, le pageRank de google et les différents outils qui vont utiliser les fonctions lexicales et le web sémantique
  • Accueil du blog
  • Créer un blog avec CanalBlog
Publicité
Archives
31 mars 2006

I - 1 - Historique et évolution

Historique :

L’Internet est né en 1962 aux Etats-Unis de la volonté de l’état américain de posséder un réseau sécurisé capable de résister à n’importe quelle attaque.

En 1969 quatre universités américaines sont reliées au réseau ARPANET[1].

En 1984, alors que le réseau compte plus de 1000 machines, l’Europe y est désormais connectée par le biais du CERN[2].

Ce  n’est que dans le début des années 1990 que le concept de Web est introduit par Tim Berners-Lee (du CERN) et que le nombre d’ordinateurs connectés devient réellement important (plus de 300 000).

Le nombre de machines connectées grandissant et le nombre de pages devenant important, des liens hypertextes donnent la possibilité de passer de l’une à l’autre sans vraiment pouvoir aller rapidement sur une page recherchée.

C’est dans ce contexte que le besoin d’outil de recherche de l’information commence à se faire sentir, bien que en 1990 la structure du web ne soit pas aussi éparpillée et complexe que aujourd’hui.

Caractéristiques :

Le Web (World Wide Web) est un mot anglais signifiant la toile d’araignée. Il tire son nom de la complexe interconnexion des pages mises en lignes sur des sites Web. Le WWW représente une partie des fonctionnalités proposées par le réseau Internet.

Le Web est la partie d’Internet qui interconnecte les pages, il fonctionne avec le protocole de navigation HTTP[3] qui établit la communication entre le navigateur (le client) et le serveur Web.

Le langage utilisé pour afficher les pages est le HTML[4], il transcrit les pages codes écrites sur le serveur en pages multimédias accessibles depuis le navigateur.

Aujourd’hui Internet est un outil indispensable dans de nombreux milieux professionnels, en plus de compter de plus en plus de pages Web, il est utilisé pour envoyer des mails, télécharger des fichiers via le protocole FTP (File Transfert Protocol) ou encore partager des fichiers (Peer to Peer).

En plus des pages Web commerciales ou informatives on voit apparaître depuis quelques mois les blogs (contraction de Web Log), qui sont des pages personnelles écrites sous la forme d’un bloc-notes, elles sont simples à réaliser grâce à des pages pré formatées.

Après quelques années de démarrage rapide le Web a acquis une grande notoriété dans le monde entier que ce soit dans les milieux professionnels, dans les milieux universitaires ou pour toutes sortes de loisirs. Le nombre de pages devenant de plus en plus important il est intéressant de s’attacher à la structure de cette immense toile.


[1] Arpanet, acronyme anglais de Advanced Research Projects Agency Network, est le premier réseau à transfert de paquets développé aux États-Unis par

la DARPA

, le projet fut lancé en 1967 et la première démonstration officielle date d'octobre 1972. Il est le prédécesseur d'Internet. (Définition de wikipedia)

[2] CERN, Centre européen de recherche nucléaire

[3] HTTP, HyperText Transfert Protocol

[4] HTML, HyperText Markup Language.

Publicité
Publicité
Commentaires
Publicité