III - 1 - Amélioration de la pertinence
Les moteurs de recherche ont fait d’énormes progrès en une quinzaine d’année. Le gain apporté aux utilisateurs se situe sur la rapidité d’indexation des pages du Web, la rapidité de réponse à une requête, la mise à l’écart des pages indésirables, et la plus grande diversité des formats de données proposées. La qualité des moteurs de recherche semble plafonner à son maximum, pourtant de nombreux chercheurs travaillent dans le sens de moteurs de recherches intelligents travaillant sur le coté linguistique des données, les fonctions lexicales.
D’un autre coté on voit aussi apparaître la volonté de certains développeurs de sites Web et de nombreux utilisateurs de mieux ordonner la toile afin de pouvoir trouver plus facilement une information et comprendre plus facilement le contenu d’une page, c’est le Web sémantique.
C’est donc ainsi que l’on a vu apparaître récemment des moteurs de recherche encore peu connus, peut-être du fait de leurs différences d’utilisation avec les moteurs plus conventionnels tel que Google, Yahoo et MSN.
Citons deux exemples :
Exalead (http://www.exalead.fr/search)
Kartoo (http://www.kartoo.com/flash04.php3)
Les nouveaux moteurs de recherche s’éloigne du coté algorithmique au sens mathématique pour se rapprocher du coté de l’étude du langage humain via des fonctions lexicales et de la signification des mots. C’est en cherchant à palier à leur plus gros défaut que les moteurs de recherche font ce choix, c'est-à-dire en essayant d’être plus pertinent sur les résultats.
Dans un point de vue général on peut parler de sémantique linguistique qui peut se définir comme l’étude du sens des mots d’une langue. On ne cherche plus un mot ou une expression précise mais on cherche un sens (une idée) et on souhaite avoir en réponse à une requête toutes les pages traitant du même domaine.
C’est à travers ces deux domaines que sont les fonctions lexicales et le web sémantique que ce chapitre va traiter des évolutions récentes et à venir dans les moteurs de recherche.