Le Web Sémantique et les systèmes de recherche d’information

vendredi 8 décembre 2006.
 
Le Web Sémantique offre un grand nombre de possibilités pour de nouvelles applications d’outils de recherche.

Le web sémantique fournit les outils pour décrire une chose, en permettant donc que par la suite cette chose puisse faire l’objet de traitements ultérieurs automatisés : publication, consolidation, indexation, enrichissement sémantique, etc.

La grande bibliothèque universelle enfin à portée de main.

Les outils du web sémantique s’appuient sur le web, ce qui signifie que les corpus ainsi enrichis sont disponibles instantanément dans le monde entier...

Une seule page créée par un seul internaute et enrichie de métadonnées peut donc servir à alimenter une application qui compile les informations contenues dans des milliards de pages web.

Une telle base de données pourrait faire faire des progrès extraordinaires à la recherche scientifique et à l’échange de connaissances. Aujourd’hui, un chercheur doit lire (souvent pour rien) des milliers de pages d’articles avant de trouver deux paragraphes d’un collègue qui le feront avancer dans ses recherches. Les moteurs classiques lui permettent déjà de trouver beaucoup plus de publications qu’avant sur son sujet d’étude, mais trouver l’information dans ces articles demande de lire beaucoup d’articles pour rien. Le web sémantique lui épargnerait ce travail pour lui donner accès directement aux contenus directement en rapport avec ce qu’il cherche.

C’est une révolution qui ne révolutionne pas l’existant

Le Web sémantique ne fait au pire qu’ajouter des protocoles, et pour l’essentiel, fonctionne sur l’infrastructure technique existante du web. Inutile de reconstruire les réseaux, inutile de réécrire toutes les applications, le web sémantique peut se répandre de manière progressive sans rien remettre en question.

Pour les utilisateurs, aucune différence ne sera visible : on ne peut pas distinguer par l’apparence un site dont le contenu est conforme à la structure du web sémantique, d’un site dont le contenu est classique.

Pour mettre en oeuvre le web sémantique, il suffit que les producteurs de contenu changent leurs habitudes et enrichissent leurs informations de métadonnées.

Une évolution inévitable

Selon les promoteurs du web sémantique, les avantages évidents du système ne peuvent que produire son adoption progressive par l’ensemble des acteurs. Pour y parvenir, il faut juste de l’huile de coude... Ce n’est même pas une histoire d’argent, les gains étant évalués par eux comme supérieurs aux coûts. Tout est donc question de volonté.

Le rythme d’adoption est donc lié au rythme de diffusion de l’information et des exemples donnés par certains "leaders d’opinion". Les concepteurs d’outils d’édition de contenu ou de navigateurs sont en première ligne. Certains "pro web sémantique" se sont donc lancés dans un prosélytisme très actif vis à vis de certains acteurs. Et quelques uns d’entre eux ont visiblement du mal à comprendre le manque d’enthousiasme de la plupart de leurs interlocuteurs.

Le coût réel du passage au web sémantique est un obstacle

Le travail nécessaire pour enrichir un contenu avec les outils du web sémantique n’est pas négligeable. L’apport immédiat pour le producteur de contenu n’est pas évident. Une simple analyse "coût/opportunité" refroidit donc la plupart des acteurs.

La motivation des producteurs de contenu n’est pas toujours altruiste

Le web n’est pas un gentil club de scientifiques avec des réflexes altruistes. Les motivations qui prévalent dans la mise en ligne de contenus sont le plus souvent économiques, et même parfois politiques. Lorsque le contenu est créé sans volonté de rapport économique, il s’agit le plus souvent de pages personnelles, dont la majorité ne contiennent pas d’informations exploitables (voir les blogs par exemple).

Lorsque les motivations sont économiques, il faut remarquer que dans de nombreux cas, ce n’est pas le producteur de contenu qui bénéficie du "plus" apporté par les métadonnées, mais l’utilisateur du contenu. Oublier cet aspect c’est donc faire fi des réalités économiques et des conflits d’intérêts.

Si les motivations sont politico-sociales, la volonté de biaiser le système en le détournant de ses objectifs peut être grande. Le web est devenu un espace dans lequel les enjeux sociétaux sont de plus en plus présents.

Enfin, dans de nombreux cas, la volonté de créer des pages contenant un rapport signal/bruit élevé est totalement absente. Le web est rempli de contenus sans intérêt, et cette tendance ne fait que se renforcer.



Forum