Travaux de recherche

J'ai participé au projet de recherche CNEPRU intitulé « Vers la Recherche d’Information multimédia distribuée » (2013-2015).

Le monde de l’information numérique évolue sans cesse, et les documents numériques multimédias s’enrichissent de plus en plus selon le format par des informations de différent types (binaires, structurelles, textuelles…). Cette évolution est accélérée par l’expansion du Web qui contient la majorité des documents numériques mis à disposition des utilisateurs.
Les documents sont répartis dans plusieurs serveurs. Il est primordial de développer des outils automatisés permettant un accès efficace basé sur le contenu à l’information numérique dans plusieurs serveurs. Afin de valoriser au mieux l’ensemble des informations disponibles, les méthodes existantes de Recherche d’Information (RI) doivent être adaptées au contexte distribué.

Problématique :

L’utilisation d’un ensemble de collections pose des problèmes. Dans le but de les interroger, on doit passer par les étapes suivantes :

Nos travaux se concentrent surtout sur deux problèmes, à savoir « la sélection de collections » et « la fusion de résultats », dans le contexte où les serveurs utilisent la même stratégie d’indexation et de dépistage.
Un système de recherche d’information distribué est basé sur des serveurs de collections et un courtier (Serveur intelligent). Le courtier fait le dépistage des serveurs de collections selon les besoins de l’utilisateur. Les serveurs sélectionnés sont ceux qui ont une forte probabilité de contenir des documents pertinents à ces besoins. Cette première étape est appelée « sélection de collections ».
Chaque collection sélectionnée traite le besoin de l’utilisateur et retourne une liste de réponses au courtier. Enfin, le courtier retourne une seule liste à l’utilisateur. Cette étape est appelée « Fusion de résultats ».


J'ai participé au projet de recherche CNEPRU intitulé « Indexation et recherche par le contenu des documents semi-structurés » (2010-2012).

L’information structurelle des documents peut en effet servir à affiner les résultats fournis par les Systèmes de Recherche d’Information (SRI). Le but des (SRI) est alors de retrouver des unités d’information (et non plus des documents) pertinentes à des requêtes utilisateur. Effectuer une recherche d’information sur ces nouveaux documents induit de nouvelles problématiques, auxquelles la recherche doit apporter de nouvelles solutions.

Les SRI traitent trois points clés :

Dans ce contexte, les trois questions précédentes soulèvent plusieurs problématiques spécifiques, dont la plus importante concerne les notions de pertinence et de tri des résultats de recherche.

Notre travail été à concevoir et développer une plate-forme de Recherche d’Information fiable et rapide, qui prend en compte les problématiques déjà citées. Une plate-forme fiable qui assure la pertinence des résultats de recherches, et qui soit rapide en temps de traitement. Pour la phase d’indexation, nous proposerons un modèle automatique de représentation des données combinant les deux approches d’indexation simple et structuré. Au niveau de la phase recherche, nous proposerons un modèle de recherche permettant de retrouver les documents ou les unités d’information les plus pertinentes à chaque requête. Elle consiste dans sa forme générale en trois sous-phases qui sont la formulation de la requête de l'utilisateur, la recherche dans la collection de documents et la présentation des résultats. Une dernière partie du travail est l’évaluation des performances de la plate-forme. Surtout le temps de réponse et la pertinence des résultats fournis, c’est-à-dire leur capacité à trouver des documents répondant aux besoins de l'utilisateur.