|
|
Interventions > Interventions Jour 2 - MatinJour 2 - 16 mars 2018 : Ecosystème d'ISTEX : ressources et chantiers d'usage
Jean-Marie Pierrel - Université de Lorraine/Atilf
Yannick Chudy – IRIT / Univ.Toulouse Bruno Gaume – CLLE / Univ.Toulouse Résumé de l'intervention : Compte tenu des nombreux domaines scientifiques couverts par la base documentaire d'ISTEX, une requête est souvent polysémique au sens ou des communautés différentes peuvent entretenir des rapports différents avec cette requête d’où des attentes différentes selon les intentions de l’utilisateur. Plutôt que de mélanger la présentation des résultats des documents dans une liste, il est plus pertinent de faire connaître à l’utilisateur l’existence de ces multiples points de vue sur sa requête, ce qui lui permet de cibler sa recherche plus efficacement en affinant sa requête selon les points de vue ainsi identifiés. Le projet CILLEX, mené par le laboratoire CLLE à Toulouse, vise à répondre à ce besoin en mettant à disposition des utilisateurs des outils de métrologie, fondés sur les structures de réseaux petits mondes omniprésentes dans les bases documentaires, pour mieux identifier l’information pertinente selon les intentions de recherches de l'utilisateur.
Joachim Schopfel est maître de conférences en Sciences de l’Information et de la Communication à l’Université de Lille Sciences Humaines et Sociales et membre du laboratoire GERiiCO. Directeur d’UFR de 2009 à 2012 et de l’Atelier National de Reproduction des Thèses de 2012 à 2017, il est aujourd'hui consultant dans le domaine de l’information scientifique et technique. Résumé de l'intervention : Cette présentation sera l’occasion de dresser un bilan intermédiaire du projet interdisciplinaire TERRE-ISTEX qui a pour objectif d’identifier l’évolution des fronts de recherche en relation avec les territoires d’études, les croisements disciplinaires ainsi que les modalités concrètes de recherche à partir des contenus numériques hétérogènes disponibles dans les corpus d’ISTEX et dans un corpus de thèses électroniques. Nous présenterons tout d'abord un extrait du modèle de description de données défini au format MODS enrichi. Les chaînes de fouille de textes produites pour l’extraction des informations spatiales, temporelles et thématiques sur des corpus français et anglais seront également décrites. Nous mettrons en avant les difficultés rencontrées concernant la mise en place d’un serveur de recherche d’information sémantique s’appuyant sur la solution Elastic Search et nous mentionnerons les travaux en cours autour du projet D4Humanitites. Nous terminerons avec les perspectives et notamment le dépôt à venir en mars 2018 d’un projet franco-allemand pour la valorisation des données de la recherche.
Pierre-Yves Arnould – Université de Lorraine Résumé de l'intervention : L’application Carto Istex est un outil cartographique d’exploration et d’exploitation du réservoir de publications ISTEX, elle propose à un utilisateur de pouvoir identifier les laboratoires, pays et auteurs publiant le plus d’après une recherche dans les corpus ISTEX. Ces cartographies dynamiques sont générées en temps réel et sont issues du traitement des affiliations des publications. L’utilisation de dictionnaires de données (pour la détection d’entité nommée) ainsi que la parallelisation des traitements contribuent à la rapidité de CARTO-ISTEX.
Jacques Ducloy est ingénieur électrotechnicien (ENSEM 68), puis docteur en informatique (compilation). Il a découvert le monde de la connaissance numérique dans les années 70 au sein de l’institut universitaire de Calcul de Lorraine (IUCAL) avec l’exploitation informatique du Trésor de la Langue Française (TLF), le logiciel Mistral et le réseau Cyclades. Après avoir créé un groupement scientifique pour la valorisation des logiciels issus de la recherche (ANL), il a participé à la création de l’INIST comme directeur informatique. Il a ensuite mené des recherches sur l’ingénierie XML appliquée à l’IST au sein du LORIA et de l’INIST, où il est revenu comme directeur des produits et services (avec les bases Pascal et Francis). Enfin, à la DRRT Lorraine, il a créé le réseau Wicri, l’infrastructure du projet LorExplor de l’Université de Lorraine. Résumé de l'intervention : Nous présenterons des résultats obtenus par les explorations de corpus ISTEX menées dans le projet LorExplor. La synergie entre une bibliothèque de composants Xml et les wikis sémantiques permet de réaliser des applications complexes avec des contraintes de temps et de volume. Elle permet également de réaliser des traitements de curation de données dans un paysage associant ISTEX à d’autres sources de données. |