15-16 mars 2018 Paris (France)

Interventions > Interventions Jour 2 - Matin

 Jour 2 - 16 mars 2018 :

Ecosystème d'ISTEX : ressources et chantiers d'usage

  • Présentation des ressources acquises

Présentation

Sandrine Malotaux dirige le service commun de la documentation et des bibliothèques de l'Institut National Polytechnique de Toulouse (Toulouse INP) depuis 2008, et le Département des négociations documentaires du consortium Couperin.org depuis 2012. Elle est membre du comité exécutif de l'ICOLC (International Coalition of Library consortia). Archiviste paléographe, conservateur général, elle a consacré sa carrière à la direction de bibliothèques en France (Université de la Méditerranée, Université Paul Sabatier-Toulouse 3) et à l'étranger (Grande-Bretagne) ; spécialisée dans l'information scientifique et technique et les services pour la recherche, l'archivage et la conservation, l'aménagement des bibliothèques, elle a conçu et dirigé le projet de construction de la bibliothèques de Sciences à l'université Paul Sabatier et piloté les projets learning centres de Toulouse INP. Négociateur Couperin depuis 2007, elle a coordonné la politique d'acquisition ISTEX : définition des besoins, réception et analyse des offres, sélection des ressources et pré-négociation avec les éditeurs.

  • ISTEX, au service de l'exploration et de la fouille de texte

Présentation

Pascal CUXAC, Docteur en Génie Géologique et Minier, intègre le CNRS en 1993 comme Ingénieur de Recherche. Spécialiste des méthodes de fouille de textes, il a publié plus de 60 articles et anime régulièrement des ateliers sur la fouille de textes. Au sein du service Recherche Développement et Expérimentations de l'INIST-CNRS (Institut de l'Information Scientifique et Technique), il a piloté l'équipe-projet en charge de la R&D dans ISTEX. Actuellement, il pilote l'équipe ISTEX-LOD qui a pour mission d'insérer ISTEX dans le graphe global géant du Web (LOD: Linked Open Data).

 


Nicolas Thouvenin est responsable du service R&D et expérimentation de l’Inist-­CNRS où plusieurs équipes travaillent sur l'enrichissement automatique des métadonnées ISTEX, la création de corpus thématiques ISTEX & la sémantisation et l'alignement des données générées à partir d'ISTEX.

  • Ecosystème d'ISTEX : chantiers d'usage et services à valeur ajoutée

Présentation

Jean-Marie Pierrel - Université de Lorraine/Atilf

  • Présentation des résultats chantiers d'usage
    • CILLEX : Moteur de réponse offrant des outils de métrologies des bases documentaires

Présentation

Yannick Chudy – IRIT / Univ.Toulouse

Bruno Gaume – CLLE / Univ.Toulouse

Résumé de l'intervention :

Compte tenu des nombreux domaines scientifiques couverts par la base documentaire d'ISTEX, une requête est souvent polysémique au sens ou des communautés différentes peuvent entretenir des rapports différents avec cette requête d’où des attentes différentes selon les intentions de l’utilisateur. Plutôt que de mélanger la présentation des résultats des documents dans une liste, il est plus pertinent de faire connaître à l’utilisateur l’existence de ces multiples points de vue sur sa requête, ce qui lui permet de cibler sa recherche plus efficacement en affinant sa requête selon les points de vue ainsi identifiés. Le projet CILLEX, mené par le laboratoire CLLE à Toulouse, vise à répondre à ce besoin en mettant à disposition des utilisateurs des outils de métrologie, fondés sur les structures de réseaux petits mondes omniprésentes dans les bases documentaires, pour mieux identifier l’information pertinente selon les intentions de recherches de l'utilisateur.

    •  Terre-ISTEX : Identification et analyse des terrains d'étude dans les corpus ISTEX

Présentation

 

 

Éric Kergosien est Maître de Conférences à l'Université de Lille - Sciences Humaines et Sociales depuis septembre 2014. Il est membre du laboratoire GERiiCO, EA 4073. Ses thèmes de Recherche sont le Traitement Automatique du Langage Naturel (TALN), la Fouille de Textes et l’Ingénierie des Connaissances. Tout au long de son parcours, il a dirigé dans le passé 4 projets industriels en fouille de textes et en gestion électronique de documents. Il coordonne actuellement plusieurs projets scientifiques d’envergure, dont l’un nommé Tectoniq (PEPS CNRS InterMSH) pour la construction d’une base de connaissances relative au patrimoine industriel textile, et un second nommé TERRE-ISTEX pour l’identification et l’analyse des terrains d’études dans les corpus scientifiques (thèses, publications scientifiques ISTEX, etc.)(ANR – CNRS). Ces projets font intervenir des compétences en modélisation de données hétérogènes complexes, en extraction automatique d’information à partir de corpus textuels, et en structuration d’information sous forme de graphes sémantiques (thésaurus, ontologies). De plus, dans le cadre de ses travaux, Eric kergosien a travaillé à la conception et au développement d’interfaces multi-facettes orientées Big data permettant à des usagers de naviguer/rechercher dans des corpus de données volumineuses. Les contributions en lien avec ces travaux furent publiées dans des conférences et revues nationales et internationales en informatique (CICLING, ESWA, SIIE, ISWC, ISMIS, EKAW, TALN, EGC, etc.), en géomatique (IJGIS, RIG, CIST, GAST, SAGEO) ainsi qu’en sciences de l’information et de la communication (CIDE, Documentation et Bibliothèques, Document Numérique, revue SFSIC, congrès TICCIH).

Joachim Schopfel est maître de conférences en Sciences de l’Information et de la Communication à l’Université de Lille Sciences Humaines et Sociales et membre du laboratoire GERiiCO. Directeur d’UFR de 2009 à 2012 et de l’Atelier National de Reproduction des Thèses de 2012 à 2017, il est aujourd'hui consultant dans le domaine de l’information scientifique et technique.

Résumé de l'intervention :

Cette présentation sera l’occasion de dresser un bilan intermédiaire du projet interdisciplinaire TERRE-ISTEX qui a pour objectif d’identifier l’évolution des fronts de recherche en relation avec les territoires d’études, les croisements disciplinaires ainsi que les modalités concrètes de recherche à partir des contenus numériques hétérogènes disponibles dans les corpus d’ISTEX et dans un corpus de thèses électroniques. Nous présenterons tout d'abord un extrait du modèle de description de données défini au format MODS enrichi. Les chaînes de fouille de textes produites pour l’extraction des informations spatiales, temporelles et thématiques sur des corpus français et anglais seront également décrites. Nous mettrons en avant les difficultés rencontrées concernant la mise en place d’un serveur de recherche d’information sémantique s’appuyant sur la solution Elastic Search et nous mentionnerons les travaux en cours autour du projet D4Humanitites. Nous terminerons avec les perspectives et notamment le dépôt à venir en mars 2018 d’un projet franco-allemand pour la valorisation des données de la recherche.

    •  OTELo / Terres-rares : un outil cartographique d'exploration et exploitation des corpus ISTEX

Présentation

Pierre-Yves Arnould – Université de Lorraine

Résumé de l'intervention :

L’application Carto Istex est un outil cartographique d’exploration et d’exploitation du réservoir de publications ISTEX, elle propose à un utilisateur de pouvoir identifier les laboratoires, pays et auteurs publiant le plus d’après une recherche dans les corpus ISTEX. Ces cartographies dynamiques sont générées en temps réel et sont issues du traitement des affiliations des publications. L’utilisation de dictionnaires de données (pour la détection d’entité nommée) ainsi que la parallelisation des traitements contribuent à la rapidité de CARTO-ISTEX.

    • LorExplor : Une bibliothèque open source de composants XML d’exploitation du corpus

Présentation

Jacques Ducloy est ingénieur électrotechnicien (ENSEM 68), puis docteur en informatique (compilation). Il a découvert le monde de la connaissance numérique dans les années 70 au sein de l’institut universitaire de Calcul de Lorraine (IUCAL) avec l’exploitation informatique du Trésor de la Langue Française (TLF), le logiciel Mistral et le réseau Cyclades. Après avoir créé un groupement scientifique pour la valorisation des logiciels issus de la recherche (ANL), il a participé à la création de l’INIST comme directeur informatique. Il a ensuite mené des recherches sur l’ingénierie XML appliquée à l’IST au sein du LORIA et de l’INIST, où il est revenu comme directeur des produits et services (avec les bases Pascal et Francis). Enfin, à la DRRT Lorraine, il a créé le réseau Wicri, l’infrastructure du projet LorExplor de l’Université de Lorraine.

Résumé de l'intervention :

Nous présenterons des résultats obtenus par les explorations de corpus ISTEX menées dans le projet LorExplor. La synergie entre une bibliothèque de composants Xml et les wikis sémantiques permet de réaliser des applications complexes avec des contraintes de temps et de volume. Elle permet également de réaliser des traitements de curation de données dans un paysage associant ISTEX à d’autres sources de données.

Personnes connectées : 1