Approches sémantiques du document électronique



Approches sémantiques du document électronique


Édité par Mauro Gaio, Patrice Enjalbert

:: Résumé    :: Sommaire    :: Détails


Pour sa septième édition, CIDE s'intègre dans la semaine du Document numérique (SDN). Pour chacune des éditions de CIDE le comité de conférence choisi de focaliser le débat sur une thématique particulière qui, au-delà des communautés établies, des disciplines scientifiques et des démarches spécifiques, témoigne des problèmes et des enjeux de cette objet de recherche : le document électronique. Pour cette édition, le thème des approches sémantiques du document électronique a été retenu. Nous reprendrons ici les attendus des contributions :

La mise en avant du « sens » a en effet longtemps été regardée avec beaucoup de scepticisme au profit de traitements dits « de surface », s'attachant à « la forme » par opposition au « contenu ». Cette perception est en train de changer. Des progrès significatifs ont été réalisés au cours des dernières années, d'abord sur le document textuel (extraction d'informations, question answering, résumé automatique...), puis relayés de plus en plus dans les autres médias (extraction d'information et indexation de documents sonores et vidéo par le contenu, résumé d'oeuvres...). Par ailleurs, les travaux déployés autour du thème du « web sémantique » visent à décrire le contenu des documents ou ressources de toutes sortes de manière à les rendre accessibles et interopérables.

Un autre point de vue, plus radical, serait de considérer que même les traitements dits « de surface » ou « numériques » sont en fait, à y bien regarder, sémantiques. Si le « sens » ne se réduit pas à « l'information », produire de l'information, n'est-ce pas produire du sens ? Un désambiguïseur utilisant une méthode statistique, même si la méthode ne se réclame d'aucune théorie linguistique, résout bien une ambiguïté sémantique lexicale. Un segmenteur thématique va repérer des récurrences lexicales que d'autres appelleront isotopies. Un extracteur de descripteurs thématiques produit bien ce sens minimal : « de quoi parle ce document », etc.

On le voit, l'appel était volontairement ouvert, laissant aux auteurs toute latitude pour décliner à leur guise le terme « sémantique », en fonction de leurs propres objectifs et méthodes de recherche.

Titre Approches sémantiques du document électronique
Édité par Mauro Gaio, Patrice Enjalbert
Collection E-document
Éditeur Europia productions
CLIL (Version 2013-2019 ) 3080 SCIENCES HUMAINES ET SOCIALES, LETTRES
Date de première publication du titre 01 juin 2004
Code Identifiant de classement sujet      93 Classification thématique Thema: J
Support Livre broché
Nb de pages 326 p.
ISBN-10 2909285286
ISBN-13 978-2-909285-28-3
GTIN13 (EAN13) 9782909285283
Référence 113116-63
Date de publication 01 juin 2004
Nombre de pages de contenu principal 326
Format 16 x 24 x 1,6 cm
Poids 528 gr
Prix 50,00 €
 
113116-63


 

 

 

Autres titres dans...

la collection :