|
Approches sémantiques du document électroniqueÉdité par Mauro Gaio, Patrice Enjalbert |
|
Pour sa septième édition, CIDE s'intègre dans la semaine du Document numérique (SDN). Pour chacune des éditions de CIDE le comité de conférence choisi de focaliser le débat sur une thématique particulière qui, au-delà des communautés établies, des disciplines scientifiques et des démarches spécifiques, témoigne des problèmes et des enjeux de cette objet de recherche : le document électronique. Pour cette édition, le thème des approches sémantiques du document électronique a été retenu. Nous reprendrons ici les attendus des contributions : La mise en avant du « sens » a en effet longtemps été regardée avec beaucoup de scepticisme au profit de traitements dits « de surface », s'attachant à « la forme » par opposition au « contenu ». Cette perception est en train de changer. Des progrès significatifs ont été réalisés au cours des dernières années, d'abord sur le document textuel (extraction d'informations, question answering, résumé automatique...), puis relayés de plus en plus dans les autres médias (extraction d'information et indexation de documents sonores et vidéo par le contenu, résumé d'oeuvres...). Par ailleurs, les travaux déployés autour du thème du « web sémantique » visent à décrire le contenu des documents ou ressources de toutes sortes de manière à les rendre accessibles et interopérables. Un autre point de vue, plus radical, serait de considérer que même les traitements dits « de surface » ou « numériques » sont en fait, à y bien regarder, sémantiques. Si le « sens » ne se réduit pas à « l'information », produire de l'information, n'est-ce pas produire du sens ? Un désambiguïseur utilisant une méthode statistique, même si la méthode ne se réclame d'aucune théorie linguistique, résout bien une ambiguïté sémantique lexicale. Un segmenteur thématique va repérer des récurrences lexicales que d'autres appelleront isotopies. Un extracteur de descripteurs thématiques produit bien ce sens minimal : « de quoi parle ce document », etc. On le voit, l'appel était volontairement ouvert, laissant aux auteurs toute latitude pour décliner à leur guise le terme « sémantique », en fonction de leurs propres objectifs et méthodes de recherche.
Titre
Approches sémantiques du document électronique
Édité par
Mauro Gaio, Patrice Enjalbert
Collection
E-document
Éditeur
Europia productions
CLIL (Version 2013-2019 )
3080 SCIENCES HUMAINES ET SOCIALES, LETTRES
Date de première publication du titre
01 juin 2004
Code Identifiant de classement sujet
93 Classification thématique Thema: J
Support
Livre broché
ISBN-10
2909285286
ISBN-13
978-2-909285-28-3
GTIN13 (EAN13)
9782909285283
Référence
113116-63
Date de publication
01 juin 2004
Nombre de pages de contenu principal 326
Format
16 x 24 x 1,6 cm
Poids
528 gr
Prix
50,00 €
|
||
113116-63 |