Extraction automatique des mots-clés à partir de publications scientifiques pour l'indexation et l'ouverture des données en agronomie

M. Roche, S. Fortuno, J.A. Lossio-Ventura, A. Akli, S. Belkebir, T. Lounis, S. Toure

Résumé


Dans le contexte des masses de données textuelles liées à l'agriculture aujourd'hui disponibles, leur indexation devient un enjeu crucial pour les organismes de recherche. Une manière d'indexer au mieux les documents consiste à en extraire la terminologie. Cet article explore l'utilisation et la combinaison de méthodologies de fouille de textes afin de mettre en exergue, puis de publier dans des systèmes d'open data, les termes les plus adaptés issus de documents. Des expérimentations menées sur des données du CIRAD (Centre de coopération internationale en recherche agronomique pour le développement), montrent le bien-fondé de la démarche qui a permis d'extraire des termes à la fois nouveaux et pertinents.

Mots-clés


documentation ; gestion des connaissances ; indexation d'information ; méthodes ; traitement des données ; méthodes et outils

Texte intégral :

PDF


DOI: https://doi.org/10.1684/agr.2015.0773

Affiliations

UMR TETIS (Cirad, Irstea, AgroParisTech); LIRMM (CNRS, Université de Montpellier) ; UMR TETIS (Cirad, Irstea, AgroParisTech) ; LIRMM (CNRS, Université de Montpellier); Université de Montpellier ; Université de Montpellier ; Université de Montpellier ; Université de Montpellier ; Université de Montpellier



Renvois

  • Il n'y a présentement aucun renvoi.


Licence Creative Commons
Ce(tte) œuvre est mise à disposition selon les termes de la Licence Creative Commons Attribution - Pas d’Utilisation Commerciale 4.0 International.

Cah. Agric. ISSN 1166-7699 Publié sous licence CC-By-NC