Dépôt Institutionnel de l'Université Ferhat ABBAS - Sétif 1 >
Faculté des Sciences >
Département d'Informatique >
Thèses de doctorat >
Veuillez utiliser cette adresse pour citer ce document :
http://dspace.univ-setif.dz:8888/jspui/handle/123456789/32
|
Titre: | Une approche de fouille des textes basée sur la classification et la segmentation thématique : Application aux corpus des traditions prophétiques "Hadith" |
Auteur(s): | HARRAG, Fouzi |
Mots-clés: | Découverte de connaissances, Fouille de données, Fouille de textes, Système de
recherche d’information, Classification thématique, Segmentation thématique. |
Date de publication: | 27-oct-2014 |
Résumé: | Dans un travail antérieur, sur la modélisation d'expertise dans les bases de données avec
application au corpus des Traditions Prophétiques (Hadith), nous avons étudié puis développé
un modèle automatique de fouille de texte basé sur desméthodes statistiques afin de découvrir
les similarités sémantiques entre les textes en question.
A présent, notre recherche a pour but d’étudier les nouvelles méthodes de classification et de
segmentation des connaissances dans les bases de données textuelles telles que celles des
Traditions Prophétiques (Hadith). Ces méthodes représentent un processus de structuration de
l'ensemble des informations et des réponses fourniespar un système de recherche. La
classification thématique permet à l’utilisateur d’orienter son exploration en fonction des
thématiques générales des classes et d’accéder ainsiplus rapidement au but de sa recherche. La
segmentation permet de présenter à l’utilisateur les segments textuels jugés pertinents et de
mieux positionner certains documents longs dans lesquels l’information recherchée ne constitue
que l’une des thématiques abordée. Ce travail s’applique dans le cas où nous avons une quantité
trop importante de données ce qui est le cas des corpus du Hadith. |
URI/URL: | http://dspace.univ-setif.dz:8888/jspui/handle/123456789/32 |
Collection(s) : | Thèses de doctorat
|
Fichier(s) constituant ce document :
|
Tous les documents dans DSpace sont protégés par copyright, avec tous droits réservés.
|