Dépôt Institutionnel de l'Université Ferhat ABBAS - Sétif 1 >
Faculté des Sciences >
Département d'Informatique >
Thèses de doctorat >
Veuillez utiliser cette adresse pour citer ce document :
http://dspace.univ-setif.dz:8888/jspui/handle/123456789/3845
|
Titre: | Apprentissage statistique pour l’extraction des relations à partir de textes |
Auteur(s): | Belazzoug, Mouhoub |
Mots-clés: | Catégorisation des textes |
Date de publication: | 12-jui-2021 |
Résumé: | Le modèle de sac de mots est couramment utilisé dans la catégorisation de textes. Le problème principal de ce dernier réside dans le grand nombre d’attributs extraits, cela influe négativement sur les performances des tâches de catégorisation. Pour résoudre ce problème, une méthode de sélection des fonctionnalités est nécessaire. La sélection des fonctionnalités est bénéfique pour réduire la dimensionnalité du problème, elle conduit à minimiser le temps de calcul et à améliorer les performances de la tâche de catégorisation.
Dans cette thèse, nous proposons un nouvel algorithme amélioré de l’algorithme original de recherche Sinus Cosinus (SCA) pour la sélection des fonctionnalités, qui permet une meilleure exploration dans l'espace de recherche. Contrairement au SCA qui se concentre uniquement sur la meilleure solution pour générer une nouvelle solution, le nouvel algorithme (ISCA) de notre proposition prend en compte deux positions de la solution : (i) la position de la meilleure solution trouvée jusqu'à présent, et (ii) une position aléatoire appartenant à l'espace de recherche. Cette combinaison nous permet de proposer un algorithme simple capable d'éviter une convergence prématurée et d'obtenir des performances très satisfaisantes. Pour valider le nouvel algorithme ISCA, nous avons effectué une série d'expériences sur neuf collections de ,textes, où nous avons comparé les résultats expérimentaux avec plusieurs algorithmes de recherche, y compris l'algorithme SCA d'origine et certaines de ses versions améliorées, ainsi que l’algorithme d’optimisation Moth Flam (MFO).
De plus, de l'état de l'art, les algorithmes génétiques (GA) ainsi que les colonies de fourmis (ACO) sont choisis dans notre étude comparative. Nos résultats d'évaluation démontrent la haute performance de notre algorithme ISCA proposé qui le rend très utile pour les problèmes de catégorisation de textes. |
URI/URL: | http://dspace.univ-setif.dz:8888/jspui/handle/123456789/3845 |
Collection(s) : | Thèses de doctorat
|
Fichier(s) constituant ce document :
|
Tous les documents dans DSpace sont protégés par copyright, avec tous droits réservés.
|