DSpace
 

Dépôt Institutionnel de l'Université Ferhat ABBAS - Sétif 1 >
Faculté des Sciences >
Département d'Informatique >
Mémoires de master >

Veuillez utiliser cette adresse pour citer ce document : http://dspace.univ-setif.dz:8888/jspui/handle/123456789/5679

Titre: Évaluation des performances des données générées par l’intelligence artificielle dans l’entraînement des modèles d’apprentissage automatique et profond
Auteur(s): Mairi, Hadil Zahoua
Rezouali, Malek
Mots-clés: Données synthétiques
LLM
GAN
apprentissage automatique
Apprentissage profond,
Classification
Date de publication: 2025
Résumé: Avec l’évolution de l’intelligence artificielle générative, des modèles comme les LLMs (modèles de langage de grande taille, par exemple ChatGPT) et les GANs (réseaux antagonistes génératifs) sont devenus capables de produire de nouvelles données à partir de simples instructions ou exemples. Cette avancée permet d’utiliser ces modèles pour générer des données synthétiques, en particulier lorsque les données réelles sont rares ou difficiles à obtenir, comme dans les domaines médicaux ou sensibles. Dans ce mémoire, nous avons utilisé ces modèles pour créer deux types de données : des données textuelles (émotions, avis) et des données médicales numériques (diabète, ARNm). Ensuite, nous avons évalué leur utilité pour l’entraînement de modèles d’apprentissage automatique (KNN, SVM, MLP, CNN), sur des jeux de données réelles, générées, ou combinées. Nous avons également appliqué la technique du fine-tuning dans certains cas.Les résultats montrent que les LLMs sont efficaces pour générer du texte, avec des résultats proches des données réelles. En revanche, les GANs sont moins performants, surtout avec les données médicales. Les modèles entraînés uniquement sur des données générées donnent des résultats faibles, mais lorsque ces données sont combinées avec des données réelles, les performances s’améliorent.Nous concluons que les modèles génératifs peuvent être utiles pour enrichir les jeux de données existants, mais ils ne peuvent pas remplacer les données réelles, surtout dans des domaines comme la santé, qui exigent une grande précision. précision
URI/URL: http://dspace.univ-setif.dz:8888/jspui/handle/123456789/5679
Collection(s) :Mémoires de master

Fichier(s) constituant ce document :

Il n'y a pas de fichiers associés à ce document.

View Statistics

Tous les documents dans DSpace sont protégés par copyright, avec tous droits réservés.

 

Valid XHTML 1.0! Ce site utilise l'application DSpace, Version 1.4.1 - Commentaires