|
Dépôt Institutionnel de l'Université Ferhat ABBAS - Sétif 1 >
Faculté des Sciences >
Département d'Informatique >
Mémoires de master >
Veuillez utiliser cette adresse pour citer ce document :
http://dspace.univ-setif.dz:8888/jspui/handle/123456789/5679
|
Titre: | Évaluation des performances des données générées par l’intelligence artificielle dans l’entraînement des modèles d’apprentissage automatique et profond |
Auteur(s): | Mairi, Hadil Zahoua Rezouali, Malek |
Mots-clés: | Données synthétiques LLM GAN apprentissage automatique Apprentissage profond, Classification |
Date de publication: | 2025 |
Résumé: | Avec l’évolution de l’intelligence artificielle générative, des modèles comme les LLMs (modèles
de langage de grande taille, par exemple ChatGPT) et les GANs (réseaux antagonistes
génératifs) sont devenus capables de produire de nouvelles données à partir de simples instructions
ou exemples. Cette avancée permet d’utiliser ces modèles pour générer des données
synthétiques, en particulier lorsque les données réelles sont rares ou difficiles à obtenir, comme
dans les domaines médicaux ou sensibles. Dans ce mémoire, nous avons utilisé ces modèles
pour créer deux types de données : des données textuelles (émotions, avis) et des données médicales
numériques (diabète, ARNm). Ensuite, nous avons évalué leur utilité pour l’entraînement
de modèles d’apprentissage automatique (KNN, SVM, MLP, CNN), sur des jeux de données
réelles, générées, ou combinées. Nous avons également appliqué la technique du fine-tuning
dans certains cas.Les résultats montrent que les LLMs sont efficaces pour générer du texte,
avec des résultats proches des données réelles. En revanche, les GANs sont moins performants,
surtout avec les données médicales. Les modèles entraînés uniquement sur des données générées
donnent des résultats faibles, mais lorsque ces données sont combinées avec des données
réelles, les performances s’améliorent.Nous concluons que les modèles génératifs peuvent être
utiles pour enrichir les jeux de données existants, mais ils ne peuvent pas remplacer les données
réelles, surtout dans des domaines comme la santé, qui exigent une grande précision. précision |
URI/URL: | http://dspace.univ-setif.dz:8888/jspui/handle/123456789/5679 |
Collection(s) : | Mémoires de master
|
Fichier(s) constituant ce document :
Il n'y a pas de fichiers associés à ce document.
|
Tous les documents dans DSpace sont protégés par copyright, avec tous droits réservés.
|