|
Dépôt Institutionnel de l'Université Ferhat ABBAS - Sétif 1 >
Faculté des Sciences >
Département d'Informatique >
Mémoires de master >
Veuillez utiliser cette adresse pour citer ce document :
http://dspace.univ-setif.dz:8888/jspui/handle/123456789/5994
|
| Titre: | RAG-Based Chatbot for Departmental Documents |
| Auteur(s): | Djaouzi, Lydia Berarma, Ouafa Chahinez |
| Mots-clés: | RAG-Based Chatbot Background Use Case: Trade Forecasting |
| Date de publication: | 2025 |
| Résumé: | This thesis presents a novel approach to analyzing the leverage of global events on international
trade transactions by integrating and exploiting data from the GDELT project.
The research develops a comprehensive methodology centered around the construction
and utilization of a knowledge graph.
Initially, a pre-trained language model (LLaMA 3.2) is fine-tuned on a proprietary
dataset of country-level transactions to establish a baseline understanding of trade patterns.
Concurrently, an ontology is conceptualized for GDELT features using a semantic
clustering approach facilitated by the all-MiniLM-L6-v2 large language model (LLM),
defining relationships with the Web Ontology Language (OWL).
An automated process is then implemented to download and populate this ontology
with data from the official GDELT source, forming an initial knowledge graph.
This graph is subsequently enriched through an iterative process that employs the
facebook/bart-large-mnl LLM, which analyzes not only primary GDELT articles but
also articles mentioned in them to identify new features or fill in missing information
within the database.
Finally, leveraging Graph Neural Network techniques, the project enables the extraction
of event-specific subgraphs from the knowledge graph based on user prompts,
allowing for detailed queries to conclude the causal leverage and consequences of specific
events on trade transactions.
This work provides a robust framework for understanding the complex dynamics between
global events and economic transactions, offering enhanced analytical and potentially
predictive capabilities==============================================================================
Cette th`ese pr´esente une approche novatrice pour analyser l’influence des ´ev´enements
mondiaux sur les transactions commerciales internationales en int´egrant et en exploitant
les donn´ees du projet GDELT.
La recherche d´eveloppe une m´ethodologie compl`ete centr´ee sur la construction et
l’utilisation d’un graphe de connaissances.
Initialement, un mod`ele de langue pr´e-entraˆın´e (LLaMA 3.2) est affin´e sur un jeu de
donn´ees propri´etaire de transactions au niveau des pays afin d’´etablir une compr´ehension
de base des sch´emas commerciaux. Parall`element, une ontologie est conceptualis´ee pour
les caract´eristiques de GDELT en utilisant une approche de regroupement s´emantique
facilit´ee par le grand mod`ele de langue (LLM) all-MiniLM-L6-v2, d´efinissant les relations
avec le Web Ontology Language (OWL).
Un processus automatis´e est ensuite mis en oeuvre pour t´el´echarger et peupler cette ontologie
avec des donn´ees provenant de la source officielle de GDELT, formant un graphe
de connaissances initial. Ce graphe est par la suite enrichi par un processus it´eratif
qui emploie le LLM facebook/bart-large-mnl, lequel analyse non seulement les articles
GDELT primaires mais aussi les articles qui y sont mentionn´es afin d’identifier de
nouvelles caract´eristiques ou de combler les informations manquantes dans la base de
donn´ees.
Finalement, en s’appuyant sur les techniques des r´eseaux de neurones sur graphes,
le projet permet l’extraction de sous-graphes sp´ecifiques `a des ´ev´enements `a partir du
graphe de connaissances en fonction des requˆetes de l’utilisateur, permettant des interrogations
d´etaill´ees pour conclure sur l’influence causale et les cons´equences d’´ev´enements
sp´ecifiques sur les transactions commerciales.
Ce travail fournit un cadre robuste pour comprendre la dynamique complexe entre les
´ev´enements mondiaux et les transactions ´economiques, offrant des capacit´es analytiques
et potentiellement pr´edictives am´elior´ees. |
| URI/URL: | http://dspace.univ-setif.dz:8888/jspui/handle/123456789/5994 |
| Collection(s) : | Mémoires de master
|
Fichier(s) constituant ce document :
Il n'y a pas de fichiers associés à ce document.
|
Tous les documents dans DSpace sont protégés par copyright, avec tous droits réservés.
|