DSpace
 

Dépôt Institutionnel de l'Université Ferhat ABBAS - Sétif 1 >
Faculté des Sciences >
Département d'Informatique >
Mémoires de master >

Veuillez utiliser cette adresse pour citer ce document : http://dspace.univ-setif.dz:8888/jspui/handle/123456789/5994

Titre: RAG-Based Chatbot for Departmental Documents
Auteur(s): Djaouzi, Lydia
Berarma, Ouafa Chahinez
Mots-clés: RAG-Based
Chatbot
Background
Use Case: Trade Forecasting
Date de publication: 2025
Résumé: This thesis presents a novel approach to analyzing the leverage of global events on international trade transactions by integrating and exploiting data from the GDELT project. The research develops a comprehensive methodology centered around the construction and utilization of a knowledge graph. Initially, a pre-trained language model (LLaMA 3.2) is fine-tuned on a proprietary dataset of country-level transactions to establish a baseline understanding of trade patterns. Concurrently, an ontology is conceptualized for GDELT features using a semantic clustering approach facilitated by the all-MiniLM-L6-v2 large language model (LLM), defining relationships with the Web Ontology Language (OWL). An automated process is then implemented to download and populate this ontology with data from the official GDELT source, forming an initial knowledge graph. This graph is subsequently enriched through an iterative process that employs the facebook/bart-large-mnl LLM, which analyzes not only primary GDELT articles but also articles mentioned in them to identify new features or fill in missing information within the database. Finally, leveraging Graph Neural Network techniques, the project enables the extraction of event-specific subgraphs from the knowledge graph based on user prompts, allowing for detailed queries to conclude the causal leverage and consequences of specific events on trade transactions. This work provides a robust framework for understanding the complex dynamics between global events and economic transactions, offering enhanced analytical and potentially predictive capabilities============================================================================== Cette th`ese pr´esente une approche novatrice pour analyser l’influence des ´ev´enements mondiaux sur les transactions commerciales internationales en int´egrant et en exploitant les donn´ees du projet GDELT. La recherche d´eveloppe une m´ethodologie compl`ete centr´ee sur la construction et l’utilisation d’un graphe de connaissances. Initialement, un mod`ele de langue pr´e-entraˆın´e (LLaMA 3.2) est affin´e sur un jeu de donn´ees propri´etaire de transactions au niveau des pays afin d’´etablir une compr´ehension de base des sch´emas commerciaux. Parall`element, une ontologie est conceptualis´ee pour les caract´eristiques de GDELT en utilisant une approche de regroupement s´emantique facilit´ee par le grand mod`ele de langue (LLM) all-MiniLM-L6-v2, d´efinissant les relations avec le Web Ontology Language (OWL). Un processus automatis´e est ensuite mis en oeuvre pour t´el´echarger et peupler cette ontologie avec des donn´ees provenant de la source officielle de GDELT, formant un graphe de connaissances initial. Ce graphe est par la suite enrichi par un processus it´eratif qui emploie le LLM facebook/bart-large-mnl, lequel analyse non seulement les articles GDELT primaires mais aussi les articles qui y sont mentionn´es afin d’identifier de nouvelles caract´eristiques ou de combler les informations manquantes dans la base de donn´ees. Finalement, en s’appuyant sur les techniques des r´eseaux de neurones sur graphes, le projet permet l’extraction de sous-graphes sp´ecifiques `a des ´ev´enements `a partir du graphe de connaissances en fonction des requˆetes de l’utilisateur, permettant des interrogations d´etaill´ees pour conclure sur l’influence causale et les cons´equences d’´ev´enements sp´ecifiques sur les transactions commerciales. Ce travail fournit un cadre robuste pour comprendre la dynamique complexe entre les ´ev´enements mondiaux et les transactions ´economiques, offrant des capacit´es analytiques et potentiellement pr´edictives am´elior´ees.
URI/URL: http://dspace.univ-setif.dz:8888/jspui/handle/123456789/5994
Collection(s) :Mémoires de master

Fichier(s) constituant ce document :

Il n'y a pas de fichiers associés à ce document.

View Statistics

Tous les documents dans DSpace sont protégés par copyright, avec tous droits réservés.

 

Valid XHTML 1.0! Ce site utilise l'application DSpace, Version 1.4.1 - Commentaires