Aller au contenu principal

Abderraouf Birem

Résumé du projet de thèse: This project aims to challenge the Efficient Market Hypothesis (EMH) by applying Natural Language Processing (NLP) techniques in combination with neural networks to improve market efficiency. The project focuses on forecasting stock market indexes by extracting valuable insights from various textual sources, including news articles, social media data, and financial reports. It begins by formalizing the EMH and examining its validity in stock market predictive models, considering the influence of big data. The project then explores the use of Neural Networks and NLP to test the validity of EMH, using data from clean price APIs and scraping NLP data from multiple sources. It addresses the challenges of preprocessing and feature selection in NLP techniques. Furthermore, the project broadens the scope of NLP techniques by incorporating sentiment analysis beyond individual company data, investigating the influence of external factors on the stock market and analyzing the impact of news sentiment. Finally, it investigates the integration of NLP techniques into financial market volatility models, aiming to enhance the effectiveness of volatility models by converting textual data into quantitative information and considering the impact of news shocks on market volatility.

Résumé du projet de thèse en anglais: Ce projet vise à remettre en question l'Hypothèse du Marché Efficient (EMH) en appliquant des techniques de Traitement du Langage Naturel (NLP) en combinaison avec des réseaux neuronaux pour améliorer l'efficacité du marché. Le projet se concentre sur la prévision des indices boursiers en extrayant des informations précieuses de différentes sources textuelles, telles que des articles de presse, des données des médias sociaux et des rapports financiers. Il commence par formaliser l'EMH et examiner sa validité dans les modèles prédictifs du marché boursier, en tenant compte de l'influence des big data. Ensuite, le projet explore l'utilisation de réseaux neuronaux et du NLP pour tester la validité de l'EMH, en utilisant des données provenant d'API de prix fiables et en extrayant des données du NLP à partir de plusieurs sources. Il aborde les défis du prétraitement et de la sélection des caractéristiques dans les techniques du NLP. De plus, le projet élargit la portée des techniques du NLP en incorporant l'analyse des sentiments au-delà des données individuelles des entreprises, en étudiant l'influence des facteurs externes sur le marché boursier et en analysant l'impact des sentiments des nouvelles. Enfin, il examine l'intégration des techniques du NLP dans les modèles de volatilité des marchés financiers, dans le but d'améliorer l'efficacité des modèles de volatilité en convertissant les données textuelles en informations quantitatives et en tenant compte de l'impact des chocs d'actualité sur la volatilité du marché.

Directeur de thèse : Vincent BOUVATIER
Co-encadrant : Zineb ABIDI

Page personnelle

Date d'inscription en thèse
1 septembre 2023

Financement
Conditions financières à l'entrée en doctorat : Financement dédié à la préparation du doctorat
Quotité de temps de travail consacrée à la préparation du doctorat : temps plein