Révéler les marchés financiers (Forex/Bourse) avec l'Analyse du Sentiment des Actualités en utilisant Python.

 

Bonjour à tous,

 

Je suis de retour pour partager une expérience de mon projet personnel. Bien que ce projet soit encore en cours de développement, il est possible que certains d'entre vous souhaitent participer pour le développer davantage afin qu'il puisse être bénéfique pour un grand nombre de personnes.

 

Comme nous le ressentons tous et le vivons, à l'ère de l'information numérique actuelle, les données sont au cœur des décisions d'investissement, que ce soit sur le marché boursier ou le Forex. Analyser le sentiment du marché est l'un des moyens très utiles pour comprendre les mouvements des prix des actions ou des devises. Dans ce projet, nous allons explorer les étapes pour réaliser une Analyse du Sentiment des Actualités sur les données du marché financier en utilisant Python.

 

Qu'est-ce que l'"Analyse du Sentiment des Actualités" ?
L'Analyse du Sentiment des Actualités ou "News Sentiment Analysis" est une technique de traitement du langage naturel utilisée pour extraire et évaluer le sentiment ou l'opinion à partir du texte des actualités. Dans le contexte financier, cela signifie analyser les avis, les nouvelles ou les tweets pour comprendre les émotions ou le sentiment des investisseurs à l'égard d'un actif.

 

Quelles sont les principales étapes de ce Projet ?
Il est bien sûr nécessaire de suivre plusieurs étapes ou phases pour réaliser ce projet. Voici un aperçu général des étapes de réalisation de ce projet :

  1. Collecte de données: Rassembler des données à partir de sources telles que Twitter, des sites d'actualités financières ou des plateformes spécialisées fournissant des données de sentiment liées au marché. Mais dans ce projet, nous utilisons la technique de collecte de données appelée 'web scraping'. Le site ciblé est https://www.forexfactory.com/calendar.
  2. Prétraitement des données: Nettoyer et préparer les données pour l'analyse, y compris des étapes telles que la suppression des colonnes inutilisées, la suppression des caractères (mots vides, symboles), la conversion des données et la normalisation du texte.
  3. Analyse du Sentiment: Utilisation d'algorithmes ou de modèles d'apprentissage automatique pour évaluer le sentiment des actualités, tels que la Régression Logistique, la Forêt Aléatoire ou des techniques de Pipeline.
  4. Visualisation des résultats: Afficher les résultats de l'analyse sous forme de graphiques ou de visualisations compréhensibles pour obtenir des perspectives plus approfondies.
  5. Construction de l'apprentissage automatique: Prédire le sentiment des actualités manuellement peut prendre du temps et être sujet à des biais subjectifs. Avec l'apprentissage automatique, nous pouvons utiliser des algorithmes pour analyser automatiquement le texte des actualités, extraire des modèles et prédire le sentiment avec un niveau de précision assez élevé.

 

Quels sont les outils et langages de programmation utilisés ?
Dans ce projet, nous utiliserons Python comme principal langage de programmation, et quelques bibliothèques telles que :

  • NLTK (Natural Language Toolkit) pour effectuer le prétraitement du texte.
  • Scikit-learn pour la construction du modèle d'Analyse du Sentiment.
  • Pandas et Matplotlib/Seaborn pour la manipulation des données et la visualisation.

Je vais expliquer étape par étape l'utilisation de Python pour ce projet.

Bon, vous êtes curieux de savoir à quoi ressemble ce projet ? 

 

Quelle est l'idée derrière ce projet ?

En fait, l'idée a émergé lorsque je développais un projet d'apprentissage automatique qui pourrait prédire les prix des actions/forex. L'idée est venue car j'ai remarqué un immense potentiel pour toute personne intéressée par le marché financier, notamment les investisseurs ou les traders, de réaliser des bénéfices significatifs en utilisant cet apprentissage automatique, associé au 'Sentiment des Actualités'. La relation entre les actualités et les mouvements des actions ou du forex est très étroite. Elles ont une corrélation très élevée. Les actualités économiques, politiques, financières ou d'autres facteurs affectant les conditions macroéconomiques d'un pays ou d'une industrie peuvent avoir un impact significatif sur les prix des actions ou les taux de change sur le marché du forex. De plus, le défi dans le Trading d'Actualités est la forte volatilité, ce qui signifie que les prix peuvent évoluer rapidement et de manière inattendue après la publication des actualités, augmentant ainsi les risques de trading. Il y a également le 'Slippage', des difficultés à obtenir le prix souhaité en raison des changements rapides de prix après la publication des actualités. De plus, les réactions du marché (les sentiments) peuvent parfois être contraires. Parfois, le marché réagit de manière contraire aux attentes attendues des actualités, rendant le trading difficile à prédire. C'est pourquoi j'ai eu l'idée de créer un modèle d'apprentissage automatique pour prédire le sentiment des actualités par rapport aux prix du marché.

 

Dans cette section, j'expliquerai à l'aide du langage de programmation Python (Google Colab) pour faciliter la compréhension.

 

Google Colab : https://colab.research.google.com/drive/13MdNp1gxW4Z5mCbScIgCnb4KcsYa7nL8?usp=sharing

 

Voilà.

Je n'ai pas encore fourni de description ou d'explication pour chaque script Python. S'il y a des questions, veuillez laisser vos commentaires dans la section ci-dessous.

 

Colmar, 19 décembre 2023, Hiver.