Skip to content

Ce projet a pour but de comparer deux nouvelles approches d'extraction de mots-clés. Une app de démo du modèle retenu sera créée avec Streamlit.

Notifications You must be signed in to change notification settings

BiGHeaDMaX/Nouvelles-methodes-extraction-mots-cles

Repository files navigation

Introduction

Ce projet a pour but de développer une preuve de concept. Il s'agira ici de trouver une nouvelle méthode afin de pouvoir suggérer des mots-clefs lors de la rédaction d'un message sur le forum StackOverflow

Deux approches ont été testées :

  • Extraction de mots-clefs avec KeyBERT.
  • Prédiction de mots-clefs avec le LLM Mistral 7B.

Contenu de ce repository

  • 01 - Plan de travail prévisionnel.pdf : plan prévisionnel du travail réalisé, présentant le dataset qui sera utilisé, le modèle envisagé et des références bibliographiques.
  • 02 - Comparaison des approches.ipynb : comparaisons de nouvelles approches avec une baseline.
  • 03 - Note méthodologique.pdf : présentation de la preuve de concept et des résultats.
  • 04 - Présentation.pptx : support de présentation.
  • Dossier /app : fichiers de l'application Streamlit permettant une brève exploration des données et de montrer le modèle de prédiction en action, ainsi que les informations permettant son déploiement sur Azure.
  • data_clean.zip : le jeu de données utilisé.

Note
Ce travail vise à améliorer les résultats d'un précédent projet sur cette thématique, que vous pouvez retrouver dans ce repository

Article associé

Retrouvez l'article de présentation de ce projet ici.

About

Ce projet a pour but de comparer deux nouvelles approches d'extraction de mots-clés. Une app de démo du modèle retenu sera créée avec Streamlit.

Topics

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published