article-retrieval-system

Efficient RAG retrieval system for article fragments from the Kaggle dataset available here. This system supports popular vector stores retrieval and includes a Question Answering functionality with Large Language Models (LLMs). By default, it utilizes FAISS for vector store retrieval and the Mixtral-8x7B LLM. More details in report.

Prerequisites

Data loading

To download the dataset, you can choose one of two options:

Download it manually from link and create folder named data in project root directory. Then store the medium.csv file in that folder.
Use the Kaggle API: Download your account token from this link and overwrite the existing kaggle.json file.

User Access Token

This step is not obligatory but necessary if you want to use Q/A system with Large Language Model support. To obtain your HuggingFaceHub API Token generate it and copy it from your HuggingFace account and paste it to .env file overwriting <YOUR_TOKEN> placeholder.

Running options

Local

pip install -r requirements.txt
chmod +x kaggle.sh
./kaggle.sh
streamlit run app.py

Docker

sudo docker build -t ars-app:latest .
sudo docker container run -it -p 8501:8501 ars-app:latest

Name		Name	Last commit message	Last commit date
Latest commit History 12 Commits
src		src
.env		.env
.gitignore		.gitignore
Dockerfile		Dockerfile
README.md		README.md
app.py		app.py
kaggle.json		kaggle.json
kaggle.sh		kaggle.sh
report.md		report.md
requirements.txt		requirements.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

src

src

.env

.env

.gitignore

.gitignore

Dockerfile

Dockerfile

README.md

README.md

app.py

app.py

kaggle.json

kaggle.json

kaggle.sh

kaggle.sh

report.md

report.md

requirements.txt

requirements.txt

Repository files navigation

article-retrieval-system

Prerequisites

Data loading

User Access Token

Running options

Local

Docker

Demo

About

Releases

Packages

Languages

kamil271e/ars

Folders and files

Latest commit

History

Repository files navigation

article-retrieval-system

Prerequisites

Data loading

User Access Token

Running options

Local

Docker

Demo

About

Topics

Resources

Stars

Watchers

Forks

Languages