language-modeling

scripts for language modeling

This project is a collection of scripts that help for language modeling. These scripts include:

A Vocabulary can be built in two ways

Both scripts use build_vocab/wordfreq2vocab.py

usage: wordfreq2vocab.py [-h] -t TEXT -v VOCABULARY -f FREQUENCY
                         [-top TOP | -gt GT | -all]

build_lm/build_lm.sh

Name		Name	Last commit message	Last commit date
Latest commit History 57 Commits
build_lm		build_lm
build_vocab		build_vocab
prepare		prepare
.gitignore		.gitignore
LICENSE		LICENSE
README.md		README.md
formating.sh		formating.sh
mix_lm.sh		mix_lm.sh
requirements		requirements
run_build_lm.sh		run_build_lm.sh
run_build_lm_v1.1.sh		run_build_lm_v1.1.sh
run_prepare.sh		run_prepare.sh
run_py_prepare.sh		run_py_prepare.sh
sclite.sh		sclite.sh
selected_corpus.sh		selected_corpus.sh
steps.sh		steps.sh
test.arb		test.arb
test_LM_decoding.sh		test_LM_decoding.sh
test_lm.sh		test_lm.sh