configuration pour transcrire des fichiers audio wav avec Vosk
You can not select more than 25 topics Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.
 
 
 
Tykayn 29c19f6906 fix file name for outputs 2 days ago
.idea change conversion and readme 6 days ago
input change conversion and readme 6 days ago
models add converters from mp3 6 days ago
output init transcription repo with install instructions 1 week ago
.gitignore fix count of lines in output, add name of original file to outputs 4 days ago
LICENSE.md init transcription repo with install instructions 1 week ago
Makefile rename some files, update readme 6 days ago
README.md Mise à jour de README.md 5 days ago
clean.sh add converters from mp3 6 days ago
conversion_simple_fr.py init transcription repo with install instructions 1 week ago
extract_srt.py add conversion to srt file 6 days ago
flac_to_wav.sh formats conversion files, a bash script for each. needs optimisation 4 days ago
install.sh rename some files, update readme 6 days ago
mkv_to_wav.sh formats conversion files, a bash script for each. needs optimisation 4 days ago
mp3_to_wav.sh formats conversion files, a bash script for each. needs optimisation 4 days ago
mp4_to_wav.sh formats conversion files, a bash script for each. needs optimisation 4 days ago
ogg_to_wav.sh formats conversion files, a bash script for each. needs optimisation 4 days ago
transcript.sh fix file name for outputs 2 days ago
wav_to_wav_mono.sh fix file name for outputs 2 days ago

README.md

Transcription avec Vosk, par Tykayn

configuration pour transcrire des fichiers audio wav avec Vosk

mode d'emploi

installation

Prérequis

  • python3 (pour l'école serpentard)
  • pip (gestionnaire de paquets python)
  • git (gestion de version)
  • jq (pour le nettoyage de fichier json)
  • ffmpeg (pour la conversion vers wav) pour les installer avec aptitude
sudo apt install jq python3-pip git ffmpeg

cloner ce dépot dans un dossier de travail

git clone https://forge.chapril.org/tykayn/transcription.git && cd transcription
  • installer vosk via le MakeFile, vérifiez les prérequis ci-dessus. une fois dans votre dossier de transcription fraîchement cloné, faites la commande:
make
  • mettre un fichier audio dans le dossier "input"
  • le convertir en wav mono (avec audacity par exemple)
  • lancer la transcription du wav mono. Une démo est disponible, extraite de l'émission Libre à vous!
make convert file=input/demo.wav

n'oubliez pas l'argument file=

  • la sortie texte de la transcription se trouve dans output output/demo/4_phrases.txt et devrait être affichée à la fin de l'exécution du script. Chaque fichier transcrit a un sous-dossier de son nom dans le dossier output. Ainsi, pour la démo qui se trouve dans input/demo.wav, les fichiers de transcription sont dans output/demo/

Précisions

  • vosk est capable de fournir d'autres informations comme la seconde de début et de fin de la phrase détectée. Cela pourrait être utile pour produire des fichiers de sous titre. Cela a été ajouté dans un script perl grâce à @r_a@framapiaf.org
  • les locuteurs ne sont pas détectés, toutes les phrases sont dites sans cette précision.
  • si deux personnes parlent rapidement l'une après l'autre, vosk considèrera qu'il s'agit d'une seule phrase.
  • les transcriptions peuvent être faites pour plusieurs langues, il faudra modifier le fichier "conversion_simple_fr.py" si on veut autre chose que du Français.

évolutions possibles

  • convertir un fichier mp3 vers WAV mono avec ffmpeg.
  • nettoyer l'écho et normaliser le fichier audio.
  • permettre le traitement en masse de plusieurs fichiers de podcast et leur donner un output nommé comme le fichier d'entrée afin de les distinguer.

liens