# Transcription avec Vosk, par Tykayn

configuration pour transcrire des fichiers audio wav avec Vosk

## mode d'emploi

### installation
#### Prérequis
* python3
* pip
* git

#### cloner ce dépot dans un dossier de travail
```bash
git clone ssh://gitea@forge.chapril.org:222/tykayn/transcription.git && cd transcription
```

* installer vosk via le MakeFile, nécessite python3 pip. faites la commande:
```
make
```
* mettre un fichier audio dans le dossier "input"
* le convertir en wav mono (avec audacity par exemple)
* lancer la transcription du wav mono. Une démo est disponible, extraite de l'émission Libre à vous!
```
make convert input/demo.wav
```
* la sortie texte de la transcription se trouve dans output `output/converted_out_without_nulls.txt` et devrait être affichée à la fin de l'exécution du script.
 
# Précisions
* vosk est capable de fournir d'autres informations comme la seconde de début et de fin de la phrase détectée. Cela pourrait être utile pour produire des fichiers de sous titre.
* les locuteurs ne sont pas détectés, toutes les phrases sont dites sans cette précision.
* si deux personnes parlent rapidement l'une après l'autre, vosk considèrera qu'il s'agit d'une seule phrase.
* les transcriptions peuvent être faites pour plusieurs langues, il faudra modifier le fichier "conversion_simple_fr.py" si on veut autre chose que du Français.

# évolutions possibles
- convertir un fichier mp3 vers WAV mono avec ffmpeg.
- nettoyer l'écho et normaliser le fichier audio.
- permettre le traitement en masse de plusieurs fichiers de podcast et leur donner un output nommé comme le fichier d'entrée afin de les distinguer.

# liens
https://cause-commune.fm/podcastfilter/libre-a-vous/
https://www.librealire.org
https://listes.april.org/wws/arc/transcriptions/2021-02/msg00016.html
https://alphacephei.com/vosk/install
https://www.cipherbliss.com/
https://mastodon.cipherbliss.com/@tykayn