adapt readme
This commit is contained in:
parent
9e09805f6d
commit
0afc6ffdcd
8
Makefile
8
Makefile
@ -1,3 +1,5 @@
|
|||||||
default: bash install.sh
|
default: install
|
||||||
install: bash install.sh
|
install:
|
||||||
convert: bash convert_from_wav.sh
|
bash install.sh
|
||||||
|
convert:
|
||||||
|
bash convert_from_wav.sh $1
|
||||||
|
44
README.md
44
README.md
@ -1,11 +1,45 @@
|
|||||||
# transcription avec Vosk
|
# Transcription avec Vosk, par Tykayn
|
||||||
|
|
||||||
configuration pour transcrire des fichiers audio wav avec Vosk
|
configuration pour transcrire des fichiers audio wav avec Vosk
|
||||||
|
|
||||||
## mode d'emploi
|
## mode d'emploi
|
||||||
|
|
||||||
* installer vosk, nécessite python3 pip. faites la commande: ** make install **
|
### installation
|
||||||
|
#### Prérequis
|
||||||
|
* python3
|
||||||
|
* pip
|
||||||
|
* git
|
||||||
|
|
||||||
|
#### cloner ce dépot dans un dossier de travail
|
||||||
|
```bash
|
||||||
|
git clone ssh://gitea@forge.chapril.org:222/tykayn/transcription.git && cd transcription
|
||||||
|
```
|
||||||
|
|
||||||
|
* installer vosk via le MakeFile, nécessite python3 pip. faites la commande:
|
||||||
|
```
|
||||||
|
make
|
||||||
|
```
|
||||||
* mettre un fichier audio dans le dossier "input"
|
* mettre un fichier audio dans le dossier "input"
|
||||||
* le convertir en wav mono
|
* le convertir en wav mono (avec audacity par exemple)
|
||||||
* lancer la transcription du wav mono
|
* lancer la transcription du wav mono. Une démo est disponible, extraite de l'émission Libre à vous!
|
||||||
* la sortie texte de la transcription se trouve dans output
|
```
|
||||||
|
make convert input/demo.wav
|
||||||
|
```
|
||||||
|
* la sortie texte de la transcription se trouve dans output `output/converted_out_without_nulls.txt` et devrait être affichée à la fin de l'exécution du script.
|
||||||
|
|
||||||
|
# Précisions
|
||||||
|
* vosk est capable de fournir d'autres informations comme la seconde de début et de fin de la phrase détectée. Cela pourrait être utile pour produire des fichiers de sous titre.
|
||||||
|
* les locuteurs ne sont pas détectés, toutes les phrases sont dites sans cette précision.
|
||||||
|
* si deux personnes parlent rapidement l'une après l'autre, vosk considèrera qu'il s'agit d'une seule phrase.
|
||||||
|
* les transcriptions peuvent être faites pour plusieurs langues, il faudra modifier le fichier "conversion_simple_fr.py" si on veut autre chose que du Français.
|
||||||
|
|
||||||
|
# évolutions possibles
|
||||||
|
- convertir un fichier mp3 vers WAV mono avec ffmpeg.
|
||||||
|
- nettoyer l'écho et normaliser le fichier audio.
|
||||||
|
- permettre le traitement en masse de plusieurs fichiers de podcast et leur donner un output nommé comme le fichier d'entrée afin de les distinguer.
|
||||||
|
|
||||||
|
# liens
|
||||||
|
https://listes.april.org/wws/arc/transcriptions/2021-02/msg00016.html
|
||||||
|
https://alphacephei.com/vosk/install
|
||||||
|
https://www.cipherbliss.com/
|
||||||
|
https://mastodon.cipherbliss.com/@tykayn
|
||||||
|
Loading…
Reference in New Issue
Block a user