transcription/convert_from_wav.sh

30 lines
1.3 KiB
Bash
Raw Normal View History

#!/bin/bash
# utilisation: bash convert_from_wav.sh MONFICHIER.wav
# auteur du script: tykayn contact@cipherbliss.com
2021-02-18 15:46:55 +01:00
echo "########### $(date) : conversion de fichier audio .WAV mono piste uniquement,
avec Vosk installé par pip3, et un modèle de textes en français."
echo " "
2021-02-18 15:46:55 +01:00
echo "########### $(date) : fichier : $file"
echo " "
2021-02-18 15:46:55 +01:00
python3 ./conversion_simple_fr.py "$file" > output/converted_output.txt
echo " "
2021-02-18 15:46:55 +01:00
echo "########### $(date) : nettoyer la sortie "
2021-02-18 12:01:57 +01:00
jq .text output/converted_output.txt > output/converted_cleaned_with_null.txt
sed 's/null//g' output/converted_cleaned_with_null.txt > output/converted_out_without_nulls.txt
sed 's/^ *//; s/ *$//; /^$/d' output/converted_out_without_nulls.txt > output/converted_out_without_nulls2.txt
sed 's/\"//g' output/converted_out_without_nulls2.txt > output/converted_out_without_nulls3.txt
2021-02-18 15:46:55 +01:00
echo "########### $(date) : OK "
echo " "
2021-02-18 12:01:57 +01:00
COUNT_LINES=$(cat output/converted_out_without_nulls3.txt |wc -l)
2021-02-18 15:46:55 +01:00
cat output/converted_out_without_nulls.txt
echo " "
echo "########### $(date) : lignes transcriptes $COUNT_LINES "
echo "########### $(date) : conversion faite dans output/converted_out_without_nulls.txt"
2021-02-19 10:27:46 +01:00
echo "########### $(date) : conversion de la sortie en fichier de sous titres"
perl clean.sh output/converted_output.txt > output/output.srt
exit 0