parent
334cb218c2
commit
3a60202b99
@ -1,6 +1,7 @@
|
||||
/models/fr/*
|
||||
!/input/demo.wav
|
||||
/input/converted_to_wav/*.wav
|
||||
/output/*.txt
|
||||
/output/*.csv
|
||||
/output/*.srt
|
||||
/output/**/*.txt
|
||||
/output/**/*.csv
|
||||
/output/**/*.json
|
||||
/output/**/*.srt
|
||||
|
@ -1,29 +0,0 @@
|
||||
#!/bin/bash
|
||||
# utilisation: bash convert_from_wav.sh MONFICHIER.wav
|
||||
# auteur du script: tykayn contact@cipherbliss.com
|
||||
|
||||
echo "########### $(date) : conversion de fichier audio .WAV mono piste uniquement,
|
||||
avec Vosk installé par pip3, et un modèle de textes en français."
|
||||
echo " "
|
||||
echo "########### $(date) : fichier : $file"
|
||||
echo " "
|
||||
python3 ./conversion_simple_fr.py "$file" > output/converted_output.txt
|
||||
|
||||
echo " "
|
||||
echo "########### $(date) : nettoyer la sortie "
|
||||
jq .text output/converted_output.txt > output/converted_cleaned_with_null.txt
|
||||
|
||||
sed 's/null//g' output/converted_cleaned_with_null.txt > output/converted_out_without_nulls.txt
|
||||
sed 's/^ *//; s/ *$//; /^$/d' output/converted_out_without_nulls.txt > output/converted_out_without_nulls2.txt
|
||||
sed 's/\"//g' output/converted_out_without_nulls2.txt > output/converted_out_without_nulls3.txt
|
||||
echo "########### $(date) : OK "
|
||||
echo " "
|
||||
COUNT_LINES=$(cat output/converted_out_without_nulls3.txt |wc -l)
|
||||
cat output/converted_out_without_nulls.txt
|
||||
echo " "
|
||||
echo "########### $(date) : lignes transcriptes $COUNT_LINES "
|
||||
echo "########### $(date) : conversion faite dans output/converted_out_without_nulls.txt"
|
||||
echo "########### $(date) : conversion de la sortie en fichier de sous titres"
|
||||
perl clean.sh output/converted_output.txt > output/output.srt
|
||||
|
||||
exit 0
|
@ -0,0 +1,38 @@
|
||||
#!/bin/bash
|
||||
# utilisation: bash transcript.sh MONFICHIER.wav
|
||||
# auteur du script: tykayn contact@cipherbliss.com
|
||||
|
||||
echo "########### $(date) : conversion de fichier audio .WAV mono piste uniquement,
|
||||
avec Vosk installé par pip3, et un modèle de textes en français."
|
||||
echo " "
|
||||
echo "########### $(date) : fichier : $file"
|
||||
echo " "
|
||||
FILE_NAME=$(basename $file .wav)
|
||||
OUT_DIR=$( echo "output/$FILE_NAME")
|
||||
mkdir output/$FILE_NAME
|
||||
|
||||
python3 ./conversion_simple_fr.py "$file" > $OUT_DIR/0_output.json
|
||||
|
||||
|
||||
echo " "
|
||||
echo "########### $(date) : nettoyer la sortie "
|
||||
jq .text $OUT_DIR/0_output.json > $OUT_DIR/1_converted.txt
|
||||
|
||||
sed 's/null//g' $OUT_DIR/1_converted.txt > $OUT_DIR/2_without_nulls.txt
|
||||
sed 's/^ *//; s/ *$//; /^$/d' $OUT_DIR/2_without_nulls.txt > $OUT_DIR/3_without_nulls.txt
|
||||
sed 's/\"//g' $OUT_DIR/3_without_nulls.txt > $OUT_DIR/4_phrases.txt
|
||||
echo "########### $(date) : OK "
|
||||
echo " "
|
||||
COUNT_LINES=$(cat $OUT_DIR/phrases.txt |wc -l)
|
||||
cat $OUT_DIR/4_phrases.txt
|
||||
echo " "
|
||||
echo "########### $(date) : lignes transcriptes $COUNT_LINES "
|
||||
echo "########### $(date) : conversion faite dans output/converted_out_without_nulls.txt"
|
||||
echo "########### $(date) : conversion de la sortie en fichier de sous titres"
|
||||
perl clean.sh $OUT_DIR/0_output.json > $OUT_DIR/5_phrases.srt
|
||||
cat $OUT_DIR/5_phrases.srt
|
||||
|
||||
ls -l $OUT_DIR
|
||||
|
||||
echo "########### $(date) : conversion faite "
|
||||
exit 0
|
Loading…
Reference in new issue