8 changed files with 50 additions and 39 deletions
@ -1,6 +1,7 @@
|
||||
/models/fr/* |
||||
!/input/demo.wav |
||||
/input/converted_to_wav/*.wav |
||||
/output/*.txt |
||||
/output/*.csv |
||||
/output/*.srt |
||||
/output/**/*.txt |
||||
/output/**/*.csv |
||||
/output/**/*.json |
||||
/output/**/*.srt |
||||
|
@ -1,29 +0,0 @@
|
||||
#!/bin/bash |
||||
# utilisation: bash convert_from_wav.sh MONFICHIER.wav |
||||
# auteur du script: tykayn contact@cipherbliss.com |
||||
|
||||
echo "########### $(date) : conversion de fichier audio .WAV mono piste uniquement, |
||||
avec Vosk installé par pip3, et un modèle de textes en français." |
||||
echo " " |
||||
echo "########### $(date) : fichier : $file" |
||||
echo " " |
||||
python3 ./conversion_simple_fr.py "$file" > output/converted_output.txt |
||||
|
||||
echo " " |
||||
echo "########### $(date) : nettoyer la sortie " |
||||
jq .text output/converted_output.txt > output/converted_cleaned_with_null.txt |
||||
|
||||
sed 's/null//g' output/converted_cleaned_with_null.txt > output/converted_out_without_nulls.txt |
||||
sed 's/^ *//; s/ *$//; /^$/d' output/converted_out_without_nulls.txt > output/converted_out_without_nulls2.txt |
||||
sed 's/\"//g' output/converted_out_without_nulls2.txt > output/converted_out_without_nulls3.txt |
||||
echo "########### $(date) : OK " |
||||
echo " " |
||||
COUNT_LINES=$(cat output/converted_out_without_nulls3.txt |wc -l) |
||||
cat output/converted_out_without_nulls.txt |
||||
echo " " |
||||
echo "########### $(date) : lignes transcriptes $COUNT_LINES " |
||||
echo "########### $(date) : conversion faite dans output/converted_out_without_nulls.txt" |
||||
echo "########### $(date) : conversion de la sortie en fichier de sous titres" |
||||
perl clean.sh output/converted_output.txt > output/output.srt |
||||
|
||||
exit 0 |
@ -0,0 +1,38 @@
|
||||
#!/bin/bash |
||||
# utilisation: bash transcript.sh MONFICHIER.wav |
||||
# auteur du script: tykayn contact@cipherbliss.com |
||||
|
||||
echo "########### $(date) : conversion de fichier audio .WAV mono piste uniquement, |
||||
avec Vosk installé par pip3, et un modèle de textes en français." |
||||
echo " " |
||||
echo "########### $(date) : fichier : $file" |
||||
echo " " |
||||
FILE_NAME=$(basename $file .wav) |
||||
OUT_DIR=$( echo "output/$FILE_NAME") |
||||
mkdir output/$FILE_NAME |
||||
|
||||
python3 ./conversion_simple_fr.py "$file" > $OUT_DIR/0_output.json |
||||
|
||||
|
||||
echo " " |
||||
echo "########### $(date) : nettoyer la sortie " |
||||
jq .text $OUT_DIR/0_output.json > $OUT_DIR/1_converted.txt |
||||
|
||||
sed 's/null//g' $OUT_DIR/1_converted.txt > $OUT_DIR/2_without_nulls.txt |
||||
sed 's/^ *//; s/ *$//; /^$/d' $OUT_DIR/2_without_nulls.txt > $OUT_DIR/3_without_nulls.txt |
||||
sed 's/\"//g' $OUT_DIR/3_without_nulls.txt > $OUT_DIR/4_phrases.txt |
||||
echo "########### $(date) : OK " |
||||
echo " " |
||||
COUNT_LINES=$(cat $OUT_DIR/phrases.txt |wc -l) |
||||
cat $OUT_DIR/4_phrases.txt |
||||
echo " " |
||||
echo "########### $(date) : lignes transcriptes $COUNT_LINES " |
||||
echo "########### $(date) : conversion faite dans output/converted_out_without_nulls.txt" |
||||
echo "########### $(date) : conversion de la sortie en fichier de sous titres" |
||||
perl clean.sh $OUT_DIR/0_output.json > $OUT_DIR/5_phrases.srt |
||||
cat $OUT_DIR/5_phrases.srt |
||||
|
||||
ls -l $OUT_DIR |
||||
|
||||
echo "########### $(date) : conversion faite " |
||||
exit 0 |
Loading…
Reference in new issue