diff --git a/format_typo.py b/format_typo.py index 02ce0f0..ea374bc 100644 --- a/format_typo.py +++ b/format_typo.py @@ -24,6 +24,14 @@ if nb_sauts > 0: # Corriger les espaces manquants autour de certaines ponctuations contenu_corrige = re.sub(r"([.,;:!?])( )?", r"\1 ", contenu_corrige) contenu_corrige = re.sub(r"( )([.,;:!?])", r" \2", contenu_corrige) +# replace demiquatratin by full quadratin +contenu_corrige = contenu_corrige.replace('–', '—') +contenu_corrige = contenu_corrige.replace(' ?', chr(160)+"?") +contenu_corrige = contenu_corrige.replace(' !', chr(160)+"!") +contenu_corrige = contenu_corrige.replace(' »', chr(160)+"»") +contenu_corrige = contenu_corrige.replace('« ', "«"+chr(160)) +contenu_corrige = contenu_corrige.replace('y’a', "y a") + nb_espaces = len(re.findall(r"([.,;:!?])( )?", contenu)) - len(re.findall(r"([.,;:!?])( )?", contenu_corrige)) + len(re.findall(r"( )([.,;:!?])", contenu)) - len(re.findall(r"( )([.,;:!?])", contenu_corrige)) if nb_espaces > 0: print(f" Ajout d'espaces autour de certaines ponctuations : {nb_espaces} modification(s)")