From 2f4045a98d2272d1192256f7ce28c2cc311f10d0 Mon Sep 17 00:00:00 2001 From: Tykayn Date: Sat, 2 Nov 2024 00:05:23 +0100 Subject: [PATCH] replace typo with space --- format_typo.py | 8 ++++++++ 1 file changed, 8 insertions(+) diff --git a/format_typo.py b/format_typo.py index 02ce0f0..ea374bc 100644 --- a/format_typo.py +++ b/format_typo.py @@ -24,6 +24,14 @@ if nb_sauts > 0: # Corriger les espaces manquants autour de certaines ponctuations contenu_corrige = re.sub(r"([.,;:!?])( )?", r"\1 ", contenu_corrige) contenu_corrige = re.sub(r"( )([.,;:!?])", r" \2", contenu_corrige) +# replace demiquatratin by full quadratin +contenu_corrige = contenu_corrige.replace('–', '—') +contenu_corrige = contenu_corrige.replace(' ?', chr(160)+"?") +contenu_corrige = contenu_corrige.replace(' !', chr(160)+"!") +contenu_corrige = contenu_corrige.replace(' »', chr(160)+"»") +contenu_corrige = contenu_corrige.replace('« ', "«"+chr(160)) +contenu_corrige = contenu_corrige.replace('y’a', "y a") + nb_espaces = len(re.findall(r"([.,;:!?])( )?", contenu)) - len(re.findall(r"([.,;:!?])( )?", contenu_corrige)) + len(re.findall(r"( )([.,;:!?])", contenu)) - len(re.findall(r"( )([.,;:!?])", contenu_corrige)) if nb_espaces > 0: print(f" Ajout d'espaces autour de certaines ponctuations : {nb_espaces} modification(s)")