13 KiB
jsHtml2Ods
Conversion d'un tableau HTML en fichier ODS disponible en téléchargement.
Le principe de cette bibliothèque est de pouvoir écrire un lien proposant une version ODS (en fait au format .fods) d'un tableau HTML existant. L'exportation est opérationnelle sans aucune modification du tableau mais l'aspect du fichier résultant peut être substantiellement amélioré en ajoutant des attributs spéciaux (data-od-*
) aux éléments du tableau et en proposant des styles suivant la syntaxe CSS.
Cette bibliothèque est testée sous Firefox ou Chromium pour des tableaux de petite taille.
Démonstration de la bibliothèque
Une démonstration est visible ici : jshtml2ods.exemole.fr/demo.html, également disponible via le site Jsfiddle pour faire des tests en direct.
Utilisation de la bibliothèque
La bibliothèque est contenue dans un seul fichier sans dépendance. La dernière version stable se trouve dans le répertoire dist/, voir aussi les versions dans la forge : forge.chapril.org/vcalame/jsHtml2Ods/releases. La dernière version est utilisable directement en ligne : https://jshtml2ods.exemole.fr/latest/html2ods.js.
L'utilisation se fait en trois étapes :
- Inclure la bibliothèque
<script type="text/javascript" src="https://jshtml2ods.exemole.fr/latest/html2ods.js"></script>
- Avoir dans le texte un lien et une table dotées d'identifiant HTML
<a href="blob:" download="table.fods" id="link" onclick="fodsLink()">Version ODS</a>
...
<table id="table">
...
</table>
- Définir la fonction fodsLink indiquée dans l'attribut onclick="fodsLink()" du lien
<script>
function fodsLink() {
let link = document.getElementById("link");
link.href = URL.createObjectURL(
Html2Ods.blob("table")
);
setTimeout(function () {
URL.revokeObjectURL(link.href);
}, 4E4); // 40s
return true;
}
</script>
Cette fonction construit un objet de type Blob associé au lien de téléchargement.
Options disponibles
La construction du blob de téléchargement se fait avec l'appel de la fonction Html2Ods.blob qui prend deux arguments : la table (instance de HtmlTableElement ou chaine de caractères indiquant l'identifiant de l'élément) et un objet d'options facultatif. Ce dernier peut avoir les propriétés suivantes :
- currency : monnaie par défaut des valeurs monétaires (peut être modifiée au niveau de la table ou de la cellule)
- datePattern : formatage par défaut des dates (peut être modifié au niveau de la table ou de la cellule) ;
YYYY-MM-DD
par défaut - textAlias : nom de l'attribut à utiliser comme alias de
data-od-text
; le nom doit être exprimée sous la forme javascript (si l'attribut à utiliser estdata-mon-texte-personnalise
, il faut indiquer monTextePersonnalise) ;text
par défaut
Attributs spéciaux des éléments HTML
L'exportation peut être configurée à l'aide d'attributs nommés data-od-*
. Ils sont tous facultatifs et sont placés au niveau des différents éléments composants le tableau.
Il est à noter que les attributs colspan
et rowspan
sont reconnus et appliqués ainsi que l'attribut span
pour les éléments <col>
ou <colgroup>
.
Élément <table>
data-od-sheetname
: nom de la feuille dans le fichier résultantdata-od-currency
: monnaie par défaut de la table (voir ci-dessous)data-od-date-pattern
: formatage des dates de la table (voir ci-dessous)data-od-fixed-rows
: nombre de lignes fixesdata-od-fixed-columns
: nombre de colonnes fixes
Note : data-od-sheetname
est obligatoire pour utiliser data-od-fixed-rows
ou data-od-fixed-columns
Éléments <col>
ou <colgroup>
data-od-style
: style de la colonnedata-od-width
: largeur de la colonne (avec l'unité, par exemple « 6cm »), prend le pas sur la largeur définie dans le style, permet de définir la largeur sans avoir à définir le style
Élément <tr>
data-od-style
: style de la ligne (en cas d'absence de valeur, un élément<tr>
a comme style Header s'il appartient à un élément<thead>
, Standard sinon)data-od-hidden
: avec la valeur 1 ou true, la ligne est cachée dans le fichier résultant, avec la valeur -1 ou false, la ligne est affichée dans le fichier résultant même si la ligne est cachée dans la version HTML
Éléments <td>
ou <th>
data-od-style
: style de la cellule (en cas d'absence de valeur, un élément<th>
a comme style Header et un élément<td>
a comme style Standard)data-od-type
: type des données de la cellule (valeurs possibles :number
,date
oucurrency
)data-od-text
: texte de la cellule (alias :data-text
), voir ci-dessousdata-od-currency
: monnaie de la cellule, n'a d'intérêt que si la cellule est de typecurrency
(voir ci-dessous)data-od-date-pattern
: formatage de la date, n'a d'intérêt que si si la cellule est de typedate
(voir ci-dessous)
Texte d'une cellule
Par défaut, le texte de la cellule dans le fichier résultant est le texte brut de l'élément <td>
ou <th>
. Il est possible d'indiquer un texte alternatif via l'attribut data-od-text
. Ce texte alternatif est souvent nécessaire dans le cas de cellule de type number
, date
ou currency
; en effet, la valeur de la cellule doit être un nombre valide ou une date au format ISO pour être traitée correctement lors de l'exporation.
Au lieu de l'attribut data-od-text
, la valeur peut être définie dans l'attribut data-text
, ce qui permet la comptabilité avec l'extension JQuery TableSorter. Si les deux attributs sont présents, data-od-text
a la préséance.
Lorsque le texte de la cellule est le texte brut de l'élément, il est possible d'ignorer un élément enfant direct de l'élément <td>
ou <th>
en lui donnant l'attribut data-od-hidden
avec la valeur 1 ou true.
Formatage des dates
Par défaut, les dates sont affichées au format ISO (année-mois-jour). Une autre format d'affichage peut être indiqué à trois endroits différents (classés par ordre de préséance) : l'attribut data-od-date-pattern
de la celulle, l'attribut data-od-date-pattern
de la table et la propriété datePattern de l'objet options passé en argument.
Ce format doit est une chaine où les lettres suivantes sont remplacées par les valeurs de la date :
- D : numéro du jour à un ou deux chiffres
- DD : numéro du jour à deux chiffres
- M : numéro du mois à un ou deux chiffres
- MM : numéro du mois à deux chiffres
- Y : année à deux chiffres
- YY : année à quatre chiffres
Par exemple, le code ISO correspond au format YYYY-MM-DD
; DD/MM/YY
affiche le trois novembre 2021 sous la forme 03/11/21).
Point important : ce formatage concerne l'affichage dans le fichier résultant mais pas la date telle qu'elle est représentée dans le tableau HTML ; dans ce dernier cas, la date doit impérativement être fournie au format ISO.
Code des monnaies
Les valeurs monétaires doivent avoir l'indication de la monnaie correspondante. Cette monnaie peut être indiquée à trois endroits différents (classés par ordre de préséance) : l'attribut data-od-currency
de la cellule, l'attribut data-od-currency
de la table, la propriété datePattern de l'objet options passé en argument.
La monnaie est indiquée par son code ISO en trois lettres : EUR, USD, etc.
Définition des styles via une syntaxe CSS
Dans le format OpenDocument, la mise en forme des éléments (colonne, ligne, cellule) sont définies par des styles attachés aux éléments. Si de nombreux noms de propriété rappellent ceux des propriétés courantes du CSS, il y a quelques différences de taille :
- Un élément possède un style et un seul
- La seule hiérachie possible est un parent pour un style
- Il n'y a évidemment aucune possibilité de définition en « cascade » via les sélecteurs CSS.
Pour définir des styles dans le fichier résultant (par exemple, mettre un fond rouge à une cellule), jsHtml2Ods propose un mécanisme de conversion d'éléments suivant la syntaxe CSS vers le format XML d'OpenDocument.
Point important : il s'agit d'une forme de détournement du CSS, aucun sélecteur CSS ne va fonctionner de manière habituelle ; l'idée est de pouvoir définir les styles de l'exportation au même endroit que le reste du HTML, c'est à dire dans les fichiers CSS chargés pa la page (ou le CSS d'éléments <style>
). L'idée, c'est qu'il n'y ait pas d'interférence avec le reste du CSS ni rejet à la validation du CSS par le navigateur.
Le principe est qu'un style va être défini par les selecteurs suivants : cell.NomDuStyle
pour une cellule, row.NomDuStyle
pour une ligne, column.NomDuStyle
. Les éléments cell
, row
et column
n'exitant pas en HTML, il n'y a pas d'interférence. NomDuStyle
correspond aux valeurs des attributs data-od-style
des éléments du tableau.
Le nombre de propriétés acceptées est limitée et dépend du type d'éléments. On consultera les exemples situés dans le répertoire demos/ pour une meilleure compréhension.
Propriétés de column
width
: largeur de la colonne (ne pas oublier l'unité)
Propriétés de row
background-color
: couleur de fond de la ligneheight
: hauteur de la ligne (ne pas oublier l'unité)
Propriétés de cell
background-color
: couleur de fond de la celluleborder
: bordure suivant la syntaxe 0.75pt solid #333 (les déclinaisons enborder-top
,border-left
, etc. sont possibles)color
: couleur du textefont-size
: taille de la policefont-style
: style de la police (italic)font-weight
: graisse de la police (bold)overflow-wrap
: passage à la ligne si la valeurs est break-word ou anywherepadding
: remplissage (les déclinaisons enpadding-top
,padding-left
, etc. sont possibles)text-align
: alignement horizontal du textevertical-align
: alignement vertical du texte
Styles prédéfinis
L'exportation propose des styles prédéfinis qui peuvent être directement utilisés dans les attributs data-od-style
d'une cellule sans besoin de les déclarer dans le CSS :
Bold
: Texte en grasBoldItalic
: Texte en gras et italiqueHeader
: Entête de colonne, appliqué par défaut aux éléments<th>
et<th>
Italic
: Texte en italiqueStandard
: Style appliqué par défaut aux éléments<td>
, sans indication particulière
Les lignes ont également comme style par défaut Header
(si la ligne fait partie d'un <thead>
) ou Standard
.
Ces styles peuvent être surchargés par le CSS. Même si le nom est le même, cell.Standard
et row.Standard
sont deux styles différents.
Parenté entre les styles
Le seul lien possible entre les styles est celui de la parenté, le style enfant héritant des propriétés du style parent. Pour indiquer cette parentée, on utilisera l'opérateur CSS +
(qui est donc détourné de sa signification habituelle en CSS) sous la forme cell.NomDuStyleEnfant + cell.NomDuStyleParent
(fonctionne aussi pour row
et column
).
Correspondance avec les classes CSS
Il est fort probable que certaines éléments du tableau disposent déjà de classes CSS pour la mise en forme de la version HTML. Pour éviter d'utiliser l'attribut data-od-styles
pour ces éléments, il est possible d'établir une correspondance entre un style et une classe CSS. Pour cela, on utilisera l'opérateur CSS ~
(qui est donc détourné de sa signification habituelle en CSS) sous la forme cell.NomDuStyle ~ .ClasseHtml
.
L'opérateur ~
doit être placé à la fin (notamment après l'indication d'une éventuelle parenté avec +
) car le style peut correspondre à plusieurs classes différentes : cell.NomDuStyle ~ .Classe1 .Classe2
.
À propos du code et de sa compilation
Le code Javascript est décomposé en plusieurs fichiers contenus dans src/js/, l'exemple dev.html du répertoire demos/ charge ces fichiers séparément.
Ces fichiers sont compilés dans un fichier unique via l'outil jake et le fichier JakeFile.js via la commande jake build[version]
. Par défaut, ce fichier nommé html2ods.js est placé dans build/ et est utilisé par l'exemple build.html du répertoire demos/.
Le répertoire dist/ contient la dernière compilation avec numéro de version.
En mode développement, les fichiers de src/js/currency, src/js/xmlwriter et src/js/opendocument sont des bibliothèques séparées avec leur propre « espace de nom ». À la compilation, ils sont placés dans Html2Ods
pour n'avoir qu'un seul « espace de nom », c'est pourquoi il ne faut pas supprimer la ligne //compile target
dans le fichier src/js/Html2Ods.js