Fichier XSLT #40
Labels
No Milestone
No project
No Assignees
3 Participants
Notifications
Due Date
No due date set.
Dependencies
No dependencies set.
Reference: ciri/stage_2023#40
Loading…
Reference in New Issue
Block a user
No description provided.
Delete Branch "%!s()"
Deleting a branch is permanent. Although the deleted branch may continue to exist for a short time before it actually gets removed, it CANNOT be undone in most cases. Continue?
J'ai suivi le tutoriel XSLT et pour l'instant, j'arrive à ce résultat avec le xml joint :
Difficulté : Toutes les lignes s'affichent dans la même colonne. Comment les séparer par langue ?
Je vous avais promis un fichier XSLT qui fonctionne. Le voici :
https://mac4translators.blogspot.com/2023/04/convertir-un-fichier-tmx-en-tbx-avec.html
Avec ça, vous avez de la lecture pour la matinée. N’hésitez pas à me faire des retours.
J’ai mis à peu près 10 heures pour écrire la transformation, la tester et bien sûr écrire les explications et les mettre en ligne. Donc, prenez soin du document.
Et en cherchant un peu (après avoir demandé de l'aide sur Mastodon) je trouve ça :
https://www.irif.fr/~carton/Enseignement/XML/Cours/index.html
Ce mail est intéressant pour son commentaire sur les attributs :
http://lists.xml.org/archives/xml-dev/202304/msg00018.html
La logique de votre transformation ne choisi qu'une seule valeur par rangée.
J'arrive à créer le tableau séparer par langue en faisant la sélection en deux étapes:
Voici un court extrait du HTML brut que j'obtiens:
J'ai aussi modifié la sortie légèrement pour inclure le DOCTYPE pour html5 au début du document, et pour inclure explicitement la balise
<tbody>
qui, d'après ce que je peux voir n'est pas absolument requise, mais qu'il est quand même préférable d'utiliser.Prochaine étape (pour moi) admirer le fichier XSLT pour la transformation TMX à TBX.
@kazephil Tu as lu l'article que j'ai publié hier ?
https://mac4translators.blogspot.com/2023/04/convertir-un-fichier-tmx-en-tbx-avec.html
@brandelune Jʼy ai jeté un coup dʼœil rapide hier, mais je nʼai pas encore eu le temps dʼen faire une lecture approfondie. (Il faut aussi que je regarde le format TBX de plus près, parce que je ne le connais pas très bien.)
On a juste pris un échantillon trouvé sur le web. Je vois que Thomas est en train de travailler sur la prise en charge de TBX 3.0.
@brandelune J'ai lu ton article. Très intéressant. J'allais faire un retour directement sur ton blogue, mais je n'ai pas trouvé de section de commentaires, alors je fais ça ici.
Quelques commentaires :
J'ai trouvé les explications très claires et faciles à suivre.
La partie sur les modèles m'a même aidé à cerner une notion que je ne saisissais que vaguement auparavant. Merci !
Peut-être plus une question pour Thomas, mais après un peu de recherche supplémentaire sur le format TBX, je crois comprendre que l'on devrait préférer le schéma RelaxNG plutôt que le DOCTYPE en DTD. Dans le cas du TBX, ça facilite apparemment la validation parce que ça évite d'avoir à la faire en deux étapes.
Seul petit bémol pour moi :
Côté présentation, je trouve que ça fait trop de commentaires dans le code même. Personnellement, j'aime mieux voir la plus grande partie du code ensemble pour pouvoir en suivre le cheminement plus facilement. Je trouve ça plus facile de lire tout ça si les commentaires dans le milieu du code se limite à une ou deux lignes, tout au plus.
Le fait que l'explication de chaque bloc de code se situe sous le bloc, mais sans entrée en matière avant ledit bloc, n'aide pas non plus.
Je pense qu'il est préférable de mettre les commentaires les plus pertinents en tête du fichier, avant le code, et de mettre le reste des explications dans un fichier Markdown, HTML, ou autre avec des blocs de codes identifiées par une entête.
J'ai mis un exemple (simple) de ce que je veux dire dans un nouveau répertoire de ce dépôt.
@ciri Pour revenir à la transformation du fichier TMX en tableau html, j'ai aussi réussi à obtenir le résulta voulu en utilisant les modèles XSLT décrits dans l'article de Jean-Christophe au lieu des instructions
<xsl:for-each>
.Je vous donne encore un peu de temps pour trouver vous-même la solution, et je mettrai mes fichiers dans une répertoire approprié une fois que Jean-Christophe me donnera le feu vert.
Merci pour tes commentaires.
Le but du travail sur ce fil n'est pas de créer un fichier html. C'est juste le code qui tait utilisé dans le tutoriel, donc ne t'embête pas. À moins que tu penses que ça aie une utilité réelle, par ex. pour relire/éditer une TMX. Mais dans ce cas ça serait plus intéressant d'avoir la TMX convertie en fichier de type ODF non zippé (flat ODF)
https://speakerdeck.com/fridrich/flat-odf-the-under-estimated-flavour-of-open-document?slide=19
pour la corriger et la reconvertir en TMX après.
Rien d'embêtant. Ce n'est qu'une question de les télécharger, s'il y a de l'intérêt.
En terme d'utilité réelle, deux éléments me viennent en tête :
Tiens, je n'avais pas pensé au
.fods
.Je suis en train d'essayer de contribuer à améliorer et généraliser un filtre d'importation et exportation de TMX dans LibreOffice Calc.
Je vais envoyer un lien vers la nouvelle version une fois que je j'aurai créé un dépôt pour mettre tout ça en ligne en collaboration avec l'auteur original (avec qui j'avais commencé à collaborer un peu avant que l'on devienne occupés de part et d'autre).
L'ajout d'une version « flat », voire même de versions en tableau
.odt
ou.fodt
pour Writer pourrait être intéressant !Merci pour la suggestion.
TMX dans LibreOffice, c'est un truc que j'ai essayé de faire depuis des années :-)
Et quand j'ai repris mes tentatives, je suis tombé sur un bug:
https://bugs.documentfoundation.org/show_bug.cgi?id=122206
Je te suggère
fods
parce que j'avais réussi un truc similaire en export vers du Word flat par le passé, mais autant travailler avec un format encore plus libre.J'ai une version qui semble fonctionner correctement ici pour le code, et un paquet JAR dans le sous-répertoire paquet.
(J'ai aussi mis la conversion TMX en TBX dans le même dépôt. Pas de modification intéressante pour le moment, mais si j'en fait, je te ferai signe.
Effectivement, le glisser-déplacer et le double-clic donne une erreur. L'ouverture depuis la boîte de dialoge Ouvrir fonctionne si (et seulement si) je choisi le filtre approprié avant d'ouvrir le fichier. ça marche aussi pour les fichiers récents présentés dans l'écran de démarrage de LibreOffice.
Ironiquement, je suis tombé sur le même bogue avec un fichier .fodp récemment. Toutefois, ça semble fonctionner correctement avec les fichiers
.fods
.Ça va faire un exercice intéressant. On va voir ce que ça va donner.