diff --git a/article_jres_olivier_amoi.fodt b/article_jres_olivier_amoi.fodt index 8663baf..3828ffc 100644 --- a/article_jres_olivier_amoi.fodt +++ b/article_jres_olivier_amoi.fodt @@ -1,10 +1,10 @@ - 2021-02-15T09:17:10.478673722PT1H2M12LibreOffice/7.0.4.2$Linux_X86_64 LibreOffice_project/00$Build-2Modèle et mini-guideModèle Jres 20212022-01-05T10:49:01.395703140Olivier Langella + 2021-02-15T09:17:10.478673722PT1H6M50S16LibreOffice/7.0.4.2$Linux_X86_64 LibreOffice_project/00$Build-2Modèle et mini-guideModèle Jres 20212022-01-06T11:15:48.863302243Olivier Langella - 91428 + 34735 0 36826 14619 @@ -13,12 +13,12 @@ view2 - 9913 - 100954 + 21809 + 47311 0 - 91428 + 34735 36825 - 106045 + 49352 0 0 false @@ -94,7 +94,7 @@ true - 7801196 + 7827676 true false @@ -160,7 +160,7 @@ - + @@ -1163,153 +1163,189 @@ - + + + + + + + + + + + + + - + - + - + - + - + - + - + - + - + - + - + - + - + - + + + + + + + - + - + - + - + - + - + + + + + + + + + + + + + - + - + + + + + + + + + + + + + - - - - + - - + + - + + + + - - - - + - + - + - + - + - + + + + - + - + + + + + + + - + + + + - + - + - - + + - - + + - - - - - - - - - - - - - - - - - + + @@ -1375,217 +1411,171 @@ - + - + - + - + - + - + - + - + - + - + - + - + - + - + - + - + - + - + - + - + - + - + - + - + - + - + - + - + - + - + - + - + - + - + - + - + - + - + - + - + - + - + - + - + - + - + - + - + - + - + + + + + + + - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - @@ -1637,7 +1627,7 @@ - + @@ -1710,7 +1700,7 @@ - + Olivier Langella @@ -1718,15 +1708,7 @@ - - - - Olivier Langella - 2022-01-04T15:55:28 - - - - + Olivier Langella @@ -1734,7 +1716,7 @@ - + Olivier Langella @@ -1742,7 +1724,7 @@ - + Olivier Langella @@ -1750,7 +1732,7 @@ - + Olivier Langella @@ -1758,7 +1740,7 @@ - + Olivier Langella @@ -1766,7 +1748,7 @@ - + Olivier Langella @@ -1774,7 +1756,7 @@ - + Olivier Langella @@ -1782,7 +1764,7 @@ - + Olivier Langella @@ -1790,175 +1772,7 @@ - - - - Olivier Langella - 2022-01-04T16:02:29 - - - - - - - Olivier Langella - 2022-01-04T16:19:17 - - - - - - - Olivier Langella - 2022-01-04T16:18:53 - - - - - - - Olivier Langella - 2022-01-04T16:19:18 - - - - - - - Olivier Langella - 2022-01-04T16:20:00 - - - - - - - Olivier Langella - 2022-01-04T16:25:02 - - - - - - - Olivier Langella - 2022-01-04T16:26:08 - - - - - - - Olivier Langella - 2022-01-04T16:27:36 - - - - - - - Olivier Langella - 2022-01-04T16:28:00 - - - - - - - Olivier Langella - 2022-01-04T16:29:08 - - - - - - - Olivier Langella - 2022-01-04T16:31:27 - - - - - - - Olivier Langella - 2022-01-04T16:32:07 - - - - - - - Olivier Langella - 2022-01-04T16:33:23 - - - - - - - Olivier Langella - 2022-01-04T16:34:00 - - - - - - - Olivier Langella - 2022-01-04T16:36:37 - - - - - - - Olivier Langella - 2022-01-04T16:37:22 - - - - - - - Olivier Langella - 2022-01-04T16:40:35 - - - - - - - Olivier Langella - 2022-01-04T16:41:03 - - - - - - - Olivier Langella - 2022-01-04T16:42:25 - - - - - - - Olivier Langella - 2022-01-04T16:43:00 - - - - - - - Olivier Langella - 2022-01-04T16:45:02 - - - - + Olivier Langella @@ -1966,7 +1780,7 @@ - + Olivier Langella @@ -1974,7 +1788,7 @@ - + Olivier Langella @@ -1982,7 +1796,7 @@ - + Olivier Langella @@ -1990,7 +1804,7 @@ - + Olivier Langella @@ -1998,7 +1812,7 @@ - + Olivier Langella @@ -2006,7 +1820,7 @@ - + Olivier Langella @@ -2014,7 +1828,7 @@ - + Olivier Langella @@ -2022,7 +1836,7 @@ - + Olivier Langella @@ -2030,7 +1844,7 @@ - + Olivier Langella @@ -2038,7 +1852,7 @@ - + Olivier Langella @@ -2046,7 +1860,7 @@ - + Olivier Langella @@ -2054,7 +1868,7 @@ - + Olivier Langella @@ -2062,7 +1876,7 @@ - + Olivier Langella @@ -2070,7 +1884,7 @@ - + Olivier Langella @@ -2078,7 +1892,7 @@ - + Olivier Langella @@ -2086,7 +1900,7 @@ - + Olivier Langella @@ -2094,7 +1908,7 @@ - + Olivier Langella @@ -2102,7 +1916,7 @@ - + Olivier Langella @@ -2110,7 +1924,7 @@ - + Olivier Langella @@ -2118,7 +1932,7 @@ - + Olivier Langella @@ -2126,7 +1940,7 @@ - + Olivier Langella @@ -2134,7 +1948,7 @@ - + Olivier Langella @@ -2142,7 +1956,7 @@ - + Olivier Langella @@ -2150,7 +1964,7 @@ - + Olivier Langella @@ -2158,7 +1972,7 @@ - + Olivier Langella @@ -2166,7 +1980,7 @@ - + Olivier Langella @@ -2174,7 +1988,7 @@ - + Olivier Langella @@ -2182,7 +1996,7 @@ - + Olivier Langella @@ -2190,7 +2004,7 @@ - + Olivier Langella @@ -2198,7 +2012,7 @@ - + Olivier Langella @@ -2206,7 +2020,7 @@ - + Olivier Langella @@ -2214,7 +2028,7 @@ - + Olivier Langella @@ -2222,7 +2036,7 @@ - + Olivier Langella @@ -2230,7 +2044,7 @@ - + Olivier Langella @@ -2238,7 +2052,7 @@ - + Olivier Langella @@ -2246,7 +2060,7 @@ - + Olivier Langella @@ -2254,7 +2068,7 @@ - + Olivier Langella @@ -2262,7 +2076,7 @@ - + Olivier Langella @@ -2270,7 +2084,7 @@ - + Olivier Langella @@ -2278,7 +2092,7 @@ - + Olivier Langella @@ -2286,7 +2100,7 @@ - + Olivier Langella @@ -2302,68 +2116,81 @@ - Modèle de l’article JRES - Prénom Nom de l’auteur 1 - Laboratoire ou service - 38 rue de l’adresse - 13 013 Marseille - Prénom Nom de l’auteur 2 - Laboratoire ou service - 11 avenue du comité - 67 000 Strasbourg + Modèle de l’article JRES + Edlira Nano + Laboratoire ou service + 38 rue de l’adresse + 13 013 Marseille + Olivier Langella + Plateforme PAPPSO + Laboratoire GQE-Le Moulon + Ferme du Moulon + 91190 Gif-sur-Yvette + France + olivier.langella@universite-paris-saclay.fr + + Filippo Rusconi + Plateforme PAPPSO + Laboratoire GQE-Le Moulon + Ferme du Moulon + 91190 Gif-sur-Yvette + France + filippo.rusconi@universite-paris-saclay.fr Résumé - Ce document résume les instructions aux auteurs de la conférence JRES. - Le Logiciel libre et la recherche publique partagent un objectif : le bien commun, au service de tous. Cette présentation revient sur ce que sont le bien commun et la science ouverte pour essayer de les analyser à l'aide de l'exemple de la plateforme scientifique Analyses protéomiques de Paris Sud-Ouest(PAPPSO).PAPPSO s'est dotée d'une infrastructure informatique complète basée exclusivement sur du Logiciel libre : réseau, serveurs, stockage, calcul et postes personnels. Elle développe plusieurs logiciels sous licence libre, dont ceux qui forment la chaîne de traitement des données de spectrométrie de masse. Ce choix naturel facilite la reproductibilité des traitements, apporte la maîtrise des logiciels et permet l'intégration de code source tiers.L'apport majeur du Logiciel libre à la recherche publique permet l'utilisation des réseaux et systèmes informatiques. Scientifiquement, l'ouverture du code source et la liberté d'utilisation des logiciels garantissent l'échange des données, leur réutilisation et leur vérification par les pairs. Cet ensemble forme un bien commun protégé par des licences. De nombreux laboratoires y contribuent en utilisant ou en produisant des logiciels libres, comme en témoigne en partie la forge du code source du secteur public (https://code.etalab.gouv.fr).Comment contribuer efficacement ? Quelles sont les recommandations et obligations pour les établissements publics ? Quelle licence choisir ? Comment une licence copyleft peut-elle aussi séduire les partenaires privés ? Nous apporterons des réponses et des éléments de réflexion pour corriger quelques fausses croyances et promouvoir la construction collective d'une culture libre, au service du bien commun.Le résumé doit faire de quinze à vingt lignes. Comme le reste du document, il utilise la feuille de style Jres ; ici, définition de style « Résumé » : écriture en italique, police avec empattement en taille 12 points. Le titre utilisant le style « Titre résumé » (ainsi que le titre « Mots-clefs » ci-dessous) sont en 14 points, gras, sans empattement. + Ce document résume les instructions aux auteurs de la conférence JRES. + Le Logiciel libre et la recherche publique partagent un objectif : le bien commun, au service de tous. Cette présentation revient sur ce que sont le bien commun et la science ouverte pour essayer de les analyser à l'aide de l'exemple de la plateforme scientifique Analyses protéomiques de Paris Sud-Ouest(PAPPSO). + PAPPSO s'est dotée d'une infrastructure informatique complète basée exclusivement sur du Logiciel libre : réseau, serveurs, stockage, calcul et postes personnels. Elle développe plusieurs logiciels sous licence libre, dont ceux qui forment la chaîne de traitement des données de spectrométrie de masse. Ce choix naturel facilite la reproductibilité des traitements, apporte la maîtrise des logiciels et permet l'intégration de code source tiers. + L'apport majeur du Logiciel libre à la recherche publique permet l'utilisation des réseaux et systèmes informatiques. Scientifiquement, l'ouverture du code source et la liberté d'utilisation des logiciels garantissent l'échange des données, leur réutilisation et leur vérification par les pairs. Cet ensemble forme un bien commun protégé par des licences. De nombreux laboratoires y contribuent en utilisant ou en produisant des logiciels libres, comme en témoigne en partie la forge du code source du secteur public (https://code.etalab.gouv.fr). + Comment contribuer efficacement ? Quelles sont les recommandations et obligations pour les établissements publics ? Quelle licence choisir ? Comment une licence copyleft peut-elle aussi séduire les partenaires privés ? Nous apporterons des réponses et des éléments de réflexion pour corriger quelques fausses croyances et promouvoir la construction collective d'une culture libre, au service du bien commun.Le résumé doit faire de quinze à vingt lignes. Comme le reste du document, il utilise la feuille de style Jres ; ici, définition de style « Résumé » : écriture en italique, police avec empattement en taille 12 points. Le titre utilisant le style « Titre résumé » (ainsi que le titre « Mots-clefs » ci-dessous) sont en 14 points, gras, sans empattement. Mots-clefs - logiciel libre, IPV6, PKI, CMS, Calmarlicences, protéomique - IntroductionPlateforme d’analyses protéomiques - La protéomique est l’étude de l’ensemble des protéines produites par une cellule, un organe ou un organisme dans des conditions particulières ou en réponse à un traitement. Elle permet de répondre à de nombreuses questions biologiques, Conformément au document « Instructions aux auteurs », le format natif de LibreOffice (.odt) sera utilisé durant toute la phase de relecture avec le comité de programme. - Le présent fichier tient lieu de modèle pour les articles destinés aux JRES, rédigés avec LibreOffice. Il contient également quelques instructions sur le cycle de vie de ce document et des conseils de mise en page.de comprendre la physiologie ou différentes pathologie dans de nombreuses espèces ou groupes d’espèces (métaprotéomique). On peut connaître les protéines impliquées dans un processus biologique, ainsi que leur quantité et en déduire les caractéristiques de certains génomes ou lignées, comprendre la réponse physiologique liée à un stress par exemple. - Depuis 1997, date d’apparition du terme « protéomique », les techniques utilisées n’ont cessée d’évoluer. Dans une expérience de protéomique, les échantillons biologiques sont préparés, les protéines extraites, séparées par chromatographie, et analysées par spectrométrie de masse. - Les analyses en spectrométrie de masse produisent de grande quantité des données, dans des formats propriétaires. Ces données sont elles mêmes traitées le plus souvent par d’autres logiciels propriétaires. Ces formats ne sont pas pérennes dans le temps. Les licences sont coûteuses, l’interopérabilité entre logiciels est très limitée. - Depuis 2005, La plateforme scientifique Analyses protéomiques de Paris Sud-Ouest (PAPPSO) a fait le choix du logiciel libre pour garantir la pérennité de ses chaînes de traitement, la reproductibilité des expériences et capitalisation de son savoir faire. - Il est recommandé d’utiliser la dernière version stable de Libre Office (au moment de la rédaction, v7.0.4). - Le document sera finalement transformé en format « Portable Document Format » (.pdf) pour la phase finale de publication. - Taille des articlesTransition du logiciel propriétaire au logiciel libre - L’article doit faire entre 5 et 10 pages.Le passage progressif aux logiciels libres a permis une rationalisation de l’utilisation des ressources informatiques. Nous sommes passés de postes dédiés, à licences uniques, usage unique pour un traitement particulier à une infrastructure collective combinant stockage, calcul et enchaînement des traitements depuis n’importe quel poste de travail. - Durant la période 2005 – 2015, notre travail a été facilité par la définition de formats standards en protéomique, l’émergence de nombreux logiciels libres dans le domaine (cf http://dx.doi.org/10.2174/1389203722666210118160946) et le développement en interne de nouvelles solutions (PROTICdb, MassChroQ, X!TandemPipeline, mineXpert2). - Système - Le choix de PAPPSO s’est porté d’abord sur Ubuntu puis sur Debian. Grâce au travail du groupe « Debichem » de nombreux logiciels nécessaires aux analyses de protéomique sont déjà disponibles. La distribution Debian offre un socle commun côté serveur et bureautique côté client. La plateforme diffuse ses propres logiciels sous forme de paquets Debian dans un dépôt accessible publiquement. Cela permet le déploiement complet sur les serveurs et les postes de travail de l’équipe. - Stockage - Les besoins en stockage de la plateforme évoluent constamment en fonction des progrès techniques. La fréquence d’acquisition et la résolution des spectromètres de masse permettent à chaque génération de grandes avancées pour augmenter le nombre de protéines identifiées et quantifiées dans des échantillons de plus en plus complexes. - Le système de stockage doit permettre une adaptation en continue de la volumétrie disponible ainsi que des performances en lecture/écriture. Les solutions classiques de type NAS ont été écartées pour éviter la dépendance matérielle et les problèmes liés aux renouvellement des équipements. - Depuis 2011, nous utilisons le stockage distribué basé sur ceph. Il apporte une grande flexibilité et une adaptation rapide aux besoins en utilisant des serveurs standards. - Calcul - La plateforme PAPPSO est spécialisée dans les traitements en protéomique haut débit (nombreux échantillons). Pour assurer la disponibilité de nos moyens de calculs à l’ensemble des utilisateurs, nous utilisons le gestionnaire de processus HTCondor. - Les besoins en calcul évoluent eux aussi en fonction des instruments utilisés. Avec l’évolution des techniques, de nouvelles possibilités sont apparues dans le traitement de données en protéomique exigeant elles aussi des capacités de calculs supplémentaires. Les machines dédiées au calcul doivent être ainsi renouvelées régulièrement et intégrées au fur et à mesure (comme pour le stockage). - Evolution sur 10 ans - Matériel - L’intégration de nouvelles machines de calcul ou de stockage s’est faite de manière transparente. Nous sommes passés d’une capacité de stockage initiale de 18To (3 serveurs R515, disques de 3To) en 2011 à une capacité de 917To (8 serveurs hétérogènes). Le réseau est passé du 1Gb cuivre au 10Gb SFP+. Il n’y a pas eu de transfert de données/migration, pas de modification de l’architecture logique pour les utilisateurs. Le système de fichier cephfs permet un accès direct aux données depuis chaque nœud de calcul, les performances ont suivies les évolutions matérielles (augmentation du débit, augmentation des capacités de calcul). La résistance aux pannes a été mise à rude épreuve (panne électrique, disques ou erreurs humaines) et nous n’avons pas eu de perte de données. - Logiciel - Les systèmes côté serveurs et utilisateurs ont été migrés en 2013 de Ubuntu vers Debian. Nous y avons gagné en stabilité et en simplicité lors des mises à jour de version. Le stockage centralisé est disponible pour tous les postes dans une arborescence commune, montage automatique sur les nœud de calculs (cephfs via systemd sur les serveurs, sshfs sur les postes clients). Les logiciels sont les mêmes sur les serveurs et les postes utilisateurs. L’accès distant au cluster de calcul se fait avec x2go via clé publique ssh. - Scientifique - Les analyses de la plateforme ont évolué pour passer de la technique des gels électrophorèses 2D vers les analyses shotgun en spectrométrie de masse. Le traitement d’images 2D était majoritairement effectué avec des logiciels propriétaires sous Windows. Des postes dédiés nécessaires, ce qui limitait les capacités de traitement. Lors du passage vers les analyses shotgun, les logiciels propriétaires ont pu être avantageusement remplacés par des logiciels libres (identification des protéines avec X!Tandem). En 2008, les capacités des instruments étaient suffisantes pour pouvoir quantifier les protéines directement en spectrométrie de masse, mais les logiciels n’étaient pas adaptés. Nous avons pu développer notre propre logiciel de quantification basé sur les idées originales des scientifiques de la plateforme. : MassChroQ. L’indépendance vis à vis des formats et des fabricants nous a permis de produire un logiciel évolutif et pérenne dès le départ, évitant l’effet « boite noire ». Ainsi, nos outils ont pu être adaptés au fur et à mesure aux nouvelles techniques et instruments, absorbant les « chocs » technologiques : doublement des fréquences d’acquisition à chaque génération (3 ans), doublement des capacités de résolution (précision de mesure des masses). - La dernière « rupture technologique » est l’apparition du timTOF pro du fabricant « Bruker ». Cet appareil dispose d’une fréquence d’acquisition 10 fois plus grande que la génération précédente, ainsi que d’une nouvelle dimension de séparation des peptides (mobilité ionique). Fait unique depuis les débuts de la protéomique, Bruker a publié les spécifications techniques de son instrument. Cela nous a permis d’adapter MassChroQ pour pouvoir utiliser directement les données du constructeur, sans conversion. Nous obtenons ainsi des gains de performances remarquables par rapport aux logiciels commerciaux, ainsi que de meilleures quantifications. - - Bilan - Le passage aux logiciels libres pour la plateforme PAPPSO a permis une maîtrise totale de ses outils, de la production des données brutes à l’interprétation biologique. Les sommes importantes économisées en licences de logiciels propriétaires (20k€ par an) ont été transférées dans la maintenance de ses ressources de calcul et de stockage. Le savoir faire développé par PAPPSO dans l’analyse protéomique haut débit est reconnu au niveau international (129 articles citant MassChroQ depuis 2011, publication d’un article de référence en métaprotéomique « nature communication » en 2021). Toutes les analyses sont complètement vérifiables et reproductibles, les logiciels étant tous disponibles librement sous licence GPLv3. - - - Présentation générale - Le style fourni et utilisé dans ce document est dérivé de celui de base de LibreOffice. - Les quelques modifications sont regroupées dans la hiérarchie de styles « → Jres », sous le style de paragraphe par défaut. Autant que possible, l’auteur doit s’y conformer. Les fontes utilisées sont celles fournies par LibreOffice et ainsi disponibles en standard sur chaque plate-forme (Windows, Mac, Linux & BSD). - Utiliser les styles définis - Chaque élément qui compose le document doit être lié à un style bien précis : les titres, les figures, les bibliographies… - Pour appliquer le style (taille et police) qui correspond, il suffit de se positionner sur la ligne ou bien de sélectionner la chaîne de caractères et dans le bandeau en haut en gauche du menu de sélectionner le style correspondant. Ainsi, le style lui sera automatiquement appliqué. Il est important de respecter le style fourni ; non seulement l’homogénéité des numérotations des titres, sous-titres, figures est respectée, mais cela garantit aussi que votre article soit homogène avec le reste de la conférence. - Le document ne devrait quasiment pas faire usage de formatage direct. L’option « Effacer le formatage direct » permet de s’assurer que les styles définis sont bien appliqués sans modifications. + logiciel libre, IPV6, PKI, CMS, Calmarlicences, protéomique + IntroductionPlateforme d’analyses protéomiques + La protéomique est l’étude de l’ensemble des protéines produites par une cellule, un organe ou un organisme dans des conditions particulières ou en réponse à un traitement. Elle permet de répondre à de nombreuses questions biologiques, de comprendre la physiologie ou différentes pathologies dans des espèces distinctes ou dans des groupes d’espèces (métaprotéomique). On peut connaître les protéines impliquées dans un processus biologique, ainsi que leur quantité et en déduire les caractéristiques de certains génomes ou lignées, ou encore comprendre la réponse physiologique liée à un stress, par exemple. + Depuis 1997, date d’apparition du terme « protéomique », les techniques utilisées n’ont cessé d’évoluer. Il s'agit néanmoins toujours de mesurer la masse moléculaire des molécules qui pénètrent dans l'instrument: un spectromètre de masse. Dans une expérience de protéomique, les échantillons biologiques sont préparés, les protéines extraites, séparées par chromatographie et analysées par spectrométrie de masse. + Les analyses par spectrométrie de masse produisent de grandes quantités de données, directement en sortie de l'instrument. Chaque fabricant a son propre format de données, qui est le plus souvent propriétaire. Ordinairement, les données aux formats propriétaires sont traitées par les logiciels fournis avec l'instrument, eux aussi propriétaires. Comme souvent dans le domaine des formats de fichiers, ces formats ne sont pas pérennes et les licences d'utilisation des logiciels propriétaires sont très coûteuses. Il y a donc ici un problème majeur d'interopérabilité. + Depuis 2005, la plateforme scientifique "Analyses protéomiques de Paris Sud-Ouest" (PAPPSO) a fait le choix du logiciel libre pour garantir la pérennité de ses chaînes de traitement, la reproductibilité des expériences et la capitalisation de son savoir faire. + Il est recommandé d’utiliser la dernière version stable de Libre Office (au moment de la rédaction, v7.0.4). + Le document sera finalement transformé en format « Portable Document Format » (.pdf) pour la phase finale de publication. + Taille des articlesTransition du logiciel propriétaire au logiciel libre + L’article doit faire entre 5 et 10 pages.Le passage progressif aux logiciels libres a permis une rationalisation de l’utilisation des ressources informatiques. Nous sommes passés de postes dédiés, à licences uniques, usage unique pour un traitement particulier à une infrastructure collective combinant stockage, calcul et enchaînement des traitements depuis n’importe quel poste de travail. + Durant la période 2005 – 2015, notre travail a été facilité par la définition de formats standards en protéomique, l’émergence de nombreux logiciels libres dans le domaine (cf http://dx.doi.org/10.2174/1389203722666210118160946) et le développement en interne de nouvelles solutions (PROTICdb, MassChroQ, X!TandemPipeline, mineXpert2). + Système + Le choix de PAPPSO s’est porté d’abord sur Ubuntu puis sur Debian. Grâce au travail du groupe « Debichem » de nombreux logiciels nécessaires aux analyses de protéomique sont déjà disponibles. La distribution Debian offre un socle commun côté serveur et bureautique côté client. La plateforme diffuse ses propres logiciels sous forme de paquets Debian dans un dépôt accessible publiquement. Cela permet le déploiement complet sur les serveurs et les postes de travail de l’équipe. + Stockage + Les besoins en stockage de la plateforme évoluent constamment en fonction des progrès techniques. La fréquence d’acquisition et la résolution des spectromètres de masse permettent à chaque génération de grandes avancées pour augmenter le nombre de protéines identifiées et quantifiées dans des échantillons de plus en plus complexes. + Le système de stockage doit permettre une adaptation en continue de la volumétrie disponible ainsi que des performances en lecture/écriture. Les solutions classiques de type NAS ont été écartées pour éviter la dépendance matérielle et les problèmes liés aux renouvellement des équipements. + Depuis 2011, nous utilisons le stockage distribué basé sur ceph. Il apporte une grande flexibilité et une adaptation rapide aux besoins en utilisant des serveurs standards. + Calcul + La plateforme PAPPSO est spécialisée dans les traitements en protéomique haut débit (nombreux échantillons). Pour assurer la disponibilité de nos moyens de calculs à l’ensemble des utilisateurs, nous utilisons le gestionnaire de processus HTCondor. + Les besoins en calcul évoluent eux aussi en fonction des instruments utilisés. Avec l’évolution des techniques, de nouvelles possibilités sont apparues dans le traitement de données en protéomique exigeant elles aussi des capacités de calculs supplémentaires. Les machines dédiées au calcul doivent être ainsi renouvelées régulièrement et intégrées au fur et à mesure (comme pour le stockage). + Evolution sur 10 ans + Matériel + L’intégration de nouvelles machines de calcul ou de stockage s’est faite de manière transparente. Nous sommes passés d’une capacité de stockage initiale de 18To (3 serveurs R515, disques de 3To) en 2011 à une capacité de 917To (8 serveurs hétérogènes). Le réseau est passé du 1Gb cuivre au 10Gb SFP+. Il n’y a pas eu de transfert de données/migration, pas de modification de l’architecture logique pour les utilisateurs. Le système de fichier cephfs permet un accès direct aux données depuis chaque nœud de calcul, les performances ont suivies les évolutions matérielles (augmentation du débit, augmentation des capacités de calcul). La résistance aux pannes a été mise à rude épreuve (panne électrique, disques ou erreurs humaines) et nous n’avons pas eu de perte de données. + Logiciel + Les systèmes côté serveurs et utilisateurs ont été migrés en 2013 de Ubuntu vers Debian. Nous y avons gagné en stabilité et en simplicité lors des mises à jour de version. Le stockage centralisé est disponible pour tous les postes dans une arborescence commune, montage automatique sur les nœud de calculs (cephfs via systemd sur les serveurs, sshfs sur les postes clients). Les logiciels sont les mêmes sur les serveurs et les postes utilisateurs. L’accès distant au cluster de calcul se fait avec x2go via clé publique ssh. + Scientifique + Les analyses de la plateforme ont évolué pour passer de la technique des gels électrophorèses 2D vers les analyses shotgun en spectrométrie de masse. Le traitement d’images 2D était majoritairement effectué avec des logiciels propriétaires sous Windows. Des postes dédiés nécessaires, ce qui limitait les capacités de traitement. Lors du passage vers les analyses shotgun, les logiciels propriétaires ont pu être avantageusement remplacés par des logiciels libres (identification des protéines avec X!Tandem). En 2008, les capacités des instruments étaient suffisantes pour pouvoir quantifier les protéines directement en spectrométrie de masse, mais les logiciels n’étaient pas adaptés. Nous avons pu développer notre propre logiciel de quantification basé sur les idées originales des scientifiques de la plateforme. : MassChroQ. L’indépendance vis à vis des formats et des fabricants nous a permis de produire un logiciel évolutif et pérenne dès le départ, évitant l’effet « boite noire ». Ainsi, nos outils ont pu être adaptés au fur et à mesure aux nouvelles techniques et instruments, absorbant les « chocs » technologiques : doublement des fréquences d’acquisition à chaque génération (3 ans), doublement des capacités de résolution (précision de mesure des masses). + La dernière « rupture technologique » est l’apparition du timTOF pro du fabricant « Bruker ». Cet appareil dispose d’une fréquence d’acquisition 10 fois plus grande que la génération précédente, ainsi que d’une nouvelle dimension de séparation des peptides (mobilité ionique). Fait unique depuis les débuts de la protéomique, Bruker a publié les spécifications techniques de son instrument. Cela nous a permis d’adapter MassChroQ pour pouvoir utiliser directement les données du constructeur, sans conversion. Nous obtenons ainsi des gains de performances remarquables par rapport aux logiciels commerciaux, ainsi que de meilleures quantifications. + + Bilan + Le passage aux logiciels libres pour la plateforme PAPPSO a permis une maîtrise totale de ses outils, de la production des données brutes à l’interprétation biologique. Les sommes importantes économisées en licences de logiciels propriétaires (20k€ par an) ont été transférées dans la maintenance de ses ressources de calcul et de stockage. Le savoir faire développé par PAPPSO dans l’analyse protéomique haut débit est reconnu au niveau international (129 articles citant MassChroQ depuis 2011, publication d’un article de référence en métaprotéomique « nature communication » en 2021). Toutes les analyses sont complètement vérifiables et reproductibles, les logiciels étant tous disponibles librement sous licence GPLv3. + + + Présentation générale + Le style fourni et utilisé dans ce document est dérivé de celui de base de LibreOffice. + Les quelques modifications sont regroupées dans la hiérarchie de styles « → Jres », sous le style de paragraphe par défaut. Autant que possible, l’auteur doit s’y conformer. Les fontes utilisées sont celles fournies par LibreOffice et ainsi disponibles en standard sur chaque plate-forme (Windows, Mac, Linux & BSD). + Utiliser les styles définis + Chaque élément qui compose le document doit être lié à un style bien précis : les titres, les figures, les bibliographies… + Pour appliquer le style (taille et police) qui correspond, il suffit de se positionner sur la ligne ou bien de sélectionner la chaîne de caractères et dans le bandeau en haut en gauche du menu de sélectionner le style correspondant. Ainsi, le style lui sera automatiquement appliqué. Il est important de respecter le style fourni ; non seulement l’homogénéité des numérotations des titres, sous-titres, figures est respectée, mais cela garantit aussi que votre article soit homogène avec le reste de la conférence. + Le document ne devrait quasiment pas faire usage de formatage direct. L’option « Effacer le formatage direct » permet de s’assurer que les styles définis sont bien appliqués sans modifications. Polices La police de base est de type Liberation Serif en 12 points. Les titres utilisent, selon la section, des déclinaisons de Liberation Sans de 20, 14 et 12 points avec numérotation arabe, rappel du numéro de section et séparation par un point. La couleur bleu sombre RGB (0,51,95), #00335F est utilisée. Les titres de niveaux inférieurs à 3 sont à éviter, pour des raisons de lisibilité. - Le code source est Liberation Mono 8 points. - L’utilisation du style approprié ajoute le cadre et grise le fond. - Les notes de bas de page sont en 8 points1 - Comme ceci. + Le code source est Liberation Mono 8 points. + L’utilisation du style approprié ajoute le cadre et grise le fond. + Les notes de bas de page sont en 8 points1 + Comme ceci. Typographie Les auteurs s’attacheront, dans la mesure du possible, à respecter les règles typographiques françaises. En particulier, ils veilleront à utiliser des espaces insécables avant les ponctuations hautes (; : ! ?) et des guillemets français («»). @@ -2371,25 +2198,25 @@ Bibliographie La bibliographie sera réalisée avec le style « Bibliographie – Liste de références » avec des numéros et dans l’ordre d’apparition dans le texte. Pour faire référence à un élément de cette liste, il faut insérer un « Renvoi » en sélectionnant dans la partie « Paragraphes numérotés » le numéro de la référence de cet élément, par exemple [2]. - + - Pour les articles d’une revue, on indiquera obligatoirement les auteurs, le titre de l’article, la revue, le numéro, le volume, l’année et le mois. Voir [2]. + Pour les articles d’une revue, on indiquera obligatoirement les auteurs, le titre de l’article, la revue, le numéro, le volume, l’année et le mois. Voir [2]. - Pour les articles dans les actes d’un congrès, on mentionnera obligatoirement les auteurs, le titre de l’article, le titre des actes, l’année. Voir [3] : (le mois et le lieu sont facultatifs mais conseillés). + Pour les articles dans les actes d’un congrès, on mentionnera obligatoirement les auteurs, le titre de l’article, le titre des actes, l’année. Voir [3] : (le mois et le lieu sont facultatifs mais conseillés). - Pour les livres, on citera obligatoirement le ou les auteurs, le titre, l’éditeur et l’année (il est conseillé de rajouter le lieu d’édition) [4]. + Pour les livres, on citera obligatoirement le ou les auteurs, le titre, l’éditeur et l’année (il est conseillé de rajouter le lieu d’édition) [4]. - Adresses électroniques + Adresses électroniques Pour diminuer les risques de moissonnage, aucune adresse mail ne figurera dans l’article. Pour les références à des pages web, il conviendra d’utiliser le menu « Insertion/Hyperlien » disponible dans le menu de LibreOffice, par exemple comme ceci : http://www.jres.org. Mise en page - Tout comme le respect des règles de typographie, la mise en page du document est parfois négligée. Un document soigné augmente le confort de lecture et permet de se concentrer sur le fond plutôt que la forme : l’article n’en sera que plus apprécié. - Marques de formatage - Pour s’assurer d’une bonne qualité de composition du document, il est conseillé d’utiliser l’affichage des marques de formatage. Son activation permet de mieux détecter quelques erreurs souvent peu visibles (doubles espaces, retours de lignes ou caractères parasites). - + Tout comme le respect des règles de typographie, la mise en page du document est parfois négligée. Un document soigné augmente le confort de lecture et permet de se concentrer sur le fond plutôt que la forme : l’article n’en sera que plus apprécié. + Marques de formatage + Pour s’assurer d’une bonne qualité de composition du document, il est conseillé d’utiliser l’affichage des marques de formatage. Son activation permet de mieux détecter quelques erreurs souvent peu visibles (doubles espaces, retours de lignes ou caractères parasites). + iVBORw0KGgoAAAANSUhEUgAAACAAAAAyCAYAAAA9ZNlkAAAACXBIWXMAAA7HAAAOwwFc/upy AAABUUlEQVR4nGP5+/fvf4YBBCwDafmoA0YdMOqAUQeMOgDsgAuvB9gB4pwDVxe9/M44CKJg 1AGjDiBG0Z+//xiOX3vGcOb2S4bnb78x/PzzlyjDJ2TYMzAyMlLmgI/ffjLM2nKJ4cnbrwQt @@ -2400,51 +2227,51 @@ vg2wA/RFBnSwfBBEwYh3AAAof3HPQZH9CQAAAABJRU5ErkJggg== - Figure 1– Bouton du bandeau supérieur à activer - Figures - Les figures sont de préférence insérées à proximité du texte qui y fait référence. Elles sont numérotées et suivies d’une légende explicite, en italique, non gras, à l’aide du style « Légende – Figure ». Le texte peut alors y faire référence ainsi : Erreur : source de la référence non trouvée. Il est déconseillé de créer des liens d’objets dynamiques. Il conviendra plutôt d’utiliser le menu « Insertion/Image » disponible dans le menu de LibreOffice. + Figure 1– Bouton du bandeau supérieur à activer + Figures + Les figures sont de préférence insérées à proximité du texte qui y fait référence. Elles sont numérotées et suivies d’une légende explicite, en italique, non gras, à l’aide du style « Légende – Figure ». Le texte peut alors y faire référence ainsi : Erreur : source de la référence non trouvée. Il est déconseillé de créer des liens d’objets dynamiques. Il conviendra plutôt d’utiliser le menu « Insertion/Image » disponible dans le menu de LibreOffice. En cas d’insertion de figure contenant des couleurs, il est souhaitable d’en assurer la lisibilité sur une imprimante noir et blanc. - Puces et listes numérotées - Si les styles « Puce 1 » et « Liste » sont utilisés, voici quelques exemples qu’il est utile de rappeler et de respecter. + Puces et listes numérotées + Si les styles « Puce 1 » et « Liste » sont utilisés, voici quelques exemples qu’il est utile de rappeler et de respecter. Que ce soit pour les puces ou les listes numérotées, il est conseillé de n’utiliser que deux niveaux. - + - exemple de niveau 1 pour les puces (style « Liste à puces ») ; + exemple de niveau 1 pour les puces (style « Liste à puces ») ; - exemple de niveau 2 pour les puces (style « Liste à puces – Niveau 2 ») ; + exemple de niveau 2 pour les puces (style « Liste à puces – Niveau 2 ») ; - deuxième exemple de niveau 1 pour les puces. + deuxième exemple de niveau 1 pour les puces. - + - exemple de niveau 1 pour les listes numérotées (style « Liste numérotée ») ; + exemple de niveau 1 pour les listes numérotées (style « Liste numérotée ») ; - exemple de niveau 2 pour les listes numérotées (style « Liste numérotée – Niveau 2 ») ; + exemple de niveau 2 pour les listes numérotées (style « Liste numérotée – Niveau 2 ») ; - deuxième exemple de niveau 2 pour les listes numérotées ; + deuxième exemple de niveau 2 pour les listes numérotées ; - deuxième exemple de niveau 1 pour les listes numérotées. + deuxième exemple de niveau 1 pour les listes numérotées. - Annexe + Annexe Les auteurs ajoutent, si nécessaire, une annexe avec une section non numérotée. Bibliographie - + - André J.. Petites leçons de typographie, 1990 ; http//jacques-andre.fr/faqtypo/lessons.pdf. + André J.. Petites leçons de typographie, 1990 ; http//jacques-andre.fr/faqtypo/lessons.pdf. - Auteur1 et Auteur2. Un article dans une revue. Nom de la revue, 3(10) :133–139, janvier 2001. + Auteur1 et Auteur2. Un article dans une revue. Nom de la revue, 3(10) :133–139, janvier 2001. Auteur3. Un exemple d’article dans les actes d’une conférence. Dans Actes de la conférence JRES2013, pages 37–49, Montpellier, décembre 2013. @@ -2453,7 +2280,7 @@ Auteur4. Les réseaux hauts débits. Presse Académique, 2002. - Auteur5. Un autre exemple d’article dans les actes en ligne d’une conférence. Dans Actes du congrès JRES2017, Nantes, novembre 2017 ; http://2017.jres.org/articles/123.pdf. + Auteur5. Un autre exemple d’article dans les actes en ligne d’une conférence. Dans Actes du congrès JRES2017, Nantes, novembre 2017 ; http://2017.jres.org/articles/123.pdf.