Quelques idées.

This commit is contained in:
Filippo Rusconi 2021-05-04 12:58:45 +02:00
parent 0e1510ff65
commit b12835c100

View File

@ -8,6 +8,51 @@ présenter une démarche. Comment et pourquoi faire de utiliser des logiciels li
# Plan
Le logiciel libre --- de part sa nature même --- est un objet scientifique
canonique en ce sens qu'il se décline sous trois formes inter-dépendantes: il
constitue un outil pour la recherche scientifique, il est un produit de la
recherche scientifique et enfin, il est un objet de recherche scientifique.
Nous voulons montrer dans notre exposé comment la liberté logicielle a permis à
notre plateforme, d'abord de bâtir une infrastructure informatique
réseaux/serveurs robuste comme socle pour la mise en place ultérieure de nos
activités de recherche scientifique et de développement logiciel.
La plateforme PAPPSO (plateforme...) de spectrométrie de masse pour la biologie
est destinée à fournir à ses usagers scientifiques des services complémentaires:
en premier lieu, la préparation de l'échantillon biologique, en deuxième lieu,
son analyse par spectrométrie de masse, en deuxième lieu, et enfin la fouille
des données expérimentales obtenues afin de fournir aux usagers des données
d'intérêt biologique immédiatement exploitables. La mise en œuvre des ces trois
services a requis la mise en place d'une infrastructure informatique permettant
1) l'enregistrement des caractéristiques détaillées de chacune des
étapes, 2) le stockage des données et leur transfert sur les postes de travail
des différents intervenants, 3) le traitement des données (fouille des données
et analyses statistiques), 4) le stockage de toutes les données produites dans
un dépôt accessible aux usagers.
1) Chaque étape du processus analytique est minutieusement documentée et --- dès
que possible --- standardisée de manière à nous approcher autant que possible
d'un objectif désormais central dans la démarche scientifique: la recherche
reproductible (git / sourcesup);
2) Les données de spectrométrie de masse sont massives et requièrent pour leur
stockage et leur traitement une infrastructure informatique robuste (ceph,
serveurs de calcul);
3) Le traitement des données impose une utilisation massive de logiciels conçus
pour leur majorité au sein de PAPPSO. Le développement et la maintenance de
toute une gamme de logiciels libres pour la spectrométrie de masse est l'une des
caractéristiques saillantes qui font l'originalité de PAPPSO en France.
4) Les données brutes et les données issues de nos analyses sont stockées dans
un dépôt qui permet leur sauvegarde au long cours et leur recherche par les
usagers.
* introduire le logiciel libre, mariage science / ouverture du code (recherche reproductible), public money public code, obligation éthique en science, pérennité, investissement rentable
* contexte de la plateforme : fabricants de spectromètres, éditeurs de logiciels scientifique. Adaptation permanente, incompatibilité des logiciels entre eux, perte d'expertise lors des changements de versions ou d'éditeur, analyse entre projets ou sur la durée difficile, coût des licences, maintenance, postes dédiés, nombre d'utilisateur restreint, nombre de CPU restreint.
* Expérience PAPPSO en 15 ans d'engagement FOSS : réinvestissement des gains en licence vers l'infrastructure, maitrise du déploiement, maitrise du SI matériel et logiciel, développements à façon, rationalisation des flux de données (production, analyse, archivage), réutilisation des données, compatibilité. Adaptation permanente à l'émergence de nouvelles techniques : comment PAPPSO a pu grâce aux logiciels libres, s'adapter et monter en puissance. gel2D, analyses shotgun, haut débit, explosion des données, métaprotéomique, mobilité ionique...
@ -65,4 +110,4 @@ http://www.profiproteomics.fr/
enfer des licences :
* restriction matérielles
* contraintes logicielles
* intégration impossible
* intégration impossible