PoSeNoGap

Portable Scalable Concurrency for Genomic Data Processing

PoSeNoGap vise à développer un nouveau framework pour traitement des données génomiques. A l'heure actuelle le séquençage s'un génome humain génère environ 300GB de données brutes. Dès lors il est indispensable de pouvoir les compresser, et l'analyse de ces données est très coûteuse en temps de traitement. Durant les trois ans de PoSeNoGap, de nouvelles méthodes de compression sont en cours de développement. Dans ce contexte, l'institut REDS développe une solution performante pour le clustering de séquences non mappées grâce à une plateforme FPGA de PicoComputing.

Avec l'avènement des nouvelles technologies de séquençage haut-débit, la récupération de l'information du génome d’un individu est devenu possible et abordable. Ces méthodes ouvrent des approches inédites dans le cadre du diagnostique et du traitement efficace du cancer et des maladies génétiques. Il reste cependant de nombreux défis de nature scientifique et informatique à relever avant de pouvoir intégrer ces technologies émergentes à l'infrastructure médicale existante. Un premier défi consiste à gérer le déluge de données généré (Pour ordre de grandeur, plusieurs téraoctets de données sont collectées chaque semaine rien que par le centre Vital-IT du SIB). Une base de données représentative pour les habitants d'un petit pays comme la Suisse, aurait besoin de stocker une quantité immense de données, plus de 2'000'000 de téraoctets. Un second défi est lié à la puissance de calcul nécessaire afin