Expansion of calculation capacity i storage of mass genomics data (Q3216201)
Jump to navigation
Jump to search
Project Q3216201 in Spain
Language | Label | Description | Also known as |
---|---|---|---|
English | Expansion of calculation capacity i storage of mass genomics data |
Project Q3216201 in Spain |
Statements
1,467,750.0 Euro
0 references
2,935,500.0 Euro
0 references
50.0 percent
0 references
1 May 2015
0 references
31 December 2022
0 references
FUNDACION CENTRO DE REGULACION GENOMICA
0 references
08019
0 references
El Centro Nacional de Análisis Genómico (CNAG-CRG) es uno dels centros europeos con más capacidad de secuenciación de ácidos nucleicos. Actualmente dispone de una plataforma con 7 secuenciadores de ADN de segunda generación y 3 equipos de secuenciación mediante nanoporos, capaces de producir en total más de 1.000 Gb de secuencia cada 24 horas. Durante el 2018 y el 2019 está previsto renovar los equipos de secuenciación más antiguos y comprar un nuevo equipo de tercera generación más potente, y para ello se dispone de cofinanciación del proyecto ICTS-2017-04-CRG, de la convocatoria 2016 de Convenios ICTS (Infraestructuras Científicas y Técnicas Singulares). El nuevo conjunto de instrumentos podrá generar más de 6.000 Gb de secuencia al día. Para poder almacenar y analizar todos estos datos de secuenciación, el CNAG-CRG dispone de un potente centro de procesamiento de datos (CPD), con sistemas de comunicaciones con un gran ancho de banda (56 Gb por segundo), un sistema de almacenamiento de datos conectado por red (3,5 PB nets), un sistema de almacenamiento en cinta (3 PB) y servidores con diversas funcionalidades con 3.472 núcleos de computación, incluyendo servidores dedicados para los proyectos RDConnect (plataforma para la gestión de datos clínicos y genómicos en enfermedades raras) y 4DGenome (plataforma para el análisis de interacciones de la cromatina). En este proyecto se proponen una serie de actuaciones para mejorar y actualizar el rendimiento de las operaciones de los equipos de supercomputación del CNAG-CRG: - Acciones de reforma del CPD, incluyendo varios trabajos para mejorar la seguridad del acceso y la eficiencia energética. - Inversiones para comprar nuevos equipos troncales de comunicación, nodos de almacenamiento y nodos de computación. Las inversiones más importantes se realizarán en dos fases, en los años 2019 y 2022. Las adquisiciones previstas para el año 2019 permitirán disponer de un potente clúster con el doble de núcleos de computación (en total >5500) y 4 veces más capacidad de cálculo (unos 350 Tflops en total), así como discos de almacenamiento con el doble de rendimiento que los actuales (New Generation Netapp o similares, de 24 GB/sc) y un total de 3,8 PB. Se estima que los nuevos equipos contribuirán a disminuir el consumo energético en un 20-30%. La propuesta incluye también los gastos del personal necesario para migrar los servicios y funciones actuales a los nuevos servidores, e implementar-los en las tareas de producción. Finalmente, se incluye la adquisición de dos servidores para la transferencia de datos a los colaboradores. En resumen, la ampliación de los equipos informáticos del CNAG-CRG en los próximos años es esencial para aumentar la productividad y adecuarla a la capacidad de los nuevos secuenciadores, mejorar la eficiencia de las operaciones y reducir los costes de mantenimiento y electricidad. Juntamente con la compra de nuevos equipos de secuenciación, consolidará al CNAG-CRG como la principal infraestructura en Genómica del país y uno de los centros más potentes de Europa en esta área. (Spanish)
0 references
The National Center for Genomic Analysis (CNAG-CRG) is one of the top European centers in terms of nucleic acid sequencing capacity. The platform currently manages 7 second generation DNA sequencing instruments and 3 nanopore-based sequencing instruments, that can produce more than 1.000 Gb of sequence every 24 hours. The plan for 2018 and 2019 is to substiture the 2nd generation sequencers bought in 2010-2011 and buy one large scale 3rd generation sequencer. The operation will be co-funded with project ICTS-2017-04-CRG-2 awarded in the 2016 call for Convenios ICTS (Infraestructuras Científicas y Técnicas Singulares). The new sequencing park will generate more than 6.000 Gb of sequencing data every day. The sequencing operation is supported by an extensive analysis and databasing facility (CPD), with an internal 56 Gb/s InfiniBand network, 3.5 petabyte (PB) of high performance data storage on disk and 3 PB on tapes and over 3,472 cores of computing, including two servers dedicated to the RDConnect project (clinic and genomic analysis plataform for rare diseases) and the 4Dgenome project (plataform for chromatin interaction analysis). In this proposal, we include several actions to improve the performance of the CNAG-CRG computing infrastructure operations: - CPD renovation actions, including works for improving access security and energy efficiency. - Adquisition of data center networking equipment, and storage and computing nodes. Investments will be done in two phases, in 2019 and 2022. Purchases planned for 2019 will provide the current cluster with twice as many computing nodes (>5.700 in total) and four times more computing capacity (360 Tflops in total), as well as storage disks that have twice the capacity and the efficiency of the current set up (New Generation Netapp o similar, with 24 GB/sc) and a total of 4 PB. We estimate that the new configuration will decrease energy consumption by 20-30%. The proposal also includes the adquisition of two servers for user data transfers. In summary, the improvements and extensions of the CNAG-CRG computing infrastructure in the next years is essential to increase productivity to cope with the higher capacity of the new genomic data generation instruments, to increase the efficiency of the computing operations and to decrease the maintenance and electricity costs. Along with the adquisition of state-of-the-art sequencing instruments, it will consolidate CNAG-CRG as the first Genomics national infrastructure and one of the top centers in Europe in this area. (English)
0 references
Barcelona
0 references
Identifiers
IU16-006344
0 references