Graph-based method of modelling and analysis of system biology data (Q3056374)

From EU Knowledge Graph
Revision as of 18:02, 28 November 2021 by DG Regio (talk | contribs) (‎Created claim: summary (P836): De snelle ontwikkeling van „high-Throughput”-technologieën voor de extractie van bio-informaticagegevens heeft gezorgd voor de beschikbaarheid van grootschalige datasets die waardevolle informatie bevatten voor het modelleren van complexe biologische systemen en het begrijpen van de biologische processen die deze reguleren — zoals systemen zoals „omics”-netwerken die verschillende cel- en intercellulaire processen en de interactie tussen dergeli...)
Jump to navigation Jump to search
Project Q3056374 in Latvia
Language Label Description Also known as
English
Graph-based method of modelling and analysis of system biology data
Project Q3056374 in Latvia

    Statements

    0 references
    0 references
    535,398.94 Euro
    0 references
    629,881.11 Euro
    0 references
    85.0 percent
    0 references
    21 February 2017
    0 references
    31 December 2019
    0 references
    Latvijas Universitātes Matemātikas un informātikas institūts
    0 references
    0 references

    56°56'54.92"N, 24°7'5.30"E
    0 references
    Projekta kopsavilkuma aprakstsStrauja t.s. “high-throughput” tehnoloģiju attīstība bioinformātikas datu ieguvei ir nodrošinājusi to, ka ir pieejamas liela apjoma datu kopas, kuras satur vērtīgu informāciju sarežģītu bioloģisku sistēmu modelēšanai un to regulējošo bioloģisko procesu izpratnei – piemēram, tādu sistēmu, kā dažādu šūnu un starpšūnu procesus aprakstošu “omics” tīklu un šādu tīklu savstarpējās mijiedarbības izpratnei. Tajā pat laikā, šādu datu kopu lielā apjoma un tajās ietvertās informācijas sarežģītības dēļ, noderīgas informācijas ieguve no šādām datu kopām ir ļoti netriviāla problēma, un šim nolūkam izmantotās metodes parasti ir ierobežotas ar statistisko vai mašīnmācīšanās metožu iespējām.Šī projekta mērķis ir izstrādāt jaunas inovatīvas datu analīzes metodes, kas balstīsies uz kombinētu dažādu grafu analīzes algoritmu un grafu vizualizācijas metožu izmantošanu. Projekta autoru jau veiktie pētījumi ir demonstrējuši šādas pieejas noderīgumu proteīnu homoloģijas izpētei, un mēs uzskatām, ka šāda pieeja varētu būt ļoti noderīga arī cita veida bioinformātikas datu kopu analīzei. Projekta ietvaros ir plānots koncentrēties uz gēnu regulācijas procesu dinamikas analīzi, hromatīna interakciju dinamikas analīzi, epigenomisko marķieru prognozēšanu un pētījumiem par procesiem, kas nosaka dažāda veida šūnu atšķirīgumu. Plašākā perspektīvā mēs sagaidām, ka izstrādātā metodoloģija labi papildinās esošās bioinformātikas datu analīzes metodes.Atslēgvārdi: Bioinformātika; Bioloģisko sistēmu modelēšana; Grafu algoritmi; Datizrace; Datu vizualizācija.Informācija, kas projekta iesnieguma apstiprināšanas gadījumā tiks publicēta Eiropas Savienības fondu tīmekļa vietnē www.esfondi.lvStrauja t.s. “high-throughput” tehnoloģiju attīstība bioinformātikas datu ieguvei ir nodrošinājusi to, ka ir pieejamas liela apjoma datu kopas, kuras satur vērtīgu informāciju sarežģītu bioloģisku sistēmu modelēšanai un to regulējošo bioloģisko procesu izpratnei.Šī projekta mērķis ir izstrādāt jaunas inovatīvas datu analīzes metodes, kas balstīsies uz kombinētu dažādu grafu analīzes algoritmu un grafu vizualizācijas metožu izmantošanu.Pētījumi tiks koncentrēti uz trim konkrētām bioinformātikas problēmām ar augstu zinātnisko un praktisko nozīmību, kuru izpētei šobrīd tiek veltīta liela uzmanība, un, kur pēc mūsu domām, mēs varam sniegt nozīmīgu ieguldījumu: 1) proteoma kvantitatīva raksturošana no gēnu ekspresijas datiem; 2) hromatīna interakcijas tīklu analīze; 3) gēnu regulācijas tīklu dinamikas un evolūcijas analīze.Pētniecības veids: rūpnieciskie (100%) pētījumi.Projekta veids nav saistīts ar ekonomisko aktivitāti.Projekts ir starpdisciplinārs un tiks izpildīts šādās nozarēs:- Datoru un informācijas zinātnes (OECD-FOS-1.2);- Bioloģijas zinātnes (OECD-FOS-1.6).Galvenās aktivitātes:1) Pētījumi par proteoma kvantitatīvo raksturojumu iegūšanu no gēnu ekspresijas datiem (WP1).2) Pētījumi par hromatīna interekcijas tīklu struktūru un tās atkarības no šūnu tipiem (WP2).3) Pētījumi par gēnu regulācijas tīklu dinamikas un evolūcijas analīzi (WP3).Šīs trīs galvenās aktivitātes atbilst iepriekšminēto konkrēto bioinformātikas problēmu izpētei. Bez tām projekta darba plāns ietver divas papildinošas aktivitātes saistītas ar datu kopu sagatavošanu un rezultātu bioloģisko validāciju (WP4) un programmatūras komponenšu izstrādi (WP5).Sagaidāmie rezultāti:1) Metodes proteīnu koncentrācijas noteikšanai audu un šūnu paraugos no transkriptomikas datiem.2) Metodes integrētai hromatīna interakcijas, epigenomikas un gēnu regulācijas datu analīzei.3) Metodes automatizētai gēnu regulācijas motīvu identificēšanai no mikromasīvu un NGS eksperimentu datiem un gēnu regulācijas motīvu evolūcijas analīzei.“Projekta kopējas izmaksas: 634 744,42 EUR (attiecināmās izmaksas: 633 384,42 EUR, ERAF finansējums: 538 376,74 EUR)”. Projekta ilgums: 35 mēneši.Projekta īstenošanas ilgums 21.02.2017. - 31.12.2019. (Latvian)
    0 references
    Project summary descriptionThe so-called “high-throughput” technology development for the acquisition of bioinformatics data has led to the availability of large amounts of data sets that contain valuable information for modelling complex biological systems and understanding the biological processes that regulate it – for example, the understanding of systems like “omics” describing various cellular and intercellular processes and the interaction between such networks. At the same time, due to the large volume of such datasets and the complexity of the information contained therein, the acquisition of useful information from such datasets is a very untrivial problem, and the methods used for this purpose are usually limited to the possibilities of statistical or machine learning methods.The aim of this project is to develop new innovative data analysis methods based on the use of a combination of graphic analysis algorithms and graphic visualisation methods. The studies already carried out by the project authors have demonstrated the usefulness of such an approach for researching protein homology, and we believe that this approach could also be very useful for the analysis of other types of bioinformatics datasets. Within the framework of the project it is planned to focus on analysis of gene regulation process dynamics, analysis of chromatin intersection dynamics, prediction of epigenomic markers and studies on processes that determine different types of cell distinctiveness. From a broader perspective, we expect that the methodology developed will well complement existing methods of analysis of bioinformatics data. Bioinformatics; Modelling of biological systems; Graphic algorithms; Data mining; Data visualisation.Information that will be published on the web site of the European Union funds www.esfondi.lvStrauja in case of approval of a project application, the so-called “high-throughput” technology development for bioinformatics data acquisition has ensured the availability of large-scale datasets containing valuable information for modelling complex biological systems and understanding their regulatory biological processes.The aim of this project is to develop new innovative data analysis methods that will be based on a combination of different graph analysis algorithms and the understanding of the three graphs for the understanding of the biological processes.The aim of this project is to develop new innovative data analysis methods that will be based on a combination of different graph analysis algorithms and the understanding of the three graphs in terms of information, where we will focus on the specific challenges of bio-visual, and to develop new innovative methods of data analysis based on a combination of different graphics analysis algorithms and graphs, where we will focus on the need to focus on the specific problems of bio-visual, and where we will focus on the use of the scientific methods. 1) Quantitative characterisation of the proteasome from gene expression data; 2) Analysis of chromatin intermediation networks; 3) Analysis of the dynamics and evolution of gene regulation networks.Type of research: Industrial research (100 %) The project type is not related to economic activity.The project is interdisciplinary and will be carried out in the following fields:- Computer and Information Science (OECD-FOS-1.2);- Biology sciences (OECD-FOS-1.6).Key activities:1) Studies on the quantitative characterisation of the protagonists from gene expression data (WP1).2) Studies on chromatin interaction network structure (GWP) for the specific domains of the networks (WP) for specific problem characterisation of the proteoma from gene expression data (WP1).2) Studies on chromatin interaction network structure 3 and the dynamics of specific problems of the above-mentioned network (WP.2). In addition, the project work plan includes two complementary activities related to the production of datasets and biovalidation of results (WP4) and software components (WP5).Project results:1) Methods for detecting protein concentrations in tissue and cell samples from transcript data.2) Methods for integrated chromatin interaction, epigenomics and gene regulation data analysis.3) Methods for automated gene regulation identification from micromass and NGS data for integrated chromatin intermediation, epigenomic and gene regulation data analysis.3) Methods for automated gene regulation identification from micromass and NGS experimental design data. EUR 634744,42 (eligible costs: EUR 633384,42, ERDF contribution: EUR 538376,74’. Duration of the project: 35 months. Duration of project implementation 21.02.2017. 31.12.2019 (English)
    15 July 2021
    0 references
    Le développement rapide de technologies à haut débit pour l’extraction de données bioinformatiques a permis de disposer d’ensembles de données à grande échelle contenant des informations précieuses pour la modélisation de systèmes biologiques complexes et la compréhension des processus biologiques qui les régulent — tels que des systèmes tels que les réseaux «omiques» décrivant différents processus cellulaires et intercellulaires et l’interaction entre ces réseaux. Dans le même temps, en raison du volume important de ces ensembles de données et de la complexité des informations qu’ils contiennent, l’obtention d’informations utiles à partir de ces ensembles de données est un problème très indubitable et les méthodes utilisées à cette fin se limitent généralement aux possibilités de méthodes statistiques ou d’apprentissage automatique. L’objectif de ce projet est de développer de nouvelles méthodes innovantes d’analyse des données fondées sur l’utilisation combinée de différents algorithmes d’analyse de graffes et de méthodes de visualisation des graffs. Des études déjà réalisées par les auteurs du projet ont démontré l’utilité d’une telle approche pour la recherche sur l’homologie des protéines, et nous pensons qu’une telle approche pourrait également être très utile pour l’analyse d’autres types de données bioinformatiques. Dans le cadre du projet, il est prévu de se concentrer sur l’analyse dynamique des processus de régulation des gènes, l’analyse dynamique des interactions de la chromatine, la prédiction des marqueurs épigénomiques et la recherche sur les processus qui déterminent différents types de cellules. Dans une perspective plus large, nous nous attendons à ce que la méthodologie élaborée complète bien les méthodes existantes d’analyse des données bioinformatiques. La bioinformatique; La modélisation des systèmes biologiques; Algorithmes graphiques; L’exploration de données; Visualisation des données.En cas d’approbation de l’application du projet, l’information sera publiée sur le site internet des fonds de l’Union européenne www.esfondi.lvStrauja ce que l’on appelle le développement technologique «à haut débit» pour l’acquisition de données bioinformatiques a permis la disponibilité de grandes quantités d’ensembles de données contenant des informations précieuses pour la modélisation de systèmes biologiques complexes et la compréhension des processus biologiques qui le régulent. L’objectif de ce projet est de mettre au point de nouvelles méthodes innovantes d’analyse de données basées sur l’utilisation combinée de différents algorithmes d’analyse graphique et de méthodes de visualisation graphique. Les études porteront sur trois problèmes bioinformatiques spécifiques ayant une pertinence scientifique et pratique élevée, qui sont actuellement étudiés, et où nous pensons pouvoir apporter une contribution importante: 1) caractérisation quantitative du protéome à partir des données d’expression génique; 2) analyse des réseaux d’interaction de la chromatine; 3) analyse de la dynamique et de l’évolution des réseaux de régulation des gènes.Type de recherche: études industrielles (100 %).Le type de projet n’est pas lié à l’activité économique.Le projet est interdisciplinaire et sera réalisé dans les secteurs suivants:- Sciences de l’informatique et de l’information (OCDE-FOS-1.2);- Sciences biologiques (OCDE-FOS-1.6).Activités principales: 1) Études sur l’obtention de la caractérisation quantitative du protéome à partir de données d’expression génique (WP1).2) Études sur la structure des réseaux d’intersection de la chromatine et sa dépendance à l’égard des types de cellules (WP2).3) Études sur les gènes analyse de l’évolution et de l’évolution des réseaux réglementaires (WP3). Ces trois activités principales concordent avec l’étude des problèmes bioinformatiques spécifiques mentionnés ci-dessus. En outre, le plan de travail du projet comprend deux activités complémentaires liées à la préparation d’ensembles de données et à la validation biologique des résultats (WP4) et au développement de composants logiciels (WP5).Résultats en cours: 1) Méthodes de détermination de la concentration de protéines dans les échantillons tissulaires et cellulaires à partir de données de transcriptomie.2) Méthodes d’analyse intégrée de l’interaction de la chromatine, de l’épigénomique et des données de régulation des gènes.3) Méthodes d’identification automatisée des motifs de régulation génétique à partir de données d’expérience micromassives et DGS et d’analyse de l’évolution des motifs de régulation des gènes.'Coût total du projet: 634 744,42 EUR (coûts éligibles: 633 384,42 EUR, financement du FEDER: 538 376,74 EUR)». Durée du projet: 35 mois. Durée de mise en œuvre du projet 21.02.2017. — 31.12.2019. (French)
    25 November 2021
    0 references
    Die rasche Entwicklung von „High-Throughput“-Technologien für die Bioinformatik-Datenextraktion hat die Verfügbarkeit von großflächigen Datensätzen mit wertvollen Informationen zur Modellierung komplexer biologischer Systeme und zum Verständnis der biologischen Prozesse, die sie regulieren, sichergestellt – wie z. B. Systeme wie „omics“-Netzwerke, die verschiedene Zell- und interzelluläre Prozesse beschreiben und die Wechselwirkungen zwischen diesen Netzwerken beschreiben. Aufgrund des großen Umfangs solcher Datensätze und der Komplexität der darin enthaltenen Informationen ist die Beschaffung nützlicher Informationen aus solchen Datensätzen ein sehr schwieriges Problem, und die dafür verwendeten Methoden beschränken sich im Allgemeinen auf die Möglichkeiten statistischer oder maschineller Lernmethoden. Ziel dieses Projekts ist es, neue innovative Datenanalysemethoden zu entwickeln, die auf dem kombinierten Einsatz unterschiedlicher Griaffe-Analysealgorithmen und Graffits-Visualisierungsmethoden basieren. Studien, die bereits von den Autoren des Projekts durchgeführt wurden, haben gezeigt, wie nützlich ein solcher Ansatz für die Erforschung der Proteinhomologie ist, und wir glauben, dass ein solcher Ansatz auch für die Analyse anderer Arten von bioinformatischen Datensätzen sehr nützlich sein könnte. Im Rahmen des Projekts ist geplant, sich auf die dynamische Analyse von Genregulierungsprozessen, die dynamische Analyse von Chromatin-Interaktionen, die Vorhersage epigenomischer Marker und die Erforschung von Prozessen zu konzentrieren, die verschiedene Zelltypen bestimmen. In einer breiteren Perspektive erwarten wir, dass die entwickelte Methodik die bestehenden Methoden zur Analyse bioinformatischer Daten gut ergänzen wird. Bioinformatik; Modellierung biologischer Systeme; Diagrammalgorithmen; Data Mining; Datenvisualisierung.Im Falle der Genehmigung der Projektanwendung werden die Informationen auf der Website der Europäischen Union veröffentlicht werden www.esfondi.lvStrauja so genannte „High-Throughput“-Technologieentwicklung zur Bioinformatik-Datenerfassung hat die Verfügbarkeit großer Mengen an Datensätzen mit wertvollen Informationen zur Modellierung komplexer biologischer Systeme und zum Verständnis der biologischen Prozesse, die sie regeln, gewährleistet. Ziel dieses Projekts ist es, neue innovative Datenanalysemethoden zu entwickeln, die auf dem kombinierten Einsatz unterschiedlicher Graphenanalysealgorithmen und Graphenvisualisierungsmethoden basieren. Die Studien konzentrieren sich auf drei spezifische bioinformatische Probleme mit hoher wissenschaftlicher und praktischer Relevanz, die derzeit untersucht werden und wo wir glauben, dass wir einen wichtigen Beitrag leisten können: 1) quantitative Charakterisierung des Proteoms aus Genexpressionsdaten; 2) Analyse von Chromatin-Interaktionsnetzwerken; 3) Analyse der Dynamik und Entwicklung von Genregulierungsnetzwerken.Art der Forschung: das Projekt ist interdisziplinär und wird in folgenden Bereichen durchgeführt:- Computer- und Informationswissenschaften (OECD-FOS-1.2);- Biologische Wissenschaften (OECD-FOS-1.6).Hauptaktivitäten:1) Studien zur Erlangung der quantitativen Charakterisierung des Proteoms aus Genexpressionsdaten (WP1) Studien über die Struktur von Chromatin-Intersektionen und deren Abhängigkeit von Zelltypen (WP2). Darüber hinaus umfasst der Projektarbeitsplan zwei ergänzende Tätigkeiten im Zusammenhang mit der Erstellung von Datensätzen und der biologischen Validierung von Ergebnissen (WP4) und der Entwicklung von Softwarekomponenten (WP5).Pending results:1) Methoden zur Bestimmung der Proteinkonzentration in Gewebe- und Zellproben aus Transkriptomy-Daten.2) Methoden zur integrierten Analyse von Chromatin-Interaktions-, Epigenomik- und Genregulierungsdaten.3) Methoden zur automatisierten Identifizierung von Genregulationsmotiven aus mikromassiven und DGS-Experimentdaten und Genregulierungsmotiven Evolutionsanalyse.'Gesamtkosten des Projekts: 634 744,42 EUR (zuschussfähige Kosten: 633 384,42 EUR, EFRE-Mittel: 538 376,74 EUR)“. Laufzeit des Projekts: 35 Monate. Dauer der Durchführung des Projekts 21.02.2017. — 31.12.2019. (German)
    28 November 2021
    0 references
    De snelle ontwikkeling van „high-Throughput”-technologieën voor de extractie van bio-informaticagegevens heeft gezorgd voor de beschikbaarheid van grootschalige datasets die waardevolle informatie bevatten voor het modelleren van complexe biologische systemen en het begrijpen van de biologische processen die deze reguleren — zoals systemen zoals „omics”-netwerken die verschillende cel- en intercellulaire processen en de interactie tussen dergelijke netwerken beschrijven. Door het grote volume van dergelijke datasets en de complexiteit van de informatie die ze bevatten, is het verkrijgen van nuttige informatie uit dergelijke datasets een zeer ontriviaal probleem en de hiervoor gebruikte methoden zijn over het algemeen beperkt tot de mogelijkheden van statistische of machine learning methoden. Het doel van dit project is om nieuwe innovatieve data-analysemethoden te ontwikkelen op basis van het gecombineerde gebruik van verschillende graffe-analyse-algoritmen en graffs visualisatiemethoden. Studies die reeds door de auteurs van het project zijn uitgevoerd, hebben het nut van een dergelijke aanpak voor onderzoek naar eiwithomologie aangetoond en wij zijn van mening dat een dergelijke aanpak ook zeer nuttig zou kunnen zijn voor het analyseren van andere soorten bio-informatica-datasets. In het kader van het project is het de bedoeling om zich te concentreren op dynamische analyse van genregulatieprocessen, dynamische analyse van chromatineinteracties, voorspelling van epigenomic markers en onderzoek naar processen die verschillende soorten cellen bepalen. In een breder perspectief verwachten we dat de ontwikkelde methodologie de bestaande analysemethoden voor bio-informatica goed zal aanvullen. Bio-informatica; Modellering van biologische systemen; Grafiekalgoritmen; Datamining; Data visualisatie.In geval van goedkeuring van de projectaanvraag zal de informatie worden gepubliceerd op de website van de fondsen van de Europese Unie www.esfondi.lvStrauja zogenaamde „high-Throughput” technologieontwikkeling voor de verzameling van bio-informaticagegevens heeft gezorgd voor de beschikbaarheid van grote hoeveelheden datasets die waardevolle informatie bevatten voor het modelleren van complexe biologische systemen en het begrijpen van de biologische processen die dit reguleren. Het doel van dit project is om nieuwe innovatieve data-analysemethoden te ontwikkelen op basis van het gecombineerde gebruik van verschillende grafiekanalysealgoritmen en grafische visualisatiemethoden. De studies zullen zich richten op drie specifieke bio-informatische problemen met een hoog wetenschappelijk en praktisch belang, die momenteel worden bestudeerd en waar we van mening zijn dat we een belangrijke bijdrage kunnen leveren: 1) kwantitatieve karakterisering van het proteoom uit genexpressiegegevens; 2) analyse van chromatin Interactie Netwerken; 3) analyse van de dynamiek en evolutie van genreguleringsnetwerken. Soort onderzoek: industriële (100 %) studies.Het type project houdt geen verband met de economische activiteit.Het project is interdisciplinair en zal worden uitgevoerd in de volgende sectoren:- Computer- en Informatiewetenschappen (OESO-FOS-1.2);- Biologische Wetenschappen (OESO-FOS-1.6).Belangrijkste activiteiten:1) Studies over het verkrijgen van de kwantitatieve karakterisering van proteoom uit genexpressiegegevens (WP1).2) Studies naar de structuur van chromatine intersectienetwerken en de afhankelijkheid van celtypen (WP2).3) Gene studies analyse van de evolutie en evolutie van regelgevende netwerken (WP3).Deze drie hoofdactiviteiten zijn consistent met de studie van de bovengenoemde specifieke bio-informatica problemen. Daarnaast omvat het projectwerkplan twee complementaire activiteiten in verband met de voorbereiding van datasets en biologische validatie van resultaten (WP4) en de ontwikkeling van softwarecomponenten (WP5).In afwachting van resultaten:1) Methoden voor de bepaling van de eiwitconcentratie in weefsel- en celmonsters uit transcriptomiegegevens.2) Methoden voor geïntegreerde analyse van chromatineinteractie, epigenomica en genreguleringsgegevens.3) Methoden voor geautomatiseerde identificatie van genregulatiemotieven uit micro-massave en DGS-experimentgegevens en genreguleringsmotie-analyse.'Totale kosten van het project: 634 744,42 EUR (subsidiabele kosten: 633 384,42 EUR, EFRO-financiering: 538 376,74 EUR)”. Duur van het project: 35 maanden. Duur van de uitvoering van het project 21.02.2017. — 31.12.2019. (Dutch)
    28 November 2021
    0 references
    Raiņa bulvāris 29, Rīga, LV-1050
    0 references

    Identifiers

    1.1.1.1/16/A/135
    0 references