Development of innovative technologies for extracting and integrating information from heterogeneous data sources using machine learning. (Q78456): Difference between revisions

From EU Knowledge Graph
Jump to navigation Jump to search
(‎Removed claim: financed by (P890): Directorate-General for Regional and Urban Policy (Q8361), Removing unnecessary financed by statement)
(‎Changed label, description and/or aliases in fr: translated_label)
label / frlabel / fr
 
Développer des technologies innovantes pour extraire et intégrer des informations provenant de sources de données hétérogènes utilisant l’apprentissage automatique.

Revision as of 15:23, 30 November 2021

Project Q78456 in Poland
Language Label Description Also known as
English
Development of innovative technologies for extracting and integrating information from heterogeneous data sources using machine learning.
Project Q78456 in Poland

    Statements

    0 references
    3,625,320.0 zloty
    0 references
    870,076.80 Euro
    13 January 2020
    0 references
    4,815,375.0 zloty
    0 references
    1,155,690.0 Euro
    13 January 2020
    0 references
    75.29 percent
    0 references
    1 January 2019
    0 references
    31 December 2020
    0 references
    4SEMANTICS SP. Z O. O.
    0 references
    0 references

    53°7'39.0"N, 23°8'49.6"E
    0 references
    PRZEDMIOT PROJEKTU Projekt ma na celu dostarczenie unikalnych technologii pozwalających na wydobywanie danych o wskazanej semantyce z heterogenicznych źródeł oraz na ich integrację w spójny i pełny widok w ramach organizacji. Oczekiwane rezultaty pierwszych etapów projektu (I-III), to rozwiązania oparte na technikach przetwarzania języka naturalnego (dla języka polskiego) i uczeniu maszynowym, pozwalające między innymi na: • automatyczne wydobywanie danych o wskazanej semantyce ze źródeł niestrukturalnych (np. dokumenty, poczta elektroniczna, czat), • automatyczne wydobywanie danych o wskazanej semantyce ze źródeł strukturalnych (np. bazy danych) i semistrukturalnych (np. dane tabelaryczne, strony HTML, dokumenty XML, JSON, RTF) , • łączenie i uspójnianie rozproszonych danych pochodzących z wielu źródeł, • dostęp do zgromadzonych informacji za pomocą jednolitej semantycznej warstwy dostępu. Technologie bazowe, które zostaną opracowane w wyniku pierwszych etapów projektu (I-III) , zostaną wykorzystane w Etapie IV. Etap IV będzie skupiał się na eksperymentalnej weryfikacji wykorzystania technologii w konkretnej domenie biznesowej, jaką jest wydobywanie danych o osobach oraz danych szczególnie wrażliwych na potrzeby zarządzania ich bezpieczeństwem w organizacji będącej procesorem danych. Projekt zakłada również przeprowadzenie w ramach Etapu IV prac badawczych w celu opracowania metody przenoszenie/budowania modeli wydobywania danych dla innych języków europejskich, tj.: angielski, niemiecki, hiszpański. Umiejętność rozbudowy rozwiązania o kolejne języki pozwoli znacząco poszerzyć rynek odbiorców rezultatów projektu. Zgodnie z art. 25 rozporządzenia KE nr 651/2014 z dnia 17 czerwca 2014 r. uznające niektóre rodzaje pomocy za zgodne z rynkiem wewnętrznym w stosowaniu art. 107 i 108 Traktatu (Dz. Urz. UE L 187/1 z 26.06.2014) (Polish)
    0 references
    Project Item The project aims to provide unique technologies that allow the extraction of data on indicated semantics from heterogeneous sources and their integration into a coherent and complete view within the organisation. The expected results of the first phases of the project (I-III) are solutions based on natural language processing techniques (for Polish) and machine learning, allowing, inter alia: • automatic extraction of specified semantics data from non-structural sources (e.g. documents, e-mail, chat), • automatic extraction of specified semantics data from structural sources (e.g. databases) and semi-structural (e.g. tabular data, HTML pages, XML documents, JSON, RTF), • combining and consolidating distributed data from multiple sources, • access the collected information by means of a uniform semantic access layer. Core technologies to be developed as a result of the first phases of the project (I-III) will be used in Stage IV. Stage IV will focus on experimental verification of the use of technology in a specific business domain, namely the extraction of data about individuals and data sensitive to the management of their security in the data processor organisation. The project also envisages carrying out research within Stage IV to develop a method of transfer/build data extraction models for other European languages, i.e.: English, German, Spanish. The ability to expand the solution by further languages will significantly expand the market for recipients of project results. Pursuant to Article 25 of Regulation (EC) No 651/2014 of 17 June 2014 declaring certain types of aid compatible with the internal market in the application of Articles 107 and 108 of the Treaty (OJ L. I'm sorry. EU L 187/1 of 26.06.2014) (English)
    14 October 2020
    0 references

    Identifiers

    POIR.01.01.01-00-0910/18
    0 references