Development of innovative technologies for extracting and integrating information from heterogeneous data sources using machine learning. (Q78456): Difference between revisions

@@ label / de / label / de @@
+Entwicklung innovativer Technologien zur Gewinnung und Integration von Informationen aus heterogenen Datenquellen durch maschinelles Lernen.
@@ Property / summary @@
+Gegenstand DER PROJEKT Das Projekt zielt darauf ab, einzigartige Technologien bereitzustellen, um Daten über Semantik aus heterogenen Quellen zu extrahieren und in eine kohärente und vollständige Sicht innerhalb der Organisation zu integrieren. Die erwarteten Ergebnisse der ersten Projektphase (I-III) sind Lösungen, die auf Techniken der Verarbeitung natürlicher Sprachen (für polnische Sprache) und maschinelles Lernen beruhen und unter anderem Folgendes ermöglichen: &bull; automatische Extraktion von Semantikdaten aus nicht-strukturellen Quellen (z. B. Dokumente, E-Mail, Chat), &bull; automatische Extraktion von Daten mit angezeigter Semantik aus strukturellen Quellen (z. B. Datenbanken) und semistrukturellen Quellen (z. B. tabellarische Daten, HTML-Seiten, XML-Dokumente, JSON, RTF), &bull; Kombination und kohärente Verteilung von Daten aus mehreren Quellen, &bull; Zugriff auf die gesammelten Informationen über eine einheitliche semantische Zugangsebene. Die zugrunde liegenden Technologien, die infolge der ersten Projektphasen (I-III) entwickelt werden sollen, werden in Phase IV eingesetzt. Phase IV wird sich auf die experimentelle Überprüfung des Einsatzes von Technologie in einem bestimmten Geschäftsfeld konzentrieren, d. h. die Extraktion von Daten über Einzelpersonen und Daten, die für die Verwaltung ihrer Sicherheit in einer Datenverarbeitungsorganisation besonders sensibel sind. Das Projekt umfasst auch die Durchführung von Forschungsarbeiten im Rahmen von Phase IV zur Entwicklung einer Methode zum Verschieben/Bauen von Datenextraktionsmodellen für andere europäische Sprachen, d. h.: Englisch, Deutsch, Spanisch. Die Fähigkeit, die Lösung in andere Sprachen zu erweitern, wird den Markt der Empfänger der Projektergebnisse deutlich erweitern. Gemäß Artikel 25 der Verordnung (EG) Nr. 651/2014 vom 17. Juni 2014 zur Feststellung der Vereinbarkeit bestimmter Gruppen von Beihilfen mit dem Binnenmarkt in Anwendung der Artikel 107 und 108 AEUV URZ. EU L 187/1 vom 26.6.2014) (German)
+Normal rank
+point in time: 7 December 2021Timestamp +2021-12-07T00:00:00Z
Timezone +00:00
Calendar Gregorian
Precision 1 day
Before 0
After 0
-Timestamp
++2021-12-07T00:00:00Z
-Timezone
++00:00
-Calendar
+Gregorian
-Precision
+day
 Before
 After

Revision as of 08:53, 7 December 2021

Project Q78456 in Poland

Language	Label	Description	Also known as
English	Development of innovative technologies for extracting and integrating information from heterogeneous data sources using machine learning.	Project Q78456 in Poland

Statements

0 references

0 references

0 references

0 references

3,625,320.0 zloty

0 references

870,076.80 Euro

exchange rate to Euro

0.24 Euro

point in time

13 January 2020

0 references

budget

4,815,375.0 zloty

0 references

1,155,690.0 Euro

exchange rate to Euro

0.24 Euro

point in time

13 January 2020

0 references

co-financing rate

75.29 percent

0 references

start time

1 January 2019

0 references

end time

31 December 2020

0 references

beneficiary name (string)

4SEMANTICS SP. Z O. O.

0 references

beneficiary

Q2510318

0 references

intervention field

Research and innovation processes in SMEs (including voucher schemes, process, design, service and social innovation)

0 references

programme

Smart growth - PL - ERDF

0 references

fund

European Regional Development Fund

0 references

coordinate location

53°7'39.0"N, 23°8'49.6"E

0 references

summary

PRZEDMIOT PROJEKTU Projekt ma na celu dostarczenie unikalnych technologii pozwalających na wydobywanie danych o wskazanej semantyce z heterogenicznych źródeł oraz na ich integrację w spójny i pełny widok w ramach organizacji. Oczekiwane rezultaty pierwszych etapów projektu (I-III), to rozwiązania oparte na technikach przetwarzania języka naturalnego (dla języka polskiego) i uczeniu maszynowym, pozwalające między innymi na: • automatyczne wydobywanie danych o wskazanej semantyce ze źródeł niestrukturalnych (np. dokumenty, poczta elektroniczna, czat), • automatyczne wydobywanie danych o wskazanej semantyce ze źródeł strukturalnych (np. bazy danych) i semistrukturalnych (np. dane tabelaryczne, strony HTML, dokumenty XML, JSON, RTF) , • łączenie i uspójnianie rozproszonych danych pochodzących z wielu źródeł, • dostęp do zgromadzonych informacji za pomocą jednolitej semantycznej warstwy dostępu. Technologie bazowe, które zostaną opracowane w wyniku pierwszych etapów projektu (I-III) , zostaną wykorzystane w Etapie IV. Etap IV będzie skupiał się na eksperymentalnej weryfikacji wykorzystania technologii w konkretnej domenie biznesowej, jaką jest wydobywanie danych o osobach oraz danych szczególnie wrażliwych na potrzeby zarządzania ich bezpieczeństwem w organizacji będącej procesorem danych. Projekt zakłada również przeprowadzenie w ramach Etapu IV prac badawczych w celu opracowania metody przenoszenie/budowania modeli wydobywania danych dla innych języków europejskich, tj.: angielski, niemiecki, hiszpański. Umiejętność rozbudowy rozwiązania o kolejne języki pozwoli znacząco poszerzyć rynek odbiorców rezultatów projektu. Zgodnie z art. 25 rozporządzenia KE nr 651/2014 z dnia 17 czerwca 2014 r. uznające niektóre rodzaje pomocy za zgodne z rynkiem wewnętrznym w stosowaniu art. 107 i 108 Traktatu (Dz. Urz. UE L 187/1 z 26.06.2014) (Polish)

0 references

Project Item The project aims to provide unique technologies that allow the extraction of data on indicated semantics from heterogeneous sources and their integration into a coherent and complete view within the organisation. The expected results of the first phases of the project (I-III) are solutions based on natural language processing techniques (for Polish) and machine learning, allowing, inter alia: • automatic extraction of specified semantics data from non-structural sources (e.g. documents, e-mail, chat), • automatic extraction of specified semantics data from structural sources (e.g. databases) and semi-structural (e.g. tabular data, HTML pages, XML documents, JSON, RTF), • combining and consolidating distributed data from multiple sources, • access the collected information by means of a uniform semantic access layer. Core technologies to be developed as a result of the first phases of the project (I-III) will be used in Stage IV. Stage IV will focus on experimental verification of the use of technology in a specific business domain, namely the extraction of data about individuals and data sensitive to the management of their security in the data processor organisation. The project also envisages carrying out research within Stage IV to develop a method of transfer/build data extraction models for other European languages, i.e.: English, German, Spanish. The ability to expand the solution by further languages will significantly expand the market for recipients of project results. Pursuant to Article 25 of Regulation (EC) No 651/2014 of 17 June 2014 declaring certain types of aid compatible with the internal market in the application of Articles 107 and 108 of the Treaty (OJ L. I'm sorry. EU L 187/1 of 26.06.2014) (English)

point in time

14 October 2020

0 references

Objet DU PROJET Le projet vise à fournir des technologies uniques pour extraire des données sur la sémantique à partir de sources hétérogènes et les intégrer dans une vision cohérente et complète au sein de l’organisation. Les résultats escomptés des premières étapes du projet (I-III) sont des solutions fondées sur des techniques de traitement du langage naturel (pour la langue polonaise) et l’apprentissage automatique, permettant notamment: • extraction automatique des données sémantiques à partir de sources non structurelles (par exemple, documents, e-mail, chat), • extraction automatique des données avec la sémantique indiquée à partir de sources structurelles (par exemple, bases de données) et de sources semi-structurales (par exemple, données tabulaires, pages HTML, documents XML, JSON, RTF), • combiner et disperser de manière cohérente des données provenant de sources multiples, • accès aux informations collectées au moyen d’une couche d’accès sémantique uniforme. Les technologies sous-jacentes qui seront développées à la suite des premières phases du projet (I-III) seront utilisées au cours de la phase IV. La phase IV se concentrera sur la vérification expérimentale de l’utilisation de la technologie dans un domaine d’activité spécifique, c’est-à-dire l’extraction de données sur des personnes et de données particulièrement sensibles pour la gestion de leur sécurité dans une organisation de traitement de données. Le projet prévoit également la réalisation de travaux de recherche dans le cadre de la phase IV afin de mettre au point une méthode de déplacement/d’extraction de données pour d’autres langues européennes, à savoir: Anglais, allemand, espagnol. La capacité d’étendre la solution dans d’autres langues élargira considérablement le marché des bénéficiaires des résultats du projet. Conformément à l’article 25 du règlement (CE) no 651/2014 du 17 juin 2014 déclarant certaines catégories d’aides compatibles avec le marché intérieur en application des articles 107 et 108 du traité URZ. UE L 187/1 du 26.6.2014) (French)

point in time

30 November 2021

0 references

Gegenstand DER PROJEKT Das Projekt zielt darauf ab, einzigartige Technologien bereitzustellen, um Daten über Semantik aus heterogenen Quellen zu extrahieren und in eine kohärente und vollständige Sicht innerhalb der Organisation zu integrieren. Die erwarteten Ergebnisse der ersten Projektphase (I-III) sind Lösungen, die auf Techniken der Verarbeitung natürlicher Sprachen (für polnische Sprache) und maschinelles Lernen beruhen und unter anderem Folgendes ermöglichen: • automatische Extraktion von Semantikdaten aus nicht-strukturellen Quellen (z. B. Dokumente, E-Mail, Chat), • automatische Extraktion von Daten mit angezeigter Semantik aus strukturellen Quellen (z. B. Datenbanken) und semistrukturellen Quellen (z. B. tabellarische Daten, HTML-Seiten, XML-Dokumente, JSON, RTF), • Kombination und kohärente Verteilung von Daten aus mehreren Quellen, • Zugriff auf die gesammelten Informationen über eine einheitliche semantische Zugangsebene. Die zugrunde liegenden Technologien, die infolge der ersten Projektphasen (I-III) entwickelt werden sollen, werden in Phase IV eingesetzt. Phase IV wird sich auf die experimentelle Überprüfung des Einsatzes von Technologie in einem bestimmten Geschäftsfeld konzentrieren, d. h. die Extraktion von Daten über Einzelpersonen und Daten, die für die Verwaltung ihrer Sicherheit in einer Datenverarbeitungsorganisation besonders sensibel sind. Das Projekt umfasst auch die Durchführung von Forschungsarbeiten im Rahmen von Phase IV zur Entwicklung einer Methode zum Verschieben/Bauen von Datenextraktionsmodellen für andere europäische Sprachen, d. h.: Englisch, Deutsch, Spanisch. Die Fähigkeit, die Lösung in andere Sprachen zu erweitern, wird den Markt der Empfänger der Projektergebnisse deutlich erweitern. Gemäß Artikel 25 der Verordnung (EG) Nr. 651/2014 vom 17. Juni 2014 zur Feststellung der Vereinbarkeit bestimmter Gruppen von Beihilfen mit dem Binnenmarkt in Anwendung der Artikel 107 und 108 AEUV URZ. EU L 187/1 vom 26.6.2014) (German)

point in time

7 December 2021

0 references

Identifiers

Polish Kohesio ID

POIR.01.01.01-00-0910/18

0 references

Development of innovative technologies for extracting and integrating information from heterogeneous data sources using machine learning. (Q78456): Difference between revisions

Revision as of 08:53, 7 December 2021

Statements

Identifiers

Navigation menu

Search