Multilayer language resource set for semantic analysis and synthesis of text in Latvian (Q3056314)

From EU Knowledge Graph
Jump to navigation Jump to search
Project Q3056314 in Latvia
Language Label Description Also known as
English
Multilayer language resource set for semantic analysis and synthesis of text in Latvian
Project Q3056314 in Latvia

    Statements

    0 references
    0 references
    0 references
    550,790.52 Euro
    0 references
    647,988.85 Euro
    0 references
    85.0 percent
    0 references
    23 February 2017
    0 references
    30 November 2019
    0 references
    Latvijas Universitātes Matemātikas un informātikas institūts
    0 references
    0 references

    56°56'54.92"N, 24°7'5.30"E
    0 references

    56°56'55.18"N, 24°7'17.94"E
    0 references
    Teksta viedā automātiskā rezumēšana ir aktuāla tēma dabiskās valodas sapratnē (NLU) un tekstradē (NLG). Pretstatā virspusējai rezumēšanai, kurā no teksta tiek atlasīti daži informatīvi teikumi, viedajai rezumēšanai nepieciešama pilna gramatiskā un semantiskā analīze, nozīmīgākās informācijas identificēšana un saistītu parafrāžu sintēze (ģenerēšana). Projekta industriālajam partnerim – Nacionālajai informācijas aģentūrai LETA – vieda automātiskā rezumēšana nepieciešama mediju monitorēšanā, savukārt zinātniskajam partnerim – LU MII – ir ievērojama pieredze progresīvā semantiskajā analīzē un anotētu valodas resursu izveidē. Projektā tiks izveidoti daudzslāņu semantiski anotēti latviešu valodas resursi, izmantojot un attīstot pasaulē atzītas multilingvālas reprezentācijas (AMR, PropBank, FrameNet, Universal Dependencies, Grammatical Framework, BabelNet, DBpedia). Iegūto resursu izmantošanas iespējas tiks demonstrētas, izstrādājot konceptuālu teksta viedās rezumēšanas tehnoloģijas prototipu, kura potenciāls tiks novērtēts gan mediju monitorēšanas kontekstā, gan izmantojot ROUGE un citas metrikas. Projekts būtiski sekmēs pētījumus un inovācijas latviešu valodas automātiskā sapratnē un tekstradē.Atslēgvārdi: datorlingvistika, valodas tehnoloģijas, valodas resursi, leksiskā semantika, gramatiskā analīze, semantiskā analīze, teksta rezumēšana.Šī starpdisciplinārā projekta vispārīgais mērķis ir attīstīt pētniecību un inovācijas valodas automātiskā sapratnē un tekstradē, nostiprinot latviešu valodas tehnoloģisko atbalstu Eiropas daudzvalodu digitālajā vienotajā tirgū. Lai nodrošinātu tam pamatu, projekta specifiskais mērķis ir izveidot jaunu, fundamentālu daudzslāņu latviešu valodas resursu kopu un nodemonstrēt šo resursu izmantošanas potenciālu jaunu, inovatīvu tehnoloģiju izstrādē valodas sapratnes un tekstrades lietojumiem.Projektā tiks veikti rūpnieciskie pētījumi atbilstoši “Computer and information sciences” (FORD 1.2) un “Languages and literature” (FORD 6.2) zinātņu nozarēm. Projekts nav saistīts ar saimniecisko darbību.Projektā ir plānotas piecas galvenās darbības. Pirmās trīs darbības ir saistītas ar mašīnlasāmu, sintaktiski un semantiski anotētu tekstu korpusu izveidi un novērtēšanu valodas sapratnes lietojumiem. Ceturtā darbība ir apjomīgas skaidrojošās un sinonīmu vārdnīcas formalizēšana un integrēšana semantiskā tīmekļa saistīto atvērto datu mākonī. No formalizētās vārdnīcas tiks atvasināti multilingvāli skaitļojamie leksikoni, kas nepieciešami tekstradē. Šie rezultāti tiks izmantoti piektajā darbībā, izstrādājot teksta automātiskās rezumēšanas tehnoloģijas laboratorisku prototipu (TRL 4).Projektu īstenos LU MII Mākslīgā intelekta laboratorijas zinātniskie darbinieki – datorzinātnieki un valodnieki, t.sk. jaunie zinātnieki un doktoranti, – sadarbībā ar SIA LETA Pētniecības laboratorijas darbiniekiem. Ņemot vērā SIA LETA kompetenci mediju monitoringā un pieredzi pētniecības projektos, kas saistīti ar valodas automātisku semantisko analīzi, sadarbība paredzēta darbībās, kas attiecas uz semantiski anotētu datu sagatavošanu, mašīnmācīšanās metožu izstrādi un rezultātu novērtēšanu. SIA LETA kompetence ir ļoti būtiska arī konceptuālā prototipa specificēšanā, izstrādē un validēšanā.Projekta īstenošana būtiski stiprinās LU MII kompetenci un kapacitāti valodas resursu un tehnoloģiju pētniecībā un inovācijās un pavērs jaunas iespējas sadarbībai ar komersantiem un ārvalstu zinātniskajām institūcijām.Par pētījuma problemātiku un rezultātiem tiks publicēti 10 oriģināli zinātniskie raksti. Viens no galvenajiem projekta praktiskajiem rezultātiem būs brīvi pieejamās datu kopas ar augstu pievienoto vērtību: 5 anotēti tekstu korpusi un 5 skaitļojamie leksikoni. Otrs galvenais praktiskais rezultāts – jaunas valodas tehnoloģijas prototips.Projekta kopējās izmaksas ir 649417.19 EUR, no kurām 550871.56 EUR ir ERAF atbalsts.Projektu plānots īstenot no 01.12.2016. līdz 31.11.2019. (Latvian)
    0 references
    Smart automatic summary of the text is a topical theme in understanding natural language (NLU) and texttrade (NLG). In contrast to superficial summation, where some informative sentences are selected from the text, smart summary requires full grammatical and semantic analysis, identification of the most important information and synthesis of related paraphrases (generation). The industrial partner of the project – the National Information Agency LETA – smart automatic summary is necessary for media monitoring, while the scientific partner – UL MII – has considerable experience in advanced semantic analysis and development of annotated language resources. The project will create multi-layered semantic annotated Latvian language resources, using and developing multilingual representations (AMR, PropBank, FrameNet, Universal Dependencies, Grammatical Framework, BabelNet, DBpedia). The use of the resulting resources will be demonstrated by developing a conceptual prototype of smart text summarising technology, the potential of which will be assessed both in the context of media monitoring and using Rouge and other metrics. The project will significantly promote research and innovation in automatic understanding and texttrade of the Latvian language. Computer-linguistics, language technologies, language resources, lexical semantics, grammatical analysis, semantic analysis, text summarising.The general objective of this interdisciplinary project is to develop research and innovation in automatic understanding and translation of languages, strengthening the technological support of the Latvian language in the European multilingual digital single market. In order to provide the basis for this, the project’s specific aim is to create a new, fundamental multilayered Latvian language resource set and to demonstrate the potential of the use of these resources in the development of new innovative technologies for language understanding and textrade applications.In the project industrial research will be carried out in accordance with the fields of “Computer and information sciences” (FORD 1.2) and “Languages and literature” (FORD 6.2). The project is not related to economic activity.The project is planned for five main activities. The first three activities are related to the creation and evaluation of machine-readable, syntactically and semanticly annotated text housings. The fourth is the formalisation and integration of a large interpretative and synonym dictionary into a semantic web-linked open data cloud. From the formalised dictionary will be derived multilingual computational lexicons required for texttrade. These results will be used in the fifth action, developing the laboratory prototype of automatic abstraction technology (TRL 4).The project will be implemented by the scientists of the MII UL Artificial Intelligence Laboratory – computer scientists and linguists, including young scientists and doctoral students – in cooperation with the research laboratory employees of SIA LETA. Taking into account SIA LETA’s competence in media monitoring and experience in research projects related to automatic semantic analysis of language, cooperation is envisaged in activities related to the preparation of semantic annotated data, development of machine learning methods and evaluation of results. LETA’s competence is also very important in defining, developing and validating the conceptual prototype.Implementation of the project will significantly strengthen the competence and capacity of UL’s MII in research and innovation of language resources and technologies, and will open new opportunities for cooperation with business and foreign scientific institutions. One of the main practical results of the project will be open datasets with high added value: 5 annotated text boxes and 5 computational lexicons. The second main practical result – a prototype of new language technology.The total cost of the project is EUR 649417.19, of which EUR 550871.56 is ERDF support.The project is planned to be implemented from 01.12.2016 to 31.11.2019. (English)
    15 July 2021
    0.0579435874113608
    0 references
    Le résumé automatique intelligent du texte est un thème d’actualité pour la compréhension des langues naturelles (NLU) et TEXTRADE (NLG). Contrairement au résumé superficiel, dans lequel certaines phrases informatives sont sélectionnées à partir du texte, la synthèse intelligente nécessite une analyse grammaticale et sémantique complète, l’identification des informations les plus pertinentes et la synthèse des paraphrases connexes (générantes). Le partenaire industriel du projet — l’Agence nationale d’information LETA — a besoin d’un résumé automatique intelligent en matière de surveillance des médias, tandis que le partenaire scientifique LU MII possède une expérience considérable dans l’analyse sémantique avancée et la création de ressources linguistiques annotées. Le projet créera des ressources en langue lettone annotées à plusieurs niveaux, en utilisant et en développant des représentations multilingues de renommée mondiale (AMR, PropBank, FrameNet, Universal dépendances, Grammatical Framework, BabelNet, DBpedia). Les possibilités d’utiliser les ressources acquises seront démontrées par la mise au point d’un prototype conceptuel de technologie intelligente de recapture de texte, dont le potentiel sera évalué tant dans le contexte de la surveillance des médias que de l’utilisation de Rouge et d’autres paramètres. Le projet contribuera de manière significative à la recherche et à l’innovation dans la compréhension automatique et les textes de la langue lettone. linguistique informatique, technologies linguistiques, ressources linguistiques, sémantique lexique, analyse grammaticale, analyse sémantique, synthèse textuelle. L’objectif général de ce projet interdisciplinaire est de développer la recherche et l’innovation dans la compréhension automatique et la textra de la langue, en renforçant le soutien technologique de la langue lettone dans le marché unique numérique multilingue européen. À cette fin, l’objectif spécifique du projet est de créer une nouvelle réserve fondamentale de ressources en langue lettone à plusieurs niveaux et de démontrer le potentiel d’utilisation de ces ressources dans le développement de nouvelles technologies innovantes pour la compréhension des langues et les applications TEXTRADE. Le projet réalisera des recherches industrielles dans les domaines scientifiques «informatique et sciences de l’information» (FORD 1.2) et «Langues et littérature» (FORD 6.2). Le projet n’est pas lié à l’activité économique.Le projet se compose de cinq activités principales. Les trois premières actions concernent le développement et l’évaluation d’un corps texte annoté annoté à la machine, syntactique et sémantique pour les applications de compréhension des langues. La quatrième action est la formalisation et l’intégration d’un vaste vocabulaire interprétatif et synonyme dans le cloud de données ouvertes lié au web sémantique. À partir du dictionnaire formalisé, le vocabulaire computationnel multilingue sera dérivé du vocabulaire textracté. Le projet sera mis en œuvre par le personnel scientifique du laboratoire d’intelligence artificielle de l’Université de Lettonie — informaticiens et linguistes, y compris de jeunes scientifiques et doctorants — en coopération avec les employés du laboratoire de recherche LETA. Compte tenu de la compétence de LETA en matière de surveillance des médias et de l’expérience acquise dans des projets de recherche liés à l’analyse sémantique automatique du langage, une coopération est envisagée dans le cadre d’activités liées à la préparation de données annotées sémantiques, au développement de méthodes d’apprentissage automatique et à l’évaluation des résultats. La compétence de LETA Ltd est également très importante dans la spécification, le développement et la validation des prototypes conceptuels. La mise en œuvre du projet renforcera considérablement les compétences et les capacités de l’Université de Lettonie en matière de recherche et d’innovation en matière de ressources linguistiques et de technologies et ouvrira de nouvelles possibilités de coopération avec les hommes d’affaires et les institutions scientifiques étrangères. L’un des principaux résultats pratiques du projet sera l’ouverture d’ensembles de données à forte valeur ajoutée: 5 cas de texte annotés et 5 lexiques de calcul. Deuxième résultat pratique principal — prototype de nouvelles technologies linguistiques. Le coût total du projet s’élève à 649 417,19 EUR, dont 550 871,56 EUR au titre du soutien du FEDER. Le projet devrait être mis en œuvre du 1er décembre 2016 au 31.11.2019. (French)
    25 November 2021
    0 references
    Die intelligente automatische Zusammenfassung des Textes ist ein aktuelles Thema für das natürliche Sprachverständnis (NLU) und TEXTRADE (NLG). Im Gegensatz zur oberflächlichen Zusammenfassung, in der einige informative Sätze aus dem Text ausgewählt werden, erfordert intelligente Zusammenfassung eine vollständige grammatikalische und semantische Analyse, die Identifizierung der relevantesten Informationen und die Synthese verwandter Paraphrasen (Generierung). Der industrielle Partner des Projekts – die Nationale Informationsagentur LETA – benötigt eine intelligente automatische Zusammenfassung in der Medienüberwachung, während der wissenschaftliche Partner LU MII über umfangreiche Erfahrungen in der fortgeschrittenen semantischen Analyse und der Erstellung notierter Sprachressourcen verfügt. Das Projekt wird mehrschichtige semantische annotierte lettische Sprachressourcen mit Hilfe und Entwicklung weltbekannter mehrsprachiger Repräsentationen (AMR, PropBank, FrameNet, Universalabhängigkeiten, Grammatical Framework, BabelNet, DBpedia) schaffen. Die Möglichkeiten für die Nutzung der erworbenen Ressourcen werden durch die Entwicklung eines konzeptionellen Prototyps intelligenter Textrecapture-Technologie demonstriert, deren Potenzial sowohl im Rahmen der Medienüberwachung als auch unter Verwendung von Rouge und anderen Metriken bewertet wird. Das Projekt wird einen wesentlichen Beitrag zu Forschung und Innovation im automatischen Verständnis und Textra der lettischen Sprache leisten. Computersprache, Sprachtechnologien, Sprachressourcen, lexikalische Semantik, grammatikalische Analyse, semantische Analyse, Textzusammenfassung. Das allgemeine Ziel dieses interdisziplinären Projekts besteht darin, Forschung und Innovation im automatischen Verständnis und Textra der Sprache zu entwickeln und die technologische Unterstützung der lettischen Sprache im europäischen mehrsprachigen digitalen Binnenmarkt zu stärken. Um die Grundlage dafür zu schaffen, besteht das spezifische Ziel des Projekts darin, einen neuen, grundlegenden, vielschichtigen lettischen Ressourcenpool zu schaffen und das Potenzial der Nutzung dieser Ressourcen bei der Entwicklung neuer, innovativer Technologien für das Sprachenverständnis und TEXTRADE-Anwendungen zu demonstrieren. Das Projekt wird die industrielle Forschung nach den Bereichen „Computer- und Informationswissenschaften“ (FORD 1.2) und „Sprachen und Literatur“ (FORD 6.2) der Wissenschaft durchführen. Das Projekt ist nicht mit der wirtschaftlichen Tätigkeit verbunden.Das Projekt besteht aus fünf Hauptaktivitäten. Die ersten drei Maßnahmen betreffen die Entwicklung und Bewertung von maschinenlesbaren, syntaktischen und semantischen annotierten Textkorps für Anwendungen zum Sprachenverständnis. Die vierte Aktion ist die Formalisierung und Integration eines umfangreichen Interpretations- und Synonymwortschatzes in die semantische web-verknüpfte Open Data Cloud. Aus dem formalisierten Wörterbuch wird aus dem textracted Vokabular ein mehrsprachiges Berechnungsvokabular abgeleitet. Diese Ergebnisse werden in der fünften Aktion verwendet, um einen Laborprototyp der automatischen Zusammenfassung der Texttechnologie (TRL 4) zu entwickeln. Das Projekt wird von den wissenschaftlichen Mitarbeitern des Laboratoriums Künstliche Intelligenz der Universität Lettland – Informatiker und Linguisten, einschließlich junger Wissenschaftler und Doktoranden – in Zusammenarbeit mit Mitarbeitern des LETA Research Laboratory durchgeführt. Unter Berücksichtigung der Kompetenz von LETA im Bereich der Medienüberwachung und der Erfahrung in Forschungsprojekten im Zusammenhang mit der automatischen semantischen Analyse der Sprache ist eine Zusammenarbeit bei Tätigkeiten im Zusammenhang mit der Erstellung semantischer annotierter Daten, der Entwicklung von Methoden des maschinellen Lernens und der Auswertung der Ergebnisse vorgesehen. Die Kompetenz von LETA Ltd ist auch bei der Spezifikation, Entwicklung und Validierung konzeptueller Prototypen von großer Bedeutung. Die Umsetzung des Projekts wird die Kompetenz und Kapazität der Universität Lettland in Forschung und Innovation von Sprachressourcen und -technologien erheblich stärken und neue Möglichkeiten für die Zusammenarbeit mit Geschäftsleuten und ausländischen wissenschaftlichen Einrichtungen eröffnen. Eines der wichtigsten praktischen Ergebnisse des Projekts werden offene Datensätze mit hohem Mehrwert sein: 5 kommentierte Textfälle und 5 computergestützte Lexikone. Zweites praktisches Ergebnis – Prototyp der neuen Sprachtechnologie. Die Gesamtkosten des Projekts betragen 649 417,19 EUR, davon 550 871,56 EUR EFRE-Unterstützung. Das Projekt soll vom 01.12.2016 bis zum 31.11.2019 durchgeführt werden. (German)
    28 November 2021
    0 references
    De slimme automatische samenvatting van tekst is een actueel thema voor het begrijpen van de natuurlijke taal (NLU) en TEXTRADE (NLG). In tegenstelling tot de oppervlakkige samenvatting, waarin een aantal informatieve zinnen uit de tekst worden geselecteerd, vereist een slimme samenvatting volledige grammaticale en semantische analyse, identificatie van de meest relevante informatie en synthese van verwante parafrasen (genereren). De industriële partner van het project — het Nationaal Informatieagentschap LETA — heeft een slimme automatische samenvatting van mediamonitoring nodig, terwijl de wetenschappelijke partner — LU MII — aanzienlijke ervaring heeft met geavanceerde semantische analyse en het creëren van geannoteerde taalhulpbronnen. Het project zal meerlagige semantische geannoteerde Letse taalbronnen creëren, waarbij gebruik wordt gemaakt van wereldberoemde meertalige representaties (AMR, PropBank, FrameNet, Universal afhankelijkheden, Grammatical Framework, BabelNet, DBpedia). De mogelijkheden om de verworven middelen te gebruiken zullen worden aangetoond door de ontwikkeling van een conceptueel prototype van slimme tekstheroveringstechnologie, waarvan het potentieel zal worden beoordeeld in het kader van mediamonitoring en het gebruik van Rouge en andere statistieken. Het project zal in aanzienlijke mate bijdragen tot onderzoek en innovatie op het gebied van het automatische begrip en de tekst van de Letse taal. informatica, taaltechnologieën, taalhulpmiddelen, lexicale semantiek, grammaticale analyse, semantische analyse, tekstsamenvatting. Het algemene doel van dit interdisciplinair project is onderzoek en innovatie te ontwikkelen in het automatische begrip en tekstra van de taal, waardoor de technologische ondersteuning van de Letse taal in de Europese meertalige digitale eengemaakte markt wordt versterkt. Om hiervoor de basis te leggen, is de specifieke doelstelling van het project het creëren van een nieuwe, fundamentele, meerlagige Letse taalbronpool en om het potentieel aan te tonen van het gebruik van deze middelen bij de ontwikkeling van nieuwe, innovatieve technologieën voor het begrijpen van talen en TEXTRADE-toepassingen. Het project zal industrieel onderzoek uitvoeren volgens „Computer- en informatiewetenschappen” (FORD 1.2) en „Talen en literatuur” (FORD 6.2) wetenschapsgebieden. Het project houdt geen verband met de economische activiteit.Het project bestaat uit vijf hoofdactiviteiten. De eerste drie acties betreffen de ontwikkeling en beoordeling van machineleesbare, syntactische en semantische geannoteerde tekstkorpsen voor taalbegriptoepassingen. De vierde actie is de formalisering en integratie van een uitgebreide interpretatieve en synoniem woordenschat in de semantische web-linked open data cloud. Uit het geformaliseerde woordenboek zal een meertalige rekenwoordenschat worden afgeleid van het tuitgeëxtraheerde woordenschat. Deze resultaten zullen worden gebruikt in de vijfde actie, waarbij een laboratoriumprototype van de automatische samenvatting van teksttechnologie (TRL 4) wordt ontwikkeld. Het project zal worden uitgevoerd door het wetenschappelijk personeel van het laboratorium voor kunstmatige intelligentie van de Universiteit van Letland — computerwetenschappers en taalkundigen, met inbegrip van jonge wetenschappers en promovendi — in samenwerking met medewerkers van het LETA Research Laboratory. Rekening houdend met de competentie van LETA op het gebied van mediamonitoring en ervaring met onderzoeksprojecten in verband met automatische semantische taalanalyse, wordt samenwerking overwogen bij activiteiten in verband met de voorbereiding van semantische geannoteerde gegevens, de ontwikkeling van methoden voor machinaal leren en de evaluatie van resultaten. De competentie van LETA Ltd is ook zeer belangrijk in de specificatie, ontwikkeling en validatie van conceptuele prototypes. De uitvoering van het project zal de competentie en capaciteit van de Universiteit van Letland op het gebied van onderzoek en innovatie van taalhulpbronnen en -technologieën aanzienlijk versterken en zal nieuwe mogelijkheden bieden voor samenwerking met zakenlieden en buitenlandse wetenschappelijke instellingen. 10 originele wetenschappelijke artikelen zullen worden gepubliceerd over onderzoekskwesties en resultaten. Een van de belangrijkste praktische resultaten van het project is open datasets met een hoge toegevoegde waarde: 5 geannoteerde tekst gevallen en 5 computationele lexicons. Tweede belangrijkste praktische uitkomst — prototype van nieuwe taaltechnologie. De totale kosten van het project bedragen 649 417,19 EUR, waarvan 550 871,56 EUR EFRO-steun. Het project zal worden uitgevoerd van 1.12.2016 tot en met 31.11.2019. (Dutch)
    28 November 2021
    0 references
    La sintesi automatica intelligente del testo è un tema di attualità per la comprensione del linguaggio naturale (NLU) e TEXTRADE (NLG). A differenza del sommario superficiale, in cui alcune frasi informative sono selezionate dal testo, la sintesi intelligente richiede un'analisi grammaticale e semantica completa, l'identificazione delle informazioni più rilevanti e la sintesi delle relative parafrasi (generanti). Il partner industriale del progetto — l'Agenzia nazionale d'informazione LETA — ha bisogno di una sintesi automatica intelligente nel monitoraggio dei media, mentre il partner scientifico — LU MII — ha una notevole esperienza nell'analisi semantica avanzata e nella creazione di risorse linguistiche annotate. Il progetto creerà risorse di lingua lettone annotate semantiche a più livelli, utilizzando e sviluppando rappresentazioni multilingue di fama mondiale (AMR, PropBank, FrameNet, Universal dependencies, Grammatical Framework, BabelNet, DBpedia). Le opportunità di utilizzo delle risorse acquisite saranno dimostrate attraverso lo sviluppo di un prototipo concettuale di tecnologia di recupero del testo intelligente, il cui potenziale sarà valutato sia nel contesto del monitoraggio dei media che nell'utilizzo di Rouge e di altre metriche. Il progetto contribuirà in modo significativo alla ricerca e all'innovazione nella comprensione automatica e nel testo della lingua lettone. la linguistica informatica, le tecnologie linguistiche, le risorse linguistiche, la semantica lessicale, l'analisi grammaticale, l'analisi semantica, la sintesi dei testi. L'obiettivo generale di questo progetto interdisciplinare è sviluppare la ricerca e l'innovazione nella comprensione automatica e testuale della lingua, rafforzando il sostegno tecnologico della lingua lettone nel mercato unico digitale multilingue europeo. Al fine di fornire la base per questo, l'obiettivo specifico del progetto è quello di creare un nuovo, fondamentale multilivello di risorse linguistiche lettone e di dimostrare il potenziale di utilizzo di queste risorse per lo sviluppo di nuove tecnologie innovative per la comprensione linguistica e applicazioni TEXTRADE. Il progetto effettuerà ricerche industriali secondo i settori "Computer and Information Sciences" (FORD 1.2) e "Lingua e letteratura" (FORD 6.2). Il progetto non è collegato all'attività economica.Il progetto si compone di cinque attività principali. Le prime tre azioni riguardano lo sviluppo e la valutazione di testi leggibili meccanicamente, sintattici e semantici annotati per applicazioni di comprensione linguistica. La quarta azione è la formalizzazione e l'integrazione di un ampio vocabolario interpretativo e sinonimo nel cloud open data semantico collegato al web. Dal dizionario formalizzato, il vocabolario computazionale multilingue sarà derivato dal vocabolario textracted. Questi risultati saranno utilizzati nella quinta azione, sviluppando un prototipo di laboratorio della sintesi automatica della tecnologia testuale (TRL 4). Il progetto sarà attuato dal personale scientifico del Laboratorio di Intelligenza Artificiale dell'Università di Lettonia — informatici e linguisti, compresi giovani scienziati e dottorandi — in collaborazione con i dipendenti del laboratorio di ricerca LETA. Tenendo conto della competenza di LETA nel monitoraggio dei media e dell'esperienza in progetti di ricerca relativi all'analisi semantica automatica del linguaggio, è prevista la cooperazione nelle attività relative alla preparazione di dati semantici annotati, allo sviluppo di metodi di apprendimento automatico e alla valutazione dei risultati. La competenza di LETA Ltd è anche molto importante per la specificazione, lo sviluppo e la convalida di prototipi concettuali. L'attuazione del progetto rafforzerà significativamente la competenza e la capacità dell'Università di Lettonia nella ricerca e nell'innovazione delle risorse e delle tecnologie linguistiche e aprirà nuove opportunità di cooperazione con uomini d'affari e istituzioni scientifiche straniere. 10 articoli scientifici originali saranno pubblicati su temi di ricerca e risultati. Uno dei principali risultati pratici del progetto sarà costituito da serie di dati aperti ad alto valore aggiunto: 5 casi di testo annotati e 5 lessici computazionali. Secondo risultato pratico principale — prototipo di nuove tecnologie linguistiche. Il costo totale del progetto è di 649 417,19 EUR, di cui 550 871,56 EUR sono sostenuti dal FESR. Il progetto è previsto per l'attuazione dal 01.12.2016 al 31.11.2019. (Italian)
    11 January 2022
    0 references
    El resumen automático inteligente del texto es un tema de actualidad para la comprensión del lenguaje natural (NLU) y TEXTRADE (NLG). En contraste con el resumen superficial, en el que se seleccionan algunas frases informativas del texto, el resumen inteligente requiere un análisis gramatical y semántico completo, la identificación de la información más relevante y la síntesis de paráfrasis relacionadas (generadoras). El socio industrial del proyecto — la Agencia Nacional de Información LETA — necesita un resumen automático inteligente en el monitoreo de medios, mientras que el socio científico — LU MII — tiene una experiencia considerable en análisis semánticos avanzados y creación de recursos lingüísticos anotados. El proyecto creará recursos semánticos semánticos anotados en el idioma letón, utilizando y desarrollando representaciones multilingües de renombre mundial (AMR, PropBank, FrameNet, dependencias universales, Marco gramatical, BabelNet, DBpedia). Las oportunidades para utilizar los recursos adquiridos se demostrarán mediante el desarrollo de un prototipo conceptual de tecnología de recaptura de texto inteligente, cuyo potencial se evaluará tanto en el contexto de la supervisión de los medios de comunicación como en el uso de Rouge y otras métricas. El proyecto contribuirá significativamente a la investigación y la innovación en la comprensión automática y textra de la lengua letona. lingüística informática, tecnologías lingüísticas, recursos lingüísticos, semántica léxica, análisis gramatical, análisis semántico, síntesis de textos. El objetivo general de este proyecto interdisciplinario es desarrollar la investigación y la innovación en la comprensión automática y textra de la lengua, reforzando el apoyo tecnológico de la lengua letona en el mercado único digital multilingüe europeo. Con el fin de sentar las bases para ello, el objetivo específico del proyecto es crear un nuevo fondo de recursos lingüísticos letón de varias capas fundamentales y demostrar el potencial de utilizar estos recursos en el desarrollo de nuevas tecnologías innovadoras para la comprensión lingüística y las aplicaciones TEXTRADE. El proyecto no está relacionado con la actividad económica. El proyecto consta de cinco actividades principales. Las tres primeras acciones se refieren al desarrollo y la evaluación de cuerpos de texto anotados anotados por máquina, sintácticos y semánticos para aplicaciones de comprensión del lenguaje. La cuarta acción es la formalización e integración de un extenso vocabulario interpretativo y sinónimo en la nube semántica de datos abiertos enlazadas a la web. Del diccionario formalizado, el vocabulario computacional multilingüe se deriva del vocabulario de texto. Estos resultados se utilizarán en la quinta acción, desarrollando un prototipo de laboratorio del resumen automático de la tecnología de texto (TRL 4). El proyecto será ejecutado por el personal científico del Laboratorio de Inteligencia Artificial de la Universidad de Letonia -informáticos y lingüistas, incluidos jóvenes científicos y estudiantes de doctorado- en cooperación con los empleados del Laboratorio de Investigación LETA. Teniendo en cuenta la competencia de LETA en el seguimiento de los medios de comunicación y la experiencia en proyectos de investigación relacionados con el análisis semántico automático del lenguaje, se prevé la cooperación en actividades relacionadas con la preparación de datos semánticos anotados, el desarrollo de métodos de aprendizaje automático y la evaluación de los resultados. La competencia de LETA Ltd también es muy importante en la especificación, el desarrollo y la validación de prototipos conceptuales. La ejecución del proyecto reforzará significativamente la competencia y la capacidad de la Universidad de Letonia en investigación e innovación de recursos y tecnologías lingüísticas y abrirá nuevas oportunidades de cooperación con empresarios e instituciones científicas extranjeras. Se publicarán 10 artículos científicos originales sobre cuestiones y resultados de la investigación. Uno de los principales resultados prácticos del proyecto serán conjuntos de datos abiertos con alto valor añadido: 5 casos de texto anotados y 5 léxicos computacionales. Segundo resultado práctico principal: prototipo de nueva tecnología lingüística. El coste total del proyecto es de 649 417,19 EUR, de los cuales 550 871,56 EUR son ayudas del FEDER. El proyecto está previsto que se ejecute del 01.12.2016 al 31.11.2019. (Spanish)
    12 January 2022
    0 references
    Η έξυπνη αυτόματη περίληψη του κειμένου είναι ένα επίκαιρο θέμα για την κατανόηση της φυσικής γλώσσας (NLU) και του εμπορίου κειμένων (NLG). Σε αντίθεση με την επιφανειακή άθροιση, όπου επιλέγονται ορισμένες ενημερωτικές προτάσεις από το κείμενο, η έξυπνη περίληψη απαιτεί πλήρη γραμματική και σημασιολογική ανάλυση, προσδιορισμό των σημαντικότερων πληροφοριών και σύνθεση των σχετικών παραφράσεων (γενιά). Ο βιομηχανικός εταίρος του έργου — η Εθνική Υπηρεσία Πληροφοριών LETA — η έξυπνη αυτόματη περίληψη είναι απαραίτητη για την παρακολούθηση των μέσων ενημέρωσης, ενώ ο επιστημονικός εταίρος — UL MII — διαθέτει σημαντική εμπειρία σε προηγμένη σημασιολογική ανάλυση και ανάπτυξη σχολιασμένων γλωσσικών πόρων. Το έργο θα δημιουργήσει πολυεπίπεδους σημασιολογικούς λετονικούς γλωσσικούς πόρους, χρησιμοποιώντας και αναπτύσσοντας πολυγλωσσικές αναπαραστάσεις (AMR, PropBank, FrameNet, Universal Dependencies, Grammatical Framework, BabelNet, DBpedia). Η χρήση των πόρων που προκύπτουν θα καταδειχθεί με την ανάπτυξη ενός εννοιολογικού πρωτοτύπου ευφυούς κειμένου που θα συνοψίζει την τεχνολογία, το δυναμικό του οποίου θα αξιολογηθεί τόσο στο πλαίσιο της παρακολούθησης των μέσων ενημέρωσης όσο και στη χρήση Rouge και άλλων μετρήσεων. Το έργο θα προωθήσει σημαντικά την έρευνα και την καινοτομία στην αυτόματη κατανόηση και το εμπόριο κειμένων στη λετονική γλώσσα. Γενικός στόχος αυτού του διεπιστημονικού έργου είναι η ανάπτυξη της έρευνας και της καινοτομίας στην αυτόματη κατανόηση και μετάφραση των γλωσσών, ενισχύοντας την τεχνολογική υποστήριξη της λετονικής γλώσσας στην ευρωπαϊκή πολυγλωσσική ενιαία αγορά. Για να αποτελέσει τη βάση για αυτό, ο ειδικός στόχος του έργου είναι η δημιουργία ενός νέου, θεμελιώδους πολυεπίπεδου συνόλου λετονικών γλωσσικών πόρων και η επίδειξη των δυνατοτήτων χρήσης αυτών των πόρων για την ανάπτυξη νέων καινοτόμων τεχνολογιών για την κατανόηση γλωσσών και εφαρμογών TEXTRADE.Στο σχέδιο θα διεξαχθεί βιομηχανική έρευνα σύμφωνα με τους τομείς «Επιστήμες υπολογιστών και πληροφοριών» (FORD 1.2) και «Γλώσσες και λογοτεχνία» (FORD 6.2). Το έργο δεν σχετίζεται με την οικονομική δραστηριότητα.Το έργο έχει προγραμματιστεί για πέντε κύριες δραστηριότητες. Οι τρεις πρώτες δραστηριότητες σχετίζονται με τη δημιουργία και την αξιολόγηση μηχαναγνώσιμων, συντακτικώς και σημασιολογικά διατυπωμένων περιβλημάτων κειμένου. Το τέταρτο είναι η τυποποίηση και η ενσωμάτωση ενός μεγάλου ερμηνευτικού και συνώνυμου λεξικού σε ένα σημασιολογικό διαδικτυακό νέφος ανοικτών δεδομένων. Από το επίσημο λεξικό θα προκύψει πολύγλωσσα υπολογιστικά λεξικά που απαιτούνται για το εμπόριο κειμένων. Τα αποτελέσματα αυτά θα χρησιμοποιηθούν στην πέμπτη δράση, αναπτύσσοντας το εργαστηριακό πρωτότυπο της τεχνολογίας αυτόματης αφαίρεσης (TRL 4). Το έργο θα υλοποιηθεί από τους επιστήμονες του Εργαστηρίου Τεχνητής Νοημοσύνης MII UL — επιστήμονες υπολογιστών και γλωσσολόγοι, συμπεριλαμβανομένων νέων επιστημόνων και διδακτορικών φοιτητών — σε συνεργασία με τους υπαλλήλους του ερευνητικού εργαστηρίου του SIA LETA. Λαμβάνοντας υπόψη την ικανότητα του SIA LETA στην παρακολούθηση των μέσων ενημέρωσης και την εμπειρία σε ερευνητικά έργα που σχετίζονται με την αυτόματη σημασιολογική ανάλυση της γλώσσας, προβλέπεται συνεργασία σε δραστηριότητες που σχετίζονται με την προετοιμασία σημασιολογικών δεδομένων, την ανάπτυξη μεθόδων μηχανικής μάθησης και την αξιολόγηση των αποτελεσμάτων. Η ικανότητα της Leta είναι επίσης πολύ σημαντική για τον καθορισμό, την ανάπτυξη και την επικύρωση του εννοιολογικού πρωτοτύπου.Η υλοποίηση του έργου θα ενισχύσει σημαντικά την ικανότητα και την ικανότητα του MII της UL στην έρευνα και την καινοτομία των γλωσσικών πόρων και τεχνολογιών, και θα ανοίξει νέες ευκαιρίες συνεργασίας με τις επιχειρήσεις και τα ξένα επιστημονικά ιδρύματα. Ένα από τα κύρια πρακτικά αποτελέσματα του έργου θα είναι τα ανοικτά σύνολα δεδομένων με υψηλή προστιθέμενη αξία: 5 σχολιασμένα πλαίσια κειμένου και 5 υπολογιστικά λεξικά. Το δεύτερο βασικό πρακτικό αποτέλεσμα — ένα πρωτότυπο της νέας γλωσσικής τεχνολογίας. Το συνολικό κόστος του έργου ανέρχεται σε 649 417,19 EUR, εκ των οποίων 550 871,56 EUR είναι στήριξη από το ΕΤΠΑ. Το έργο προγραμματίζεται να υλοποιηθεί από 01.12.2016 έως 31.11.2019. (Greek)
    17 August 2022
    0 references
    Smart automatisk resumé af teksten er et aktuelt tema i forståelse af naturligt sprog (NLU) og texttrade (NLG). I modsætning til overfladisk summation, hvor nogle informative sætninger vælges fra teksten, kræver smart resumé fuld grammatisk og semantisk analyse, identifikation af de vigtigste oplysninger og syntese af relaterede parafraser (generation). Projektets industrielle partner — det nationale informationskontor LETA — intelligent automatisk resumé er nødvendig for medieovervågning, mens den videnskabelige partner — UL MII — har betydelig erfaring med avanceret semantisk analyse og udvikling af kommenterede sprogressourcer. Projektet vil skabe flerlags semantisk kommenteret lettisk sprogressourcer ved hjælp og udvikling af flersprogede repræsentationer (AMR, PropBank, FrameNet, Universal Dependencies, Grammatical Framework, BabelNet, DBpedia). Anvendelsen af de deraf følgende ressourcer vil blive demonstreret ved at udvikle en konceptuel prototype af intelligent tekst opsummerende teknologi, hvis potentiale vil blive vurderet både i forbindelse med medieovervågning og anvendelse af Rouge og andre målinger. Projektet vil i væsentlig grad fremme forskning og innovation inden for automatisk forståelse af og teksthandel med det lettiske sprog. Computer-lingvistik, sprogteknologi, sprogressourcer, leksikal semantik, grammatisk analyse, semantisk analyse, tekst opsummerende.Det overordnede mål med dette tværfaglige projekt er at udvikle forskning og innovation inden for automatisk forståelse og oversættelse af sprog, styrke den teknologiske støtte til det lettiske sprog på det flersprogede digitale indre marked. For at skabe grundlag herfor er projektets specifikke mål at skabe en ny, grundlæggende flerlagsbaseret lettisk ressource og demonstrere potentialet for at anvende disse ressourcer i udviklingen af nye innovative teknologier til sprogforståelse og TEXTRADE-applikationer.I projektet vil industriel forskning blive gennemført i overensstemmelse med områderne "Computer- og informationsvidenskab" (FORD 1.2) og "Languages and litteratur" (FORD 6.2). Projektet er ikke relateret til økonomisk aktivitet. Projektet er planlagt til fem hovedaktiviteter. De første tre aktiviteter vedrører oprettelse og evaluering af maskinlæsbare, syntaktiske og semantisk kommenterede teksthuse. Den fjerde er formaliseringen og integrationen af en stor fortolkende og synonym ordbog i en semantisk web-linket åben datasky. Fra den formaliserede ordbog vil blive afledt flersprogede computer lexicons kræves for texttrade. Disse resultater vil blive anvendt i den femte aktion, der udvikler laboratorieprototypen for automatisk abstraktionsteknologi (TRL 4). Projektet vil blive gennemført af forskerne i MII UL Artificial Intelligence Laboratory — dataforskere og lingvister, herunder unge forskere og ph.d.-studerende — i samarbejde med de ansatte i forskningslaboratoriet i SIA LETA. Under hensyntagen til SIA LETA's kompetence inden for medieovervågning og erfaring med forskningsprojekter vedrørende automatisk semantisk sproganalyse påtænkes der samarbejde om aktiviteter vedrørende udarbejdelse af semantiske kommenterede data, udvikling af maskinindlæringsmetoder og evaluering af resultater. Letas kompetence er også meget vigtig for at definere, udvikle og validere den konceptuelle prototype. Gennemførelsen af projektet vil i væsentlig grad styrke UL's MII's kompetence og kapacitet inden for forskning og innovation af sprogressourcer og -teknologier, og vil åbne nye muligheder for samarbejde med erhvervslivet og udenlandske videnskabelige institutioner. Et af de vigtigste praktiske resultater af projektet vil være åbne datasæt med høj merværdi: 5 kommenterede tekstbokse og 5 beregningsmæssige leksikoner. Det andet vigtigste praktiske resultat — en prototype af ny sprogteknologi.De samlede omkostninger ved projektet er 649 417,19 EUR, hvoraf 550 871,56 EUR er EFRU-støtte. Projektet forventes gennemført fra 1.12.2016 til 31.11.2019. (Danish)
    17 August 2022
    0 references
    Älykäs automaattinen yhteenveto tekstistä on ajankohtainen teema luonnonkielen (NLU) ja tekstikaupan (NLG) ymmärtämisessä. Toisin kuin pinnallisessa yhteenvedossa, jossa tekstistä valitaan joitakin informatiivisia lauseita, älykäs tiivistelmä edellyttää täydellistä kieliopillista ja semanttista analyysia, tärkeimpien tietojen tunnistamista ja niihin liittyvien parafaasien synteesiä (sukupolvi). Hankkeen teollinen kumppani – National Information Agency LETA – älykäs automaattinen yhteenveto on välttämätön tiedotusvälineiden seurannassa, kun taas tieteellinen kumppani UL MII – on huomattava kokemus semanttisesta edistyksestä ja selityksin varustettujen kieliresurssien kehittämisestä. Hankkeessa luodaan monikerroksisia semanttisia semanttisia semanttisia kieliresursseja, joissa käytetään ja kehitetään monikielisiä edustustoja (AMR, PropBank, FrameNet, Universal Dependencies, Grammatical Framework, BabelNet, DBpedia). Tuloksena olevien resurssien käyttö osoitetaan kehittämällä älykkään tekstin yhteenvetoteknologian käsitteellinen prototyyppi, jonka potentiaalia arvioidaan sekä mediavalvonnan että Rougen ja muiden mittareiden avulla. Hankkeella edistetään merkittävästi latvian kielen automaattista ymmärtämistä ja tekstin kauppaa koskevaa tutkimusta ja innovointia. Tietokonekielet, kieliteknologiat, kieliresurssit, semantiikka, kieliopillinen analyysi, semanttinen analyysi, tekstitiivistelmät. Tämän monialaisen hankkeen yleisenä tavoitteena on kehittää tutkimusta ja innovointia kielten automaattisessa ymmärtämisessä ja kääntämisessä sekä vahvistaa latvian kielen teknistä tukea Euroopan monikielisillä digitaalisilla sisämarkkinoilla. Tätä varten hankkeen erityisenä tavoitteena on luoda uusi, perustavanlaatuinen monikerroksinen latvian kieliresurssi ja osoittaa näiden resurssien käyttömahdollisuudet uusien innovatiivisten teknologioiden kehittämisessä kielten ymmärtämistä ja TEXTRADE-sovelluksia varten. Hankkeen teollinen tutkimus toteutetaan ”Tietotekniikka- ja informaatiotieteet” (lomake 1.2) ja ”Kielit ja kirjallisuus” (lomake 6.2) mukaisesti. Hanke ei liity taloudelliseen toimintaan. Hanke on suunniteltu viidelle päätoimelle. Kolme ensimmäistä toimintoa liittyvät koneellisesti luettavien, syntaktisesti ja semanttisesti semanttisesti merkittyjen tekstikoteloiden luomiseen ja arviointiin. Neljäs on laajan tulkitsevan ja synonyymin sanakirjan virallistaminen ja integrointi semanttiseen avoimeen datapilveen. Virallisesta sanakirjasta on johdettu monikieliset laskennalliset sanakirjat, joita tarvitaan tekstikauppaan. Näitä tuloksia käytetään viidennessä toimessa, jossa kehitetään automaattisen abstraktioteknologian laboratorioprototyyppiä (TRL 4). Hanketta toteuttavat MII UL:n tekoälylaboratorion tutkijat – tietokonetieteilijät ja kielitieteilijät, mukaan lukien nuoret tutkijat ja tohtoriopiskelijat – yhteistyössä SIA LETAn tutkimuslaboratorioiden työntekijöiden kanssa. Kun otetaan huomioon SIA LETA:n osaaminen mediaseurannassa ja kokemus tutkimushankkeista, jotka liittyvät automaattiseen semanttiseen kielen analysointiin, tehdään yhteistyötä semanttisten semanttisten tietojen valmisteluun, koneoppimismenetelmien kehittämiseen ja tulosten arviointiin liittyvissä toimissa. Letan osaaminen on myös erittäin tärkeää käsitteellisen prototyypin määrittelyssä, kehittämisessä ja validoinnissa. Hankkeen toteuttaminen vahvistaa merkittävästi UL:n MII:n osaamista ja valmiuksia kieliresurssien ja -teknologioiden tutkimuksessa ja innovoinnissa sekä avaa uusia yhteistyömahdollisuuksia yritysten ja ulkomaisten tiedelaitosten kanssa. Yksi hankkeen tärkeimmistä käytännön tuloksista on avoimet tietoaineistot, joilla on suuri lisäarvo: 5 selityksin varustettuja tekstilaatikoita ja 5 laskennallista sanakonia. Toinen tärkein käytännön tulos – uuden kieliteknologian prototyyppi. Hankkeen kokonaiskustannukset ovat 649417.19 euroa, josta EAKR:n tukea on 550871,56 euroa. Hanke on suunniteltu toteutettavaksi 01.12.2016–31.11.2019. (Finnish)
    17 August 2022
    0 references
    Sommarju awtomatiku intelliġenti tat-test huwa tema topika fil-fehim tal-lingwa naturali (NLU) u l-kummerċ testwali (NLG). B’kuntrast mas-somma superfiċjali, fejn xi sentenzi informattivi jintgħażlu mit-test, is-sommarju intelliġenti jeħtieġ analiżi grammatikali u semantika sħiħa, l-identifikazzjoni tal-informazzjoni l-aktar importanti u s-sinteżi tal-parafrażijiet relatati (ġenerazzjoni). Is-sieħeb industrijali tal-proġett — l-Aġenzija Nazzjonali tal-Informazzjoni LETA — sommarju awtomatiku intelliġenti huwa meħtieġ għall-monitoraġġ tal-midja, filwaqt li l-imsieħeb xjentifiku — UL MII — għandu esperjenza konsiderevoli fl-analiżi semantika avvanzata u l-iżvilupp ta’ riżorsi lingwistiċi annotati. Il-proġett se joħloq riżorsi tal-lingwa Latvjana annotati semantiċi b’diversi saffi, bl-użu u l-iżvilupp ta’ rappreżentazzjonijiet multilingwi (AMR, PropBank, FrameNet, Dipendenzi Universali, Qafas Grammatiku, BabelNet, DBpedia). L-użu tar-riżorsi li jirriżultaw se jintwera bl-iżvilupp ta’ prototip kunċettwali ta’ test intelliġenti li jiġbor fil-qosor it-teknoloġija, li l-potenzjal tagħha se jiġi vvalutat kemm fil-kuntest tal-monitoraġġ tal-midja kif ukoll fl-użu ta’ Rouge u metriċi oħra. Il-proġett se jippromwovi b’mod sinifikanti r-riċerka u l-innovazzjoni fil-fehim awtomatiku u l-kummerċ tat-test tal-lingwa Latvjana. Il-kompjuter-lingwisti, it-teknoloġiji tal-lingwa, ir-riżorsi lingwistiċi, is-semantika leżika, l-analiżi grammatikali, l-analiżi semantika, it-test fil-qosor.L-għan ġenerali ta’ dan il-proġett interdixxiplinari huwa li jiżviluppa r-riċerka u l-innovazzjoni fil-fehim awtomatiku u t-traduzzjoni tal-lingwi, filwaqt li jsaħħaħ l-appoġġ teknoloġiku tal-lingwa Latvjana fis-suq uniku diġitali multilingwi Ewropew. Sabiex tiġi pprovduta l-bażi għal dan, l-għan speċifiku tal-proġett huwa l-ħolqien ta’ riżorsa ġdida u fundamentali b’diversi livelli tal-lingwa Latvjana u li jintwera l-potenzjal tal-użu ta’ dawn ir-riżorsi fl-iżvilupp ta’ teknoloġiji innovattivi ġodda għall-fehim lingwistiku u l-applikazzjonijiet TEXTRADE. Fil-proġett ir-riċerka industrijali se titwettaq skont l-oqsma tax-“Xjenzi tal-Kompjuter u tal-Informazzjoni” (FORD 1.2) u “Lingwi u litteratura” (FORD 6.2). Il-proġett mhuwiex relatat mal-attività ekonomika. Il-proġett huwa ppjanat għal ħames attivitajiet ewlenin. L-ewwel tliet attivitajiet huma relatati mal-ħolqien u l-evalwazzjoni ta’ djar testwali annotati b’mod sintattiku u li jinqara mill-magni. Ir-raba’ waħda hija l-formalizzazzjoni u l-integrazzjoni ta’ dizzjunarju interpretattiv u sinonimu kbir f’cloud semantiku ta’ data miftuħa konnessa mal-web. Mid-dizzjunarju formalizzat se jkun hemm lexicons komputazzjonali multilingwi derivati meħtieġa għall-kummerċ testwali. Dawn ir-riżultati se jintużaw fil-ħames azzjoni, l-iżvilupp tal-prototip tal-laboratorju tat-teknoloġija tal-astrazzjoni awtomatika (TRL 4). Il-proġett se jiġi implimentat mix-xjenzati tal-Laboratorju tal-Intelliġenza Artifiċjali MII UL — xjenzati tal-kompjuter u lingwisti, inklużi xjentisti żgħażagħ u studenti tad-dottorat — f’kooperazzjoni mal-impjegati tal-laboratorju tar-riċerka ta’ SIA LETA. B’kont meħud tal-kompetenza tas-SIA LETA fil-monitoraġġ tal-midja u l-esperjenza fi proġetti ta’ riċerka relatati mal-analiżi semantika awtomatika tal-lingwa, hija prevista kooperazzjoni f’attivitajiet relatati mat-tħejjija ta’ data annotata semantika, l-iżvilupp ta’ metodi ta’ tagħlim awtomatiku u l-evalwazzjoni tar-riżultati. Il-kompetenza tal-Leta hija wkoll importanti ħafna fid-definizzjoni, l-iżvilupp u l-validazzjoni tal-prototip kunċettwali. L-implimentazzjoni tal-proġett se ssaħħaħ b’mod sinifikanti l-kompetenza u l-kapaċità tal-MII tal-UL fir-riċerka u l-innovazzjoni tar-riżorsi u t-teknoloġiji tal-lingwa, u se tiftaħ opportunitajiet ġodda għall-kooperazzjoni man-negozju u l-istituzzjonijiet xjentifiċi barranin. Wieħed mir-riżultati prattiċi ewlenin tal-proġett se jkun settijiet ta’ dejta miftuħa b’valur miżjud għoli: 5 kaxxi test annotati u 5 lexicons komputazzjonali. It-tieni riżultat prattiku ewlieni — prototip ta’ teknoloġija lingwistika ġdida. L-ispiża totali tal-proġett hija ta’ EUR 649417.19, li minnhom EUR 550871.56 huma appoġġ mill-FEŻR. Il-proġett huwa ppjanat li jiġi implimentat mill-01.12.2016 sal-31.11.2019. (Maltese)
    17 August 2022
    0 references
    Inteligentné automatické zhrnutie textu je aktuálnou témou v chápaní prirodzeného jazyka (NLU) a textového obchodu (NLG). Na rozdiel od povrchného súčtu, kde sa z textu vyberú niektoré informatívne vety, inteligentné zhrnutie vyžaduje úplnú gramatickú a sémantickú analýzu, identifikáciu najdôležitejších informácií a syntézu súvisiacich parafráz (generácie). Priemyselný partner projektu – Národná informačná agentúra LETA – inteligentné automatické zhrnutie je potrebné na monitorovanie médií, zatiaľ čo vedecký partner – UL MII – má značné skúsenosti s pokročilou sémanickou analýzou a vývojom anotovaných jazykových zdrojov. Projekt vytvorí viacvrstvové sémantické anotované lotyšské jazykové zdroje s využitím a rozvojom viacjazyčných reprezentácií (AMR, PropBank, FrameNet, Universal Dependencies, Grammatical Framework, BabelNet, DBpedia). Využitie výsledných zdrojov sa preukáže vypracovaním koncepčného prototypu inteligentnej technológie sumarizácie textu, ktorého potenciál sa bude posudzovať v kontexte monitorovania médií, ako aj pomocou Rouge a iných ukazovateľov. Projekt výrazne podporí výskum a inovácie v oblasti automatického pochopenia lotyšského jazyka a obchodu s textom. Počítačovo-lingvistika, jazykové technológie, jazykové zdroje, lexikálna sémantika, gramatická analýza, sémantická analýza, zhrnutie textu.Všeobecným cieľom tohto interdisciplinárneho projektu je rozvíjať výskum a inovácie v oblasti automatického porozumenia a prekladu jazykov, posilniť technologickú podporu lotyšského jazyka na európskom viacjazyčnom jednotnom digitálnom trhu. Špecifickým cieľom projektu je vytvoriť nový, základný viacvrstvový súbor lotyšských jazykových zdrojov a preukázať potenciál využitia týchto zdrojov pri vývoji nových inovačných technológií pre jazykové porozumenie a aplikácie TEXTRADE.V rámci projektu sa bude priemyselný výskum vykonávať v súlade s oblasťami „Počítačové a informačné vedy“ (FORD 1.2) a „Jazyky a literatúra“ (FORD 6.2). Projekt nesúvisí s hospodárskou činnosťou. Projekt je plánovaný na päť hlavných činností. Prvé tri činnosti súvisia s vytváraním a hodnotením strojovo čitateľných, syntakticky a sémantikálne anotovaných textových puzdier. Štvrtým je formalizácia a integrácia veľkého interpretačného a synonymného slovníka do sémantického webového cloudu s otvorenými dátami. Z formalizovaného slovníka budú odvodené viacjazyčné výpočtové lexikóny potrebné pre textový obchod. Tieto výsledky budú použité v piatej akcii, vývoj laboratórneho prototypu automatickej abstrakcie technológie (TRL 4).Projekt bude realizovaný v spolupráci s pracovníkmi laboratória MII UL umelá inteligencia – počítačoví vedci a lingvisti, vrátane mladých vedcov a doktorandov – v spolupráci so zamestnancami výskumného laboratória SIA LETA. Vzhľadom na kompetencie SIA LETA v oblasti monitorovania médií a skúseností s výskumnými projektmi týkajúcimi sa automatickej sémantickej analýzy jazyka sa predpokladá spolupráca v činnostiach súvisiacich s prípravou sémantických anotovaných údajov, vývojom metód strojového učenia a hodnotením výsledkov. Spôsobilosť Lety je tiež veľmi dôležitá pri definovaní, vývoji a validácii koncepčného prototypu. Vykonávanie projektu výrazne posilní kompetenciu a kapacitu MII UL v oblasti výskumu a inovácie jazykových zdrojov a technológií a otvorí nové príležitosti pre spoluprácu s podnikateľskými a zahraničnými vedeckými inštitúciami. Jedným z hlavných praktických výsledkov projektu budú otvorené súbory údajov s vysokou pridanou hodnotou: 5 anotovaných textových polí a 5 výpočtových lexikónov. Druhý hlavný praktický výsledok – prototyp novej jazykovej technológie. Celkové náklady projektu sú 649 417,19 EUR, z čoho 550 871,56 EUR je podpora z EFRR. Projekt sa má realizovať od 01.12.2016 do 31.11.2019. (Slovak)
    17 August 2022
    0 references
    Is téama tráthúil é achoimre chliste uathoibríoch ar an téacs chun teanga nádúrtha (NLU) agus texttrade (NLG) a thuiscint. I gcodarsnacht le suimiú superficial, áit a roghnaítear roinnt abairtí faisnéiseacha as an téacs, éilíonn achoimre chliste anailís ghramadaí agus shéimeantach iomlán, sainaithint na faisnéise is tábhachtaí agus sintéis na parafrásaí gaolmhara (giniúint). Tá gá le hachoimre uathoibríoch chliste an tionscadail — an Ghníomhaireacht Náisiúnta Faisnéise LETA — chun faireachán a dhéanamh ar na meáin, agus tá taithí shuntasach ag an gcomhpháirtí eolaíochta — UL MII — ar ardanailís shéimeantach agus ar fhorbairt acmhainní teanga anótáilte. Cruthóidh an tionscadal acmhainní teanga séimeantacha anótáilte ilséimeantacha, ag úsáid agus ag forbairt léirithe ilteangacha (AMR, PropBank, FrameNet, Spleáchríocha Uilíoch, Creat Grammatical, BabelNet, DBpedia). Léireofar úsáid na n-acmhainní a eascraíonn as sin trí fhréamhshamhail choincheapúil a fhorbairt de théacs cliste ina ndéanfar achoimre ar theicneolaíocht, a ndéanfar measúnú ar a hacmhainneacht i gcomhthéacs faireachán a dhéanamh ar na meáin agus úsáid a bhaint as Rouge agus méadracht eile. Cuirfidh an tionscadal taighde agus nuálaíocht chun cinn go suntasach i dtuiscint uathoibríoch agus i dtéacsthrádáil na Laitvise. Teicneolaíochtaí ríomhaireachta, teicneolaíochtaí teanga, acmhainní teanga, séimeantaic foclóireachta, anailís ghramadaí, anailís shéimeantach, achoimre ar théacs.Is é cuspóir ginearálta an tionscadail idirdhisciplíneaigh seo taighde agus nuálaíocht a fhorbairt maidir le teangacha a thuiscint agus a aistriú go huathoibríoch, agus tacaíocht theicneolaíoch na Laitvise a neartú i margadh aonair digiteach ilteangach na hEorpa. Chun bonn a chur faoin méid sin, is é aidhm shonrach an tionscadail acmhainn teanga nua ilsrathach Laitvise a chruthú agus an acmhainneacht a bhaineann le húsáid na n-acmhainní sin a léiriú i bhforbairt teicneolaíochtaí nuálacha nua le haghaidh tuiscint teanga agus feidhmchláir téacs.Sa tionscadal déanfar taighde tionsclaíoch i gcomhréir leis na réimsí “Eolaíochtaí ríomhaireachta agus faisnéise” (FORD 1.2) agus “Teangacha agus litríochta” (FORD 6.2). Níl baint ag an tionscadal le gníomhaíocht eacnamaíoch.Tá an tionscadal beartaithe le haghaidh cúig phríomhghníomhaíocht. Baineann na chéad trí ghníomhaíocht le cásálacha téacs atá inléite ag meaisín, go siontactúil agus go séimeantach a chruthú agus a mheas. Is é an ceathrú ceann ná foclóir mór léirmhínitheach agus comhchiallach a chur ar bhonn foirmiúil agus a chomhtháthú i scamall sonraí oscailte atá nasctha leis an ngréasán. Ón bhfoclóir foirmeálta a dhíorthaítear foclóir ríomhaireachta ilteangach ag teastáil le haghaidh texttrade. Bainfear úsáid as na torthaí sin sa chúigiú gníomh, lena bhforbrófar fréamhshamhail saotharlainne na teicneolaíochta teibí uathoibríocha (TRL 4). Cuirfidh eolaithe Shaotharlann MII UL Intleacht Shaorga — eolaithe ríomhaireachta agus teangeolaithe, lena n-áirítear eolaithe óga agus mic léinn dochtúireachta — an tionscadal chun feidhme i gcomhar le fostaithe saotharlainne taighde SIA LETA. Agus inniúlacht SIA LETA á cur san áireamh maidir le faireachán a dhéanamh ar na meáin agus taithí a fháil ar thionscadail taighde a bhaineann le hanailís shéimeantach uathoibríoch ar theanga, tá comhar beartaithe i ngníomhaíochtaí a bhaineann le sonraí anótáilte séimeantacha a ullmhú, modhanna meaisínfhoghlama a fhorbairt agus meastóireacht a dhéanamh ar thorthaí. Tá inniúlacht Leta an-tábhachtach freisin maidir leis an fréamhshamhail choincheapúil a shainiú, a fhorbairt agus a bhailíochtú.Déanfaidh cur chun feidhme an tionscadail inniúlacht agus cumas MII Ollscoil Luimnigh a neartú go suntasach i dtaighde agus i nuálaíocht acmhainní agus teicneolaíochtaí teanga, agus cuirfidh sé deiseanna nua ar fáil le haghaidh comhair le hinstitiúidí gnó agus eachtracha eolaíochta. Ar cheann de phríomhthorthaí praiticiúla an tionscadail beidh tacair sonraí oscailte a bhfuil breisluach ard ag baint leo: 5 boscaí téacs anótáilte agus 5 lexicons ríomhaireachtúil. Is é an dara príomhthoradh praiticiúil — fréamhshamhail de theicneolaíocht nua teanga.Is é costas iomlán an tionscadail ná EUR 649417.19, ar tacaíocht CFRE EUR 550871.56 de. Tá sé beartaithe an tionscadal a chur i bhfeidhm ón 01.12.2016 go dtí an 31.11.2019. (Irish)
    17 August 2022
    0 references
    Inteligentní automatické shrnutí textu je aktuální téma v pochopení přirozeného jazyka (NLU) a texttrade (NLG). Na rozdíl od povrchního shrnutí, kde jsou z textu vybrány některé informativní věty, inteligentní shrnutí vyžaduje úplnou gramatickou a sémantickou analýzu, identifikaci nejdůležitějších informací a syntézu souvisejících parafrází (generace). Průmyslový partner projektu – Národní informační agentura LETA – inteligentní automatické shrnutí je nezbytné pro monitorování médií, zatímco vědecký partner – UL MII – má značné zkušenosti s pokročilou sémantickou analýzou a vývojem komentovaných jazykových zdrojů. Projekt vytvoří vícevrstvé sémantické anotované lotyšské jazykové zdroje s využitím a vývojem vícejazyčných reprezentací (AMR, PropBank, FrameNet, Universal Dependencies, Grammatical Framework, BabelNet, DBpedia). Využití výsledných zdrojů bude prokázáno vypracováním koncepčního prototypu technologie inteligentního textu, jejíž potenciál bude posuzován jak v souvislosti s monitorováním médií, tak s využitím Rouge a dalších měřítek. Projekt významně podpoří výzkum a inovace v oblasti automatického porozumění lotyšskému jazyku a textového obchodu s ním. Počítač-lingvistika, jazykové technologie, jazykové zdroje, lexikální sémantika, gramatická analýza, sémantická analýza, shrnutí textu. Obecným cílem tohoto interdisciplinárního projektu je rozvíjet výzkum a inovace v oblasti automatického porozumění a překladu jazyků, posílit technologickou podporu lotyšského jazyka na evropském mnohojazyčném jednotném digitálním trhu. Konkrétním cílem projektu je vytvořit nový, základní vícevrstvý lotyšský jazykový zdroj a demonstrovat potenciál využití těchto zdrojů při vývoji nových inovativních technologií pro jazykové znalosti a aplikace TEXTRADE.V rámci projektu bude průmyslový výzkum prováděn v souladu s obory „počítačové a informační vědy“ (FORD 1.2) a „Jazyky a literatura“ (FORD 6.2). Projekt nesouvisí s hospodářskou činností. Projekt je plánován na pět hlavních činností. První tři činnosti se týkají vytváření a vyhodnocování strojově čitelných, syntakticky a sémanticky komentovaných textových krytů. Čtvrtým je formalizace a integrace velkého interpretačního a synonymního slovníku do sémantického webového cloudu otevřených dat. Z formalizovaného slovníku budou odvozeny vícejazyčné výpočetní lexikony potřebné pro texttrade. Tyto výsledky budou využity v páté akci, vývoj laboratorního prototypu automatické abstrakce technologie (TRL 4).Projekt bude realizován vědci MII UL Artificial Intelligence Laboratory – počítačoví vědci a lingvisté, včetně mladých vědců a doktorandů – ve spolupráci s pracovníky výzkumné laboratoře SIA LETA. S ohledem na způsobilost SIA LETA v oblasti monitorování médií a zkušeností ve výzkumných projektech souvisejících s automatickou sémantickou analýzou jazyka se předpokládá spolupráce při činnostech souvisejících s přípravou sémantických anotovaných dat, vývojem metod strojového učení a vyhodnocováním výsledků. Schopnost Lety je také velmi důležitá při definování, vývoji a validaci koncepčního prototypu.Provádění projektu významně posílí kompetence a kapacitu MII UL v oblasti výzkumu a inovací jazykových zdrojů a technologií a otevře nové příležitosti pro spolupráci s obchodními a zahraničními vědeckými institucemi. Jedním z hlavních praktických výsledků projektu budou otevřené datové soubory s vysokou přidanou hodnotou: 5 komentovaných textových polí a 5 výpočetních lexikonů. Druhý hlavní praktický výsledek – prototyp nové jazykové technologie.Celkové náklady na projekt jsou 649 417,19 EUR, z toho 550 871,56 EUR je podpora z EFRR. Projekt má být realizován od 01.12.2016 do 31.11.2019. (Czech)
    17 August 2022
    0 references
    Resumo automático inteligente do texto é um tema tópico na compreensão da linguagem natural (NLU) e texttrade (NLG). Em contraste com a soma superficial, onde algumas frases informativas são selecionadas do texto, o resumo inteligente requer análise gramatical e semântica completa, identificação das informações mais importantes e síntese de paráfrases relacionadas (geração). O parceiro industrial do projeto – a Agência Nacional de Informação LETA – é necessário um resumo automático inteligente para a monitorização dos meios de comunicação social, ao passo que o parceiro científico – UL MII – tem uma experiência considerável na análise semântica avançada e no desenvolvimento de recursos linguísticos anotados. O projeto criará recursos linguísticos letões semânticos anotados e multicamadas, utilizando e desenvolvendo representações multilingues (AMR, PropBank, FrameNet, Dependências Universais, Grammatical Framework, BabelNet, DBpedia). A utilização dos recursos resultantes será demonstrada através do desenvolvimento de um protótipo conceptual de tecnologia de síntese de texto inteligente, cujo potencial será avaliado tanto no contexto da monitorização dos meios de comunicação social como da utilização do Rouge e de outras métricas. O projeto promoverá significativamente a investigação e a inovação no domínio da compreensão automática e do comércio de textos da língua letã. Informática-linguística, tecnologias da linguagem, recursos linguísticos, semântica lexical, análise gramatical, análise semântica, síntese textual.O objetivo geral deste projeto interdisciplinar é desenvolver a investigação e a inovação na compreensão e tradução automáticas das línguas, reforçando o apoio tecnológico da língua letã no mercado único digital multilingue europeu. A fim de fornecer a base para isso, o objetivo específico do projeto é criar um novo conjunto fundamental de recursos linguísticos letões multicamadas e demonstrar o potencial da utilização desses recursos no desenvolvimento de novas tecnologias inovadoras para a compreensão linguística e aplicações textrade.No projeto, a investigação industrial será realizada em conformidade com os domínios das «Ciências da computação e da informação» (FORD 1.2) e das «Línguas e literatura» (FORD 6.2). O projeto não está relacionado com a atividade económica. O projeto está previsto para cinco atividades principais. As três primeiras atividades estão relacionadas à criação e avaliação de caixas de texto legíveis por máquina, sintaticamente e semânticas anotadas. O quarto é a formalização e integração de um grande dicionário interpretativo e sinónimo numa nuvem de dados aberta semântica ligada à Internet. A partir do dicionário formalizado serão derivados léxicos computacionais multilingues necessários para o comércio textual. Estes resultados serão utilizados na quinta ação, desenvolvendo o protótipo laboratorial da tecnologia de abstração automática (TRL 4). O projeto será executado pelos cientistas do Laboratório de Inteligência Artificial MII UL – cientistas informáticos e linguistas, incluindo jovens cientistas e estudantes de doutoramento – em cooperação com os funcionários do laboratório de investigação da SIA LETA. Tendo em conta a competência da SIA LETA em matéria de monitorização dos meios de comunicação social e a experiência em projetos de investigação relacionados com a análise semântica automática da linguagem, está prevista a cooperação em atividades relacionadas com a preparação de dados semânticos anotados, o desenvolvimento de métodos de aprendizagem automática e a avaliação dos resultados. A competência da LETA é também muito importante para definir, desenvolver e validar o protótipo conceptual. A execução do projeto reforçará significativamente a competência e a capacidade do MII da UL em investigação e inovação de recursos e tecnologias da linguagem e abrirá novas oportunidades de cooperação com empresas e instituições científicas estrangeiras. Um dos principais resultados práticos do projeto serão conjuntos de dados abertos com elevado valor acrescentado: 5 caixas de texto anotadas e 5 léxicos computacionais. O segundo principal resultado prático — um protótipo de nova tecnologia linguística. O custo total do projeto é de 649417,19 EUR, dos quais 550871,56 EUR são apoio do FEDER. Prevê-se que o projeto seja executado de 1.12.2016 a 31.11.2019. (Portuguese)
    17 August 2022
    0 references
    Nutikas automaatne kokkuvõte tekstist on aktuaalne teema mõista loomulikku keelt (NLU) ja texttrade (NLG). Erinevalt pealiskaudsest liitmisest, kus tekstist valitakse mõned informatiivsed laused, nõuab arukas kokkuvõte täielikku grammatilist ja semantilist analüüsi, kõige olulisema teabe kindlakstegemist ja seotud parafrasside sünteesi (generatsioon). Projekti tööstuspartner – riiklik infoagentuur LETA – nutikas automaatne kokkuvõte on vajalik meediaseireks, samas kui teaduspartneril UL MII on märkimisväärne kogemus täiustatud semantilise analüüsi ja selgitustega keeleressursside arendamise alal. Projektiga luuakse mitmekihilised semantilised selgitustega läti keele ressursid, kasutades ja arendades mitmekeelseid esindusi (AMR, PropBank, FrameNet, Universal Dependencies, Grammatical Framework, BabelNet, DBpedia). Sellest tulenevate ressursside kasutamist tõendatakse aruka tekstikokkuvõtte tehnoloogia kontseptuaalse prototüübi väljatöötamisega, mille potentsiaali hinnatakse nii meedia jälgimise kui ka Rouge’i ja muude mõõdikute abil. Projektiga edendatakse märkimisväärselt teadusuuringuid ja innovatsiooni läti keele automaatse mõistmise ja tekstikaubanduse valdkonnas. Arvuti-lingvistika, keeletehnoloogia, keeleressursid, leksikaalne semantika, grammatiline analüüs, semantiline analüüs, tekstikokkuvõte.Selle interdistsiplinaarse projekti üldeesmärk on arendada teadusuuringuid ja innovatsiooni keelte automaatse mõistmise ja tõlkimise valdkonnas, tugevdades läti keele tehnoloogilist tuge Euroopa mitmekeelsel digitaalsel ühtsel turul. Selle aluseks on projekti konkreetne eesmärk luua uus mitmekihiline läti keeleressurss ning näidata nende ressursside kasutamise potentsiaali uute uuenduslike tehnoloogiate väljatöötamisel keele mõistmiseks ja TEXTRADE rakendusteks.Projekti rakendusuuringud viiakse läbi vastavalt valdkondadele „Arvuti- ja infoteadused“ (FORD 1.2) ning „Keel ja kirjandus“ (FORD 6.2). Projekt ei ole seotud majandustegevusega. Projekt on kavandatud viieks põhitegevuseks. Esimesed kolm tegevust on seotud masinloetavate, süntaktiliselt ja semantiliselt selgitustega tekstikorpuste loomise ja hindamisega. Neljas on suure tõlgendava ja sünonüümi sõnastiku formaliseerimine ja integreerimine semantiliseks veebilingiga avatud andmepilveks. Ametlikust sõnastikust tuletatakse tekstikaubanduse jaoks vajalikud mitmekeelsed arvutuslikud leksikonid. Neid tulemusi kasutatakse viiendas meetmes, arendades automaatse abstraktsioonitehnoloogia labori prototüüpi (TRL 4). Projekti viivad ellu MII UL tehisintellekti labori teadlased – arvutiteadlased ja keeleteadlased, sealhulgas noored teadlased ja doktorandid – koostöös SIA LETA uurimislabori töötajatega. Võttes arvesse SIA LETA pädevust meediaseire alal ja kogemusi teadusprojektides, mis on seotud keele automaatse semantilise analüüsiga, nähakse ette koostöö semantiliste selgitustega andmete koostamise, masinõppe meetodite väljatöötamise ja tulemuste hindamise valdkonnas. Leta pädevus on väga oluline ka kontseptuaalse prototüübi määratlemisel, arendamisel ja valideerimisel. Projekti rakendamine tugevdab UL-i MII pädevust ja suutlikkust keeleressursside ja -tehnoloogiate teadusuuringutes ja innovatsioonis ning avab uusi võimalusi koostööks äri- ja välismaiste teadusasutustega. Projekti üks peamisi praktilisi tulemusi on suure lisaväärtusega avatud andmekogud: 5 selgitustega tekstikasti ja 5 arvutuslikku leksikooni. Teine peamine praktiline tulemus – uue keeletehnoloogia prototüüp. Projekti kogumaksumus on 649417,19 eurot, millest 550871,56 eurot on ERFi toetus. Projekti rakendamine on kavandatud 1. detsembrist 2016 kuni 31. novembrini 2019. (Estonian)
    17 August 2022
    0 references
    A szöveg intelligens automatikus összefoglalása aktuális téma a természetes nyelv (NLU) és a texttrade (NLG) megértésében. A felületi összefoglalással ellentétben, ahol néhány informatív mondatot kiválasztanak a szövegből, az intelligens összefoglaló teljes nyelvtani és szemantikai elemzést igényel, a legfontosabb információk azonosítását és a kapcsolódó parafrázisok szintézisét (generáció). A projekt ipari partnere – a LETA Nemzeti Információs Ügynökség – intelligens automatikus összefoglaló szükséges a médiafigyeléshez, míg a tudományos partner – az UL MII – jelentős tapasztalattal rendelkezik a fejlett szemantikai elemzés és az annotált nyelvi erőforrások fejlesztése terén. A projekt többrétegű szemantikai jegyzetekkel ellátott lett nyelvi erőforrásokat hoz létre, többnyelvű képviseletek felhasználásával és fejlesztésével (AMR, PropBank, FrameNet, Universal Dependencies, Grammatical Framework, BabelNet, DBpedia). Az így kapott erőforrások felhasználását az intelligens szövegösszefoglaló technológia koncepcionális prototípusának kidolgozásával fogják bizonyítani, amelynek potenciálját mind a médiafigyelés, mind a Rouge és más mérőszámok segítségével értékelik. A projekt jelentős mértékben előmozdítja a lett nyelv automatikus megértésével és szövegkereskedelmével kapcsolatos kutatást és innovációt. Számítógép-nyelvész, nyelvi technológiák, nyelvi források, lexikai szemantika, nyelvtani elemzés, szemantikai elemzés, szövegösszefoglaló.Az interdiszciplináris projekt általános célja a nyelvek automatikus megértése és fordítása terén folytatott kutatás és innováció fejlesztése, a lett nyelv technológiai támogatásának erősítése az európai többnyelvű digitális egységes piacon. Ennek megalapozása érdekében a projekt konkrét célja egy új, alapvető, többrétegű lett nyelvi erőforrás létrehozása, valamint ezen erőforrásoknak a nyelvi megértést és a TEXTRADE alkalmazásokat szolgáló új innovatív technológiák kifejlesztésében rejlő potenciáljának bemutatása.A projektben az ipari kutatást a „Számítógép- és információtudományok” (FORD 1.2) és a „Nyelvek és irodalom” (6.2. számú dokumentum) területekkel összhangban végzik. A projekt nem kapcsolódik a gazdasági tevékenységhez.A projektet öt fő tevékenységre tervezik. Az első három tevékenység a géppel olvasható, szintaktikai és szemantikailag magyarázó szövegházak létrehozásához és értékeléséhez kapcsolódik. A negyedik egy nagy értelmező és szinonim szótár formalizálása és integrálása egy szemantikus webes nyílt adatfelhőbe. A formalizált szótár származik többnyelvű számítási lexikonok szükséges texttrade. Ezeket az eredményeket az ötödik fellépésben használják fel, az automatikus absztrakciós technológia laboratóriumi prototípusának kifejlesztésével (TRL 4).A projektet az MII UL Mesterséges Intelligencia Laboratórium tudósai – számítógépes tudósok és nyelvészek, köztük fiatal tudósok és doktori hallgatók – hajtják végre a SIA LETA kutatólaboratórium alkalmazottaival együttműködve. Figyelembe véve a SIA LETA-nak a médiafigyelés terén meglévő kompetenciáját és a nyelv automatikus szemantikai elemzésével kapcsolatos kutatási projektekben szerzett tapasztalatokat, együttműködést terveznek a szemantikai jegyzetekkel ellátott adatok előkészítésével, a gépi tanulási módszerek fejlesztésével és az eredmények értékelésével kapcsolatos tevékenységekben. Leta kompetenciája is nagyon fontos a fogalmi prototípus meghatározásában, fejlesztésében és validálásában.A projekt végrehajtása jelentősen megerősíti az UL’s MII kompetenciáját és kapacitását a nyelvi erőforrások és technológiák kutatásában és innovációjában, és új lehetőségeket nyit meg az üzleti és külföldi tudományos intézményekkel való együttműködésre. A projekt egyik fő gyakorlati eredménye a nagy hozzáadott értékkel bíró nyílt adatkészletek: 5 magyarázó jegyzetekkel ellátott szövegdobozok és 5 számítási lexikon. A második fő gyakorlati eredmény – az új nyelvi technológia prototípusa.A projekt összköltsége 649 417,19 EUR, amelyből 550 871,56 EUR ERFA-támogatás.A projekt végrehajtása 2016.12.01-től 2019.11.31-ig várható. (Hungarian)
    17 August 2022
    0 references
    Интелигентното автоматично резюме на текста е актуална тема в разбирането на естествения език (NLU) и текстовата търговия (NLG). За разлика от повърхностното сумиране, когато някои информативни изречения са избрани от текста, интелигентното резюме изисква пълен граматичен и семантичен анализ, идентифициране на най-важната информация и синтез на съответните парафрази (поколение). Индустриалният партньор на проекта — Национална информационна агенция LETA — интелигентно автоматично резюме е необходимо за медиен мониторинг, а научният партньор — UL MII — има значителен опит в напреднал семантичен анализ и разработване на анотирани езикови ресурси. Проектът ще създаде многопластови семантични анотирани латвийски езикови ресурси, като използва и развива многоезични представителства (AMR, PropBank, FrameNet, Universal Dependencies, Grammatical Framework, BabelNet, DBpedia). Използването на получените ресурси ще бъде демонстрирано чрез разработване на концептуален прототип на интелигентна текстова технология, обобщаваща технологията, чийто потенциал ще бъде оценен както в контекста на мониторинга на медиите, така и чрез използване на Rouge и други показатели. Проектът ще насърчи значително научните изследвания и иновациите в областта на автоматичното разбиране и текстовата търговия на латвийския език. Компютърно-лингвистика, езикови технологии, езикови ресурси, лексикална семантика, граматичен анализ, семантичен анализ, обобщаване на текста. Общата цел на този интердисциплинарен проект е да се развият научни изследвания и иновации в автоматичното разбиране и превод на езици, като се засили технологичната подкрепа на латвийския език в европейския многоезичен цифров единен пазар. За да се осигури основа за това, конкретната цел на проекта е да се създаде нов, фундаментален многопластов набор от латвийски език и да се демонстрира потенциалът на използването на тези ресурси за разработването на нови иновативни технологии за езиково разбиране и TEXTRADE приложения. В проекта индустриалните изследвания ще се извършват в съответствие с областите „Компютърни и информационни науки„(FORD 1.2) и „Езици и литература“ (FORD 6.2). Проектът не е свързан с икономическа дейност. Проектът е планиран за пет основни дейности. Първите три дейности са свързани със създаването и оценката на машинночетими, синтактически и семантично анотирани текстови корпуси. Четвъртият е формализирането и интегрирането на голям интерпретативен и синоним речник в семантичен уеб-свързан отворен облак от данни. От формализирания речник ще бъдат извлечени многоезични изчислителни лексикони, необходими за текстовата търговия. Тези резултати ще бъдат използвани в петото действие, като се разработи лабораторен прототип на технологията за автоматична абстракция (TRL 4). Проектът ще бъде реализиран от учените от лабораторията за изкуствен интелект MII UL — компютърни учени и лингвисти, включително млади учени и докторанти — в сътрудничество със служителите на научноизследователската лаборатория на SIA LETA. Предвид компетентността на SIA LETA в мониторинга на медиите и опита в изследователски проекти, свързани с автоматичния семантичен анализ на езика, се предвижда сътрудничество при дейности, свързани с изготвянето на семантични анотирани данни, разработване на методи за машинно самообучение и оценка на резултатите. Компетентността на Лета също е много важна при дефинирането, разработването и валидирането на концептуалния прототип. Изпълнението на проекта значително ще укрепи компетентността и капацитета на UL’s MII в областта на научните изследвания и иновациите на езиковите ресурси и технологии и ще открие нови възможности за сътрудничество с бизнес и чуждестранни научни институции. Един от основните практически резултати от проекта ще бъдат отворените набори от данни с висока добавена стойност: 5 анотирани текстови полета и 5 изчислителни лексикона. Вторият основен практически резултат — прототип на нови езикови технологии.Общата стойност на проекта е 649 417,19 EUR, от които 550 871,56 EUR е подкрепа от ЕФРР. Проектът е планиран да бъде реализиран от 01.12.2016 г. до 31.11.2019 г. (Bulgarian)
    17 August 2022
    0 references
    Išmanioji automatinė teksto santrauka yra aktuali tema, susijusi su natūralios kalbos (NLU) ir texttrade (NLG) supratimu. Priešingai nei paviršinio sumavimo atveju, kai iš teksto pasirenkami kai kurie informatyvieji sakiniai, išmaniajai santraukai reikalinga išsami gramatinė ir semantinė analizė, svarbiausios informacijos identifikavimas ir susijusių parafrazių (generacijos) sintezė. Projekto pramonės partneris – Nacionalinė informacijos agentūra LETA – išmanioji automatinė santrauka yra būtina žiniasklaidos stebėsenai, o mokslinis partneris – UL MII – turi didelę patirtį pažangios semantinės analizės ir anotuotų kalbos išteklių kūrimo srityje. Projektas sukurs daugiasluoksnius semantinius latvių kalbos išteklius, naudojant ir plėtojant daugiakalbes atstovybes (AMR, PropBank, FrameNet, Universal Dependencies, Grammatical Framework, BabelNet, DBpedia). Gautų išteklių panaudojimas bus įrodytas kuriant konceptualų pažangiojo teksto, apibendrinančio technologiją, prototipą, kurio potencialas bus vertinamas tiek žiniasklaidos stebėsenos, tiek „Rouge“ ir kitų parametrų srityse. Projektas labai paskatins mokslinius tyrimus ir inovacijas automatinio latvių kalbos supratimo ir teksto prekybos srityse. Kompiuteriniai-lingvistai, kalbos technologijos, kalbos ištekliai, leksinė semantika, gramatinė analizė, semantinė analizė, apibendrinantis tekstas. Bendras šio tarpdisciplininio projekto tikslas – plėtoti mokslinius tyrimus ir inovacijas automatinio kalbų supratimo ir vertimo srityje, stiprinant latvių kalbos technologinę paramą Europos daugiakalbėje bendrojoje skaitmeninėje rinkoje. Projekto tikslas – sukurti naują, fundamentalų daugiasluoksnį latvių kalbos išteklių rinkinį ir parodyti šių išteklių panaudojimo potencialą kuriant naujas inovatyvias kalbos supratimo technologijas ir TEXTRADE programas. Projekte pramoniniai tyrimai bus atliekami pagal „Kompiuterių ir informacinių mokslų“ (FORD 1.2) ir „Kalbų ir literatūros“ (FORD 6.2) sritis. Projektas nesusijęs su ekonomine veikla.Projektas planuojamas penkioms pagrindinėms veiklos rūšims. Pirmieji trys veiksmai yra susiję su mašininio nuskaitymo, sintaksės ir semantiškai anotuotų tekstinių korpusų kūrimu ir vertinimu. Ketvirtasis – tai didelio interpretacinio ir sinonimo žodyno formalizavimas ir integravimas į semantinį su internetu susietą atvirųjų duomenų debesį. Iš formalizuoto žodyno bus gaunami daugiakalbiai skaičiavimo žodynai, reikalingi texttrade. Šie rezultatai bus naudojami penktajame veiksme, kuriant automatinio abstrakcijos technologijos laboratorinį prototipą (TRL 4). Projektą įgyvendins MII UL Dirbtinio intelekto laboratorijos mokslininkai – kompiuterių mokslininkai ir lingvistai, įskaitant jaunus mokslininkus ir doktorantus – bendradarbiaujant su SIA LETA mokslinių tyrimų laboratorijos darbuotojais. Atsižvelgiant į SIA LETA kompetenciją žiniasklaidos stebėsenos srityje ir mokslinių tyrimų projektų, susijusių su automatine semantine kalbos analize, patirtį, numatomas bendradarbiavimas veikloje, susijusioje su semantinių anotuotų duomenų rengimu, mašininio mokymosi metodų kūrimu ir rezultatų vertinimu. Letos kompetencija taip pat yra labai svarbi apibrėžiant, plėtojant ir tvirtinant konceptualų prototipą. Projekto įgyvendinimas žymiai sustiprins UL MII kompetenciją ir gebėjimus kalbos išteklių ir technologijų mokslinių tyrimų ir inovacijų srityje, atvers naujas bendradarbiavimo su verslo ir užsienio mokslo institucijomis galimybes. Vienas iš pagrindinių praktinių projekto rezultatų bus atviri duomenų rinkiniai, turintys didelę pridėtinę vertę: 5 anotuoti teksto langeliai ir 5 skaičiavimo žodynai. Antrasis pagrindinis praktinis rezultatas – naujos kalbos technologijos prototipas. Bendros projekto išlaidos yra 649 417,19 EUR, iš kurių 550 871,56 EUR yra ERPF parama. Projektą planuojama įgyvendinti nuo 2016 12 01 iki 2019 11 31. (Lithuanian)
    17 August 2022
    0 references
    Pametni automatski sažetak teksta aktualna je tema u razumijevanju prirodnog jezika (NLU) i texttrade (NLG). Za razliku od površnog zbroja, gdje su neke informativne rečenice odabrane iz teksta, pametni sažetak zahtijeva potpunu gramatičku i semantičku analizu, identifikaciju najvažnijih informacija i sintezu povezanih parafraza (generaciju). Industrijski partner projekta – Nacionalna informacijska agencija LETA – pametni automatski sažetak potreban je za praćenje medija, dok znanstveni partner – UL MII – ima veliko iskustvo u naprednoj semantičkoj analizi i razvoju jezičnih resursa s komentarima. Projekt će stvoriti višeslojne semantičke resurse latvijskog jezika s komentarima, koristeći i razvijajući višejezične reprezentacije (AMR, PropBank, FrameNet, Universal Dependencies, Gramatical Framework, BabelNet, DBpedia). Upotreba dobivenih resursa pokazat će se razvojem konceptualnog prototipa tehnologije za sažimanje pametnog teksta, čiji će se potencijal procijeniti i u kontekstu praćenja medija i upotrebe sustava Rouge i drugih mjernih podataka. Projektom će se znatno promicati istraživanje i inovacije u automatskom razumijevanju i trgovini tekstom latvijskog jezika. Računalno-lingvistika, jezične tehnologije, jezični resursi, leksička semantika, gramatička analiza, semantička analiza, sažetak teksta. Opći je cilj ovog interdisciplinarnog projekta razviti istraživanje i inovacije u automatskom razumijevanju i prevođenju jezika, jačajući tehnološku podršku latvijskom jeziku na europskom višejezičnom jedinstvenom digitalnom tržištu. Kako bi se osigurala osnova za to, poseban cilj projekta je stvoriti novi, temeljni višeslojni latvijski jezični skup i pokazati potencijal korištenja tih resursa u razvoju novih inovativnih tehnologija za razumijevanje jezika i aplikacija TEXTRADE. U projektu će se provoditi industrijska istraživanja u skladu s područjima „Računalna i informacijska znanost” (FORD 1.2) i „Jezik i književnost” (FORD 6.2). Projekt nije povezan s gospodarskom aktivnošću. Projekt je planiran za pet glavnih aktivnosti. Prve tri aktivnosti odnose se na stvaranje i evaluaciju strojno čitljivih, sintaktičkih i semantički označenih kućišta teksta. Četvrti je formalizacija i integracija velikog rječnika za tumačenje i sinonim u semantički internetski oblak otvorenih podataka. Iz formaliziranog rječnika izvodit će se višejezične računalne leksikone potrebne za texttrade. Ti će se rezultati koristiti u petoj akciji, razvoju laboratorijskog prototipa tehnologije automatske apstrakcije (TRL 4).Projekt će provoditi znanstvenici MII UL laboratorija za umjetnu inteligenciju – računalni znanstvenici i lingvisti, uključujući mlade znanstvenike i doktorske studente – u suradnji s djelatnicima istraživačkog laboratorija SIA LETA. Uzimajući u obzir stručnost SIA LETA-e u praćenju medija i iskustvo u istraživačkim projektima povezanima s automatskom semantičkom analizom jezika, predviđena je suradnja u aktivnostima koje se odnose na pripremu semantičkih podataka s komentarima, razvoj metoda strojnog učenja i evaluaciju rezultata. Leta je također vrlo važna u definiranju, razvoju i vrednovanju konceptualnog prototipa.Provedba projekta značajno će ojačati kompetencije i kapacitete UL-ova MII u istraživanju i inovacijama jezičnih resursa i tehnologija, te će otvoriti nove mogućnosti za suradnju s poslovnim i stranim znanstvenim institucijama. Jedan od glavnih praktičnih rezultata projekta bit će otvoreni skupovi podataka s visokom dodanom vrijednošću: 5 tekstnih okvira s komentarima i 5 računalnih leksikona. Drugi glavni praktični rezultat – prototip nove jezične tehnologije.Ukupan trošak projekta iznosi 649 417,19 EUR, od čega je 550 871,56 EUR potpora EFRR-a. Projekt se planira provesti od 01.12.2016. do 31.11.2019. (Croatian)
    17 August 2022
    0 references
    Smart automatisk sammanfattning av texten är ett aktuellt tema för att förstå naturligt språk (NLU) och texthandel (NLG). I motsats till ytlig summering, där vissa informativa meningar väljs från texten, kräver smart sammanfattning fullständig grammatisk och semantisk analys, identifiering av den viktigaste informationen och syntesen av relaterade parafraser (generation). Den industriella partnern i projektet – den nationella informationsbyrån LETA – är nödvändig för medieövervakning, medan den vetenskapliga partnern – UL MII – har stor erfarenhet av avancerad semantisk analys och utveckling av kommenterade språkresurser. Projektet kommer att skapa mångskiktade semantiska kommenterade lettiska språkresurser med användning och utveckling av flerspråkiga representationer (AMR, PropBank, FrameNet, Universal Dependencies, Grammatical Framework, BabelNet, DBpedia). Användningen av de resulterande resurserna kommer att demonstreras genom utveckling av en konceptuell prototyp av smart textsammanfattande teknik, vars potential kommer att bedömas både i samband med medieövervakning och med hjälp av Rouge och andra mått. Projektet kommer i hög grad att främja forskning och innovation när det gäller automatisk förståelse och texthandel av det lettiska språket. Datalingvistik, språkteknik, språkresurser, lexikal semantik, grammatisk analys, semantisk analys, textsammanfattning.Det allmänna målet för detta tvärvetenskapliga projekt är att utveckla forskning och innovation när det gäller automatisk förståelse och översättning av språk, och att stärka det lettiska språkets tekniska stöd på den europeiska flerspråkiga digitala inre marknaden. För att ligga till grund för detta är projektets särskilda mål att skapa en ny, grundläggande uppsättning lettiska språkresurser på flera nivåer och att visa på potentialen i användningen av dessa resurser i utvecklingen av ny innovativ teknik för språkförståelse och TEXTRADE-tillämpningar.I projektet kommer industriell forskning att genomföras i enlighet med områdena ”Dator- och informationsvetenskap” (FORD 1.2) och ”Languages och litteratur” (FORD 6.2). Projektet är inte relaterat till ekonomisk verksamhet.Projektet är planerat för fem huvudsakliga aktiviteter. De tre första verksamheterna avser skapande och utvärdering av maskinläsbara, syntaktiska och semantiskt kommenterade texthöljen. Den fjärde är formaliseringen och integreringen av en stor tolknings- och synonymordbok i ett semantiskt webblänkat öppet datamoln. Från den formaliserade ordboken kommer att härledas flerspråkiga beräkningslexikon som krävs för texthandel. Dessa resultat kommer att användas i den femte åtgärden, utveckla laboratorieprototypen av automatisk abstraktion teknik (TRL 4).Projektet kommer att genomföras av forskarna vid MII UL Artificial Intelligence Laboratory – dataforskare och lingvister, inklusive unga forskare och doktorander – i samarbete med forskningslaboratoriets anställda vid SIA LETA. Med beaktande av SIA LETA:s kompetens inom medieövervakning och erfarenhet av forskningsprojekt som rör automatisk semantisk språkanalys planeras samarbete inom verksamhet som rör utarbetande av semantiska kommenterade data, utveckling av maskininlärningsmetoder och utvärdering av resultat. Letas kompetens är också mycket viktig för att definiera, utveckla och validera den konceptuella prototypen. Genomförandet av projektet kommer att avsevärt stärka kompetensen och kapaciteten hos UL:s MII inom forskning och innovation av språkresurser och teknik, och kommer att öppna nya möjligheter till samarbete med företag och utländska vetenskapliga institutioner. Ett av de viktigaste praktiska resultaten av projektet är öppna datamängder med stort mervärde: 5 kommenterade textrutor och 5 beräkningslexikon. Det andra huvudsakliga praktiska resultatet – en prototyp av ny språkteknik.Den totala kostnaden för projektet är 649 417,19 EUR, varav 550 871,56 EUR är Eruf-stöd.Projektet planeras genomföras från och med den 1 december 2016 till och med den 31 november 2019. (Swedish)
    17 August 2022
    0 references
    Rezumatul automat inteligent al textului este o temă de actualitate în înțelegerea limbajului natural (NLU) și a texttradei (NLG). Spre deosebire de însumarea superficială, în cazul în care unele propoziții informative sunt selectate din text, rezumatul inteligent necesită o analiză gramaticală și semantică completă, identificarea celor mai importante informații și sinteza parafrazelor conexe (generație). Partenerul industrial al proiectului – Agenția Națională de Informare LETA – rezumat automat inteligent este necesar pentru monitorizarea mass-media, în timp ce partenerul științific – UL MII – are o experiență considerabilă în analiza semantică avansată și dezvoltarea resurselor lingvistice adnotate. Proiectul va crea resurse semantice semantice adnotate pe mai multe niveluri în limba letonă, utilizând și dezvoltând reprezentări multilingve (AMR, PropBank, FrameNet, Dependențele universale, Cadrul Grammatic, BabelNet, DBpedia). Utilizarea resurselor rezultate va fi demonstrată prin dezvoltarea unui prototip conceptual de tehnologie de sinteză a textului inteligent, al cărui potențial va fi evaluat atât în contextul monitorizării mass-mediei, cât și prin utilizarea Rouge și a altor indicatori. Proiectul va promova în mod semnificativ cercetarea și inovarea în ceea ce privește înțelegerea automată și comerțul cu text al limbii letone. Informatică-lingvistică, tehnologii lingvistice, resurse lingvistice, semantică lexicală, analiză gramaticală, analiză semantică, rezumat al textului. Obiectivul general al acestui proiect interdisciplinar este de a dezvolta cercetarea și inovarea în ceea ce privește înțelegerea și traducerea automată a limbilor, consolidând sprijinul tehnologic al limbii letone în cadrul pieței unice digitale multilingve europene. Pentru a oferi baza pentru aceasta, scopul specific al proiectului este acela de a crea un nou set fundamental de resurse lingvistice letone pe mai multe niveluri și de a demonstra potențialul utilizării acestor resurse în dezvoltarea de noi tehnologii inovatoare pentru înțelegerea limbilor străine și aplicații TEXTRADE. În cadrul proiectului, cercetarea industrială se va desfășura în conformitate cu domeniile „Științele calculatoarelor și ale informației” (FORD 1.2) și „Limbi și literatură” (FORD 6.2). Proiectul nu are legătură cu activitatea economică. Proiectul este planificat pentru cinci activități principale. Primele trei activități sunt legate de crearea și evaluarea carcaselor de text care pot fi citite automat, sintactic și semantic. Al patrulea este formalizarea și integrarea unui mare dicționar interpretativ și sinonim într-un cloud de date deschis semantic conectat la internet. Din dicționarul formalizat vor fi derivate lexicons computațional multilingv necesare pentru texttrade. Aceste rezultate vor fi utilizate în cea de-a cincea acțiune, dezvoltând prototipul de laborator al tehnologiei de captare automată (TRL 4). Proiectul va fi implementat de oamenii de știință ai Laboratorului de Inteligență Artificială MII UL – informaticieni și lingviști, inclusiv tineri oameni de știință și doctoranzi – în cooperare cu angajații laboratorului de cercetare al SIA LETA. Având în vedere competența SIA LETA în ceea ce privește monitorizarea mass-mediei și experiența în proiecte de cercetare legate de analiza semantică automată a limbajului, cooperarea este avută în vedere în cadrul activităților legate de pregătirea datelor adnotate semantice, de dezvoltarea de metode de învățare automată și de evaluarea rezultatelor. Competența Leta este, de asemenea, foarte importantă în definirea, dezvoltarea și validarea prototipului conceptual.Implementarea proiectului va consolida în mod semnificativ competența și capacitatea MII ale UL în cercetarea și inovarea resurselor lingvistice și a tehnologiilor și va deschide noi oportunități de cooperare cu instituțiile științifice străine și de afaceri. Unul dintre principalele rezultate practice ale proiectului va fi seturile de date deschise cu valoare adăugată ridicată: 5 casete de text adnotate și 5 lexiconi computaționali. Al doilea rezultat practic principal – un prototip al noii tehnologii lingvistice. Costul total al proiectului este de 649 417,19 EUR, din care 550 871,56 EUR reprezintă sprijin din partea FEDR. Proiectul este planificat să fie implementat în perioada 01.12.2016-31.11.2019. (Romanian)
    17 August 2022
    0 references
    Pametni samodejni povzetek besedila je aktualna tema v razumevanju naravnega jezika (NLU) in texttrade (NLG). V nasprotju s površinskim povzetkom, kjer so nekateri informativni stavki izbrani iz besedila, pametni povzetek zahteva popolno slovnično in semantično analizo, identifikacijo najpomembnejših informacij in sintezo povezanih parafraz (generacija). Industrijski partner projekta – Nacionalna informacijska agencija LETA – pametni samodejni povzetek je potreben za spremljanje medijev, znanstveni partner – UL MII – pa ima bogate izkušnje z napredno semantično analizo in razvojem obrazloženih jezikovnih virov. Projekt bo ustvaril večplastne semantične obrazložene latvijske jezikovne vire z uporabo in razvojem večjezičnih predstavitev (AMR, PropBank, FrameNet, Universal Dependencies, Grammatical Framework, BabelNet, DBpedia). Uporaba pridobljenih virov bo prikazana z razvojem konceptualnega prototipa tehnologije pametnega besedila, ki povzema tehnologijo, katere potencial bo ocenjen tako v okviru spremljanja medijev kot tudi z uporabo Rouge in drugih meril. Projekt bo znatno spodbujal raziskave in inovacije na področju samodejnega razumevanja in izmenjave besedil latvijskega jezika. Računalniški jezik, jezikovne tehnologije, jezikovni viri, leksikalna semantika, slovnična analiza, semantična analiza, povzetek besedila. Splošni cilj tega interdisciplinarnega projekta je razviti raziskave in inovacije na področju avtomatičnega razumevanja in prevajanja jezikov ter okrepiti tehnološko podporo latvijskega jezika na evropskem večjezičnem enotnem digitalnem trgu. Da bi zagotovili podlago za to, je poseben cilj projekta ustvariti nov, temeljni nabor večplastnih latvijskih jezikovnih virov in prikazati potencial uporabe teh virov pri razvoju novih inovativnih tehnologij za razumevanje jezikov in aplikacij TEXTRADE.V projektu bodo industrijske raziskave izvedene v skladu s področjema „računalništvo in informacijske vede“ (FORD 1.2) in „Jeziki in literatura“ (FORD 6.2). Projekt ni povezan z gospodarsko dejavnostjo.Projekt je načrtovan za pet glavnih dejavnosti. Prve tri dejavnosti so povezane z ustvarjanjem in ocenjevanjem strojno berljivih, sintaktično in semantično označenih besedilnih ohišij. Četrti je formalizacija in integracija velikega razlagalnega in sinonimnega slovarja v semantični spletni podatkovni oblak. Iz formaliziranega slovarja bodo izpeljani večjezični računski leksikoni, potrebni za tekstovno trgovino. Ti rezultati bodo uporabljeni v petem akciji, razvoj laboratorijskega prototipa avtomatske abstrakcije tehnologije (TRL 4).Projekt bodo izvajali znanstveniki laboratorija MII UL za umetno inteligenco – računalniški znanstveniki in jezikoslovci, vključno z mladimi znanstveniki in doktorskimi študenti – v sodelovanju z zaposlenimi v raziskovalnem laboratoriju SIA LETA. Ob upoštevanju sposobnosti SIA LETA na področju spremljanja medijev in izkušenj v raziskovalnih projektih, povezanih z avtomatsko semantično analizo jezika, je sodelovanje predvideno pri dejavnostih, povezanih s pripravo semantičnih podatkov, razvojem metod strojnega učenja in ocenjevanjem rezultatov. Sposobnost Lete je zelo pomembna tudi pri opredeljevanju, razvoju in validaciji konceptualnega prototipa. Izvajanje projekta bo bistveno okrepilo kompetence in zmogljivosti MII UL na področju raziskav in inovacij jezikovnih virov in tehnologij ter odprlo nove priložnosti za sodelovanje s poslovnimi in tujimi znanstvenimi ustanovami. Eden glavnih praktičnih rezultatov projekta bodo odprti nabori podatkov z visoko dodano vrednostjo: 5 označenih besedilnih polj in 5 računalniških leksikonov. Drugi glavni praktični rezultat – prototip nove jezikovne tehnologije.Skupni stroški projekta znašajo 649 417,19 EUR, od tega je 550 871,56 EUR podpora ESRR. Projekt naj bi se izvajal od 1. 12. 2016 do 31.11.2019. (Slovenian)
    17 August 2022
    0 references
    Inteligentne automatyczne podsumowanie tekstu jest tematem aktualnym w zrozumieniu języka naturalnego (NLU) i texttrade (NLG). W przeciwieństwie do powierzchownego podsumowania, w którym niektóre zdania informacyjne są wybierane z tekstu, inteligentne podsumowanie wymaga pełnej analizy gramatycznej i semantycznej, identyfikacji najważniejszych informacji i syntezy powiązanych parafraz (generacji). Partner przemysłowy projektu – Krajowa Agencja Informacyjna LETA – inteligentne automatyczne podsumowanie jest niezbędne do monitorowania mediów, natomiast partner naukowy – UL MII – ma duże doświadczenie w zaawansowanej analizie semantycznej i rozwoju zasobów języka adnotowanego. W ramach projektu powstanie wielowarstwowe semantyczne zasoby językowe z adnotacjami łotewskimi, wykorzystujące i rozwijające wielojęzyczne reprezentacje (AMR, PropBank, FrameNet, Universal Dependencies, Grammatical Framework, BabelNet, DBpedia). Wykorzystanie uzyskanych zasobów zostanie wykazane poprzez opracowanie koncepcyjnego prototypu inteligentnej technologii streszczenia tekstu, którego potencjał zostanie oceniony zarówno w kontekście monitorowania mediów, jak i przy użyciu Rouge i innych wskaźników. Projekt będzie w znacznym stopniu promował badania i innowacje w zakresie automatycznego rozumienia i handlu tekstowego języka łotewskiego. Informatyka, technologie językowe, zasoby językowe, semantyka leksykalna, analiza gramatyczna, analiza semantyczna, tekst podsumowujący.Ogólnym celem tego interdyscyplinarnego projektu jest rozwój badań i innowacji w zakresie automatycznego rozumienia i tłumaczenia języków, wzmocnienie wsparcia technologicznego języka łotewskiego na europejskim wielojęzycznym jednolitym rynku cyfrowym. W tym celu celem projektu jest stworzenie nowego, wielowarstwowego zestawu zasobów języka łotewskiego oraz wykazanie potencjału wykorzystania tych zasobów w rozwoju nowych innowacyjnych technologii rozumienia języka i aplikacji TEXTRADE.W projekcie badania przemysłowe będą prowadzone zgodnie z dziedzinami „Computer and information sciences” (FORD 1.2) oraz „Języki i literatura” (FORD 6.2). Projekt nie jest związany z działalnością gospodarczą. Projekt jest planowany dla pięciu głównych działań. Pierwsze trzy działania są związane z tworzeniem i oceną obudowy tekstowej nadającej się do odczytu maszynowego, syntaktycznej i semantycznej. Czwartym jest sformalizowanie i integracja dużego słownika interpretacyjnego i synonimowego w semantyczną chmurę otwartych danych. Z sformalizowanego słownika będą pochodzić wielojęzyczne leksykony obliczeniowe wymagane dla texttrade. Wyniki te zostaną wykorzystane w piątym działaniu, rozwijając laboratoryjny prototyp technologii automatycznej abstrakcji (TRL 4). Projekt będzie realizowany przez naukowców z Laboratorium Sztucznej Inteligencji MII UL – informatyków i lingwistów, w tym młodych naukowców i doktorantów – we współpracy z pracownikami laboratorium badawczego SIA LETA. Biorąc pod uwagę kompetencje SIA LETA w zakresie monitorowania mediów oraz doświadczenie w projektach badawczych związanych z automatyczną semantyczną analizą języka, przewiduje się współpracę w zakresie działań związanych z przygotowaniem semantycznych danych z adnotacją, rozwojem metod uczenia maszynowego i oceną wyników. Kompetencje firmy Leta są również bardzo ważne w definiowaniu, rozwijaniu i walidacji prototypu koncepcyjnego.Wdrożenie projektu znacznie wzmocni kompetencje i potencjał UL MII w zakresie badań i innowacji zasobów i technologii językowych oraz otworzy nowe możliwości współpracy z biznesem i zagranicznymi instytucjami naukowymi. Jednym z głównych praktycznych rezultatów projektu będą otwarte zbiory danych o wysokiej wartości dodanej: 5 pól tekstowych z uwagami i 5 leksykonów obliczeniowych. Drugi główny wynik praktyczny – prototyp nowej technologii językowej. Całkowity koszt projektu wynosi 649 417,19 EUR, z czego 550 871,56 EUR stanowi wsparcie z EFRR. Projekt ma być realizowany od 01.12.2016 do 31.11.2019. (Polish)
    17 August 2022
    0 references
    Raiņa bulvāris 29, Rīga, LV-1050
    0 references
    Marijas iela 2, Rīga, LV-1050
    0 references

    Identifiers

    1.1.1.1/16/A/219
    0 references