Neural networks for the treatment of flexible natural languages (Q3056361)

From EU Knowledge Graph
Jump to navigation Jump to search
Project Q3056361 in Latvia
Language Label Description Also known as
English
Neural networks for the treatment of flexible natural languages
Project Q3056361 in Latvia

    Statements

    0 references
    0 references
    0 references
    484,355.98 Euro
    0 references
    690,654.47 Euro
    0 references
    70.13 percent
    0 references
    31 January 2017
    0 references
    31 October 2019
    0 references
    Sabiedrība ar ierobežotu atbildību "TILDE"
    0 references
    0 references

    56°57'2.66"N, 24°6'57.82"E
    0 references

    56°55'33.82"N, 24°5'24.76"E
    0 references
    Modernu IKT risinājumu izveide nav iedomājama bez valodu tehnoloģijām, kuras nodrošina risinājumu pieejamību lietotāja dzimtajā valodā. META-NET veiktais pētījums (Rehm&Uszkoreit, 2013) norāda uz būtiskām atšķirībām valodas tehnoloģiju attīstības līmenī. Pasaules lielajām valodām tiek piešķirts vērtējums “no laba līdz izcilam”, bet valodām ar nelielu runātāju skaitu - “no vidēja līdz zemam”. Šīs plaisas mazināšana ir liels izaicinājums, mūsdienu valodu tehnoloģijās izmantotajām metodēm nepieciešami lieli datu apjumi, kuru īpaši trūkst mazajām fleksīvām valodām ar bagātu morfoloģiju. Viena no jaunākajām, daudzsološākajām tendencēm IKT risinājumu veidošanā ir neironu tīklu tehnoloģiju (NT) izmantošana. NT tiek veiksmīgi izmantoti tādām valodām kā angļu, franču, spāņu un ķīniešu valodām, taču dziļi pētījumi nelielām valodām ar nepietiekamiem valodas resursiem, piemēram, baltu, somu-ugru un slāvu valodām vēl nav veikti. Nepieciešamība mazināt plaisu valodu tehnoloģiju attīstībā un perspektīvā NT tehnoloģijas izmantošana paver lielu iespēju projekta komandai Rīgā, Latvijā. Šis projekts un tā sagaidāmie rezultāti Latvijai ļaus ieņemt vadošo pozīciju valodu tehnoloģiju izpētē un inovatīvu risinājumu radīšanā. Latvija jau šobrīd ir sasniegusi augstu līmeni šajā jomā, to nodrošinājusi cieša akadēmiskās vides un komerciālo struktūru sadarbība. Latvija līdzdarbojas pētniecībā ar citām Eiropas nācijām un ir piemērota valodu tehnoloģiju izpētes un inovāciju reģionālā centra izveidei.Projektā tiks pētīti, analizēti un novērtēti (gan ar automātiskām metodēm, gan manuāli) dažādi NT algoritmi, lai atrastu piemērotākos risinājumus vairākiem nozīmīgiem valodas tehnoloģiju uzdevumiem:- rakstītā teksta apstrādē – tekstu sintaktiskai analīzei, gramatiskuma novērtēšanai un gramatisko kļūdu labošanai (šos komponentus varēs izmantot arī automatizētas tulkošanas, runātās valodas un cilvēka-datora saziņas problēmu risināšanā); - runas tehnoloģijās – efektīvā runas atpazīšanā un runas sintēzē, jaunu datu ieguvē un sagatavošanā, ja pieejamais datu apjoms ir neliels;- automatizētā tulkošanā – labākā dažādu teksta vienību tulkojumu izveidē; automatizētā vārdnīcu izveidē;- cilvēka-datora saziņas modelēšanā – dabiskās valodas sapratnes, dialoga pārvaldības un dabiskās valodas ģenerēšanas uzdevumos. Tiks pētīti arī dialoga modelēšanas, zināšanu izguves un pārvaldības kognitīvie aspekti un to modelēšana neironu tīklos. Tiks pētītas dažādas NT arhitektūras, tostarp dziļie rekursīvie (angliski: deep recurrent), dziļie vienvirziena (angliski: feed-forward) NT, un efektīvi NT apmācības algoritmi, lai risinātu datu skrajuma, morfoloģiskās daudzveidības un resursu nepietiekamības problēmas. Tiks veikta kognitīvo procesu – valodas, vizuālās uztveres, semantiskās apstrādes – empīriska (korelatīva, eksperimentāla) izpēte. Iegūtās zināšanas tiks izmantotas inovatīvu fleksīvo valodu apstrādes metožu radīšanā. Pētījuma teorētiskie rezultāti tiks apkopoti vismaz 15 Web of Science vai SCOPUS datubāzēs iekļauto žurnālu vai konferenču rakstu krājumu publikācijās.Pētījuma teorētiskie rezultāti tiks pārbaudīti laboratoriskos prototipos (TRL 4), kā arī apvienoti prototipā cilvēka-datora saziņai (TRL 5). Veiksmīgākie risinājumi tiks publicēti kā atvērtā koda risinājumi.Plānoto pētījumu rezultātiem ir liels komercializācijas potenciāls, tāpēc pēc projekta beigām turpināsies to attīstīšana un stabilizēšana, lai izveidotu inovatīvus programmproduktus Latvijas un Eiropas tirgum.Projekts ir ar saimniecisko darbību saistīts projekts, tas tiks īstenots sadarbībā starp komersantu (Tilde) un pētniecības institūciju (Latvijas Universitāte) un ilgs no 2016. gada 1. novembra līdz 2019. gada 31. oktobrim. Projekta kopējas izmaksas ir 690 672,13 EUR, t.sk., ERAF atbalsts 484 384,04 EUR. Projekta pētniecības kategorija - eksperimentālā izstrāde un rūpnieciskie pētījumi. Projekts pēc Frascati rokasgrāmatas atbilst IKT zinātnes nozarei “1.2 Computer and information sciences” (Latvian)
    0 references
    The development of modern ICT solutions is inconceivable without language technologies ensuring the availability of solutions in the user’s mother tongue. The meta-NET study (Rehm&Uszkoreit, 2013) points to significant differences in the level of development of language technologies. The world’s great languages are rated “good to excellent”, while languages with a small number of speakers are rated “from medium to low”. Bridging this gap is a major challenge, the methods used in modern language technologies require large data penetrations, which are particularly lacking for the small flexive languages with rich morphology. One of the most promising developments in ICT solutions is the use of Neural Network Technologies (NT). NTs are successfully used in languages such as English, French, Spanish and Chinese, but deep studies have not yet been carried out in small languages with insufficient linguistic resources, such as white, Finnish-Ugric and Slavic languages. The need to bridge the gap in the development of language technologies and the prospective use of NT technology opens a great opportunity for the project team in Riga, Latvia. This project and its expected results will allow Latvia to take a leading position in the research of language technologies and the creation of innovative solutions. Latvia has already reached a high level in this field, ensured by close cooperation between the academic environment and commercial structures. Latvia participates in research with other European nations and is suitable for the creation of a regional centre for research and innovation of language technologies.The project will explore, analyse and evaluate various NT algorithms (both automatic methods and manually) to find the most suitable solutions for several important tasks of language technologies:- processing of written text – syntactic analysis of texts, evaluation of grammar and correction of grammar errors (these components will also be used for automated translation, spoken language and human-computer communication problems); In speech technologies – effective speech recognition and speech synthesis, acquisition and preparation of new data where the amount of data available is small;- automated translation – for the creation of the best translations of different text units; Automated dictionaries;- human-computer communication modelling – tasks of understanding the natural language, managing dialogue and generating natural language. Cognitive aspects of dialogue modelling, knowledge retrieval and management and their modelling in neural networks will also be studied. Different NT architectures will be studied, including deep recursive (in English: Deep Recurrent), deep one-way (in English: Feature-forward) NT, and efficient NT training algorithms to address data scratching, morphological diversity and resource scarcity problems. Cognitive processes – language, visual perception, semantic processing – empirical (correlative, experimental) will be studied. The acquired knowledge will be used to create innovative flexible language processing methods. The theoretical results of the study will be summarised in the publications of at least 15 journals or conference articles from Web of Science or SCOPUS databases.The theoretical results of the study will be tested in laboratory prototypes (TRL 4), as well as pooled human-computer communication (TRL 5). The most successful solutions will be published as open source solutions.The results of the planned research have great potential for commercialisation, therefore after the end of the project their development and stabilisation will continue in order to create innovative software products for the Latvian and European market.The project is a project related to economic activities, it will be implemented in cooperation between the merchant (Tilde) and research institution (University of Latvia) and will run from November 1, 2016 to October 31, 2019. The total cost of the project is EUR 690672,13, including ERDF support EUR 484384,04. Research category of the project – experimental development and industrial research. The project, according to the Frascati handbook, corresponds to the ICT science industry “1.2 Computer and information sciences” (English)
    15 July 2021
    0.2741268731768275
    0 references
    Le développement de solutions TIC modernes est inconcevable sans les technologies linguistiques qui rendent les solutions disponibles dans la langue maternelle de l’utilisateur. L’étude méta-NET (Rehm&Uszkoreit, 2013) fait état de différences significatives dans le niveau de développement des technologies linguistiques. Les principales langues du monde sont classées «de bonne à excellente» et «moyenne à faible» pour les langues avec un petit nombre de locuteurs. Combler cette lacune est un défi majeur, les méthodes utilisées dans les technologies du langage moderne exigent de grandes quantités de données, qui font particulièrement défaut dans les petites langues flexibles avec une morphologie riche. L’une des tendances les plus récentes et les plus prometteuses en matière de solutions TIC est l’utilisation des technologies de réseau neuronal (NT). Le NT est utilisé avec succès pour des langues telles que l’anglais, le français, l’espagnol et le chinois, mais des recherches approfondies sur les petites langues dont les ressources linguistiques sont insuffisantes, telles que le blanc, le finnois et le slave, n’ont pas encore été menées. La nécessité de combler l’écart dans le développement des technologies linguistiques et l’utilisation future de la technologie NT ouvre une excellente occasion à l’équipe de projet à Riga, en Lettonie. Ce projet et les résultats escomptés permettront à la Lettonie de prendre une position de premier plan dans la recherche des technologies linguistiques et la création de solutions innovantes. La Lettonie a déjà atteint un niveau élevé dans ce domaine, grâce à une coopération étroite entre les universités et les organismes commerciaux. La Lettonie participe à la recherche avec d’autres pays européens et convient à la création d’un centre régional de recherche et d’innovation dans le domaine des technologies linguistiques. Le projet explorera, analysera et évaluera divers algorithmes NT (à la fois automatiques et manuellement) afin de trouver les solutions les plus appropriées à un certain nombre de défis importants en matière de technologie linguistique:- traitement de texte écrit — analyse syntaxique des textes, évaluation grammaticale et correction des erreurs grammaticales (ces composants peuvent également être utilisés pour résoudre les problèmes de traduction automatisée, de langue orale et de communication entre l’homme et l’ordinateur); — dans les technologies de la parole — reconnaissance vocale efficace et synthèse vocale, l’acquisition et la production de nouvelles données lorsque la quantité de données disponibles est faible;- dans la traduction automatisée, la meilleure traduction de différentes unités de texte; création automatisée de vocabulaire;- modélisation de la communication homme-ordinateur — compréhension du langage naturel, gestion du dialogue et tâches de génération de langage naturel. Les aspects cognitifs de la modélisation du dialogue, de l’extraction et de la gestion des connaissances ainsi que de leur modélisation dans les réseaux neuronaux seront également étudiés. Diverses architectures NT, y compris les architectures profondes récursives, seront explorées (en anglais: profonde récurrente), profonde à sens unique (en anglais: en amont) NT, et des algorithmes de formation NT efficaces pour traiter de la numérisation des données, de la diversité morphologique et de la rareté des ressources. Les processus cognitifs — langage, perception visuelle, traitement sémantique — empiriques (correlatifs, expérimentaux) seront étudiés. Les connaissances acquises seront utilisées pour créer des méthodes de traitement linguistique flexibles et innovantes. Les résultats théoriques de l’étude seront recueillis dans au moins 15 publications de revues ou d’articles de conférence inclus dans le Web of Science ou les bases de données SCOPUS. Les résultats théoriques de l’étude seront testés dans des prototypes de laboratoire (TRL 4), ainsi que combinés pour le prototypage de la communication homme-ordinateur (TRL 5). Les solutions les plus réussies seront publiées comme des solutions open source. Les résultats de la recherche planifiée ont un grand potentiel de commercialisation, donc après la fin du projet, ils continueront à être développés et stabilisés afin de créer des produits logiciels innovants pour le marché letton et européen. Le projet est un projet lié à l’activité économique, il sera mis en œuvre en coopération entre le commerçant (Tilde) et l’institution de recherche (Université de Lettonie) et durera du 1er novembre 2016 au 31 octobre 2019. Le coût total du projet s’élève à 690 672,13 EUR, y compris le soutien du FEDER 484 384,04 EUR, catégorie de recherche de projet — développement expérimental et recherche industrielle. Le projet du Manuel Frascati correspond au secteur des TIC «1.2 Informatique et sciences de l’information» (French)
    25 November 2021
    0 references
    Die Entwicklung moderner IKT-Lösungen ist ohne Sprachtechnologien unvorstellbar, die Lösungen in der Muttersprache des Nutzers zur Verfügung stellen. Die Meta-NET-Studie (Rehm&Uszkoreit, 2013) deutet auf erhebliche Unterschiede im Niveau der Sprachtechnologieentwicklung hin. Die wichtigsten Sprachen der Welt werden als „von gut bis hervorragend“ und „mittel bis niedrig“ für Sprachen mit einer kleinen Anzahl von Sprechern bewertet. Diese Lücke zu überbrücken ist eine große Herausforderung, denn die Methoden der modernen Sprachtechnologien erfordern große Datenmengen, die in den kleinen, flexiblen Sprachen mit reicher Morphologie besonders fehlen. Einer der neuesten und vielversprechendsten Trends bei IKT-Lösungen ist der Einsatz neuronaler Netzwerktechnologien (NT). NT wird erfolgreich für Sprachen wie Englisch, Französisch, Spanisch und Chinesisch verwendet, aber es wurde noch keine gründliche Erforschung kleiner Sprachen mit unzureichenden Sprachressourcen wie weißer, finnischer und slawischer Sprache durchgeführt. Die Notwendigkeit, die Lücke bei der Entwicklung von Sprachtechnologien und dem künftigen Einsatz von NT-Technologien zu überbrücken, eröffnet dem Projektteam in Riga (Lettland) eine große Chance. Dieses Projekt und die erwarteten Ergebnisse werden es Lettland ermöglichen, eine führende Position bei der Erforschung von Sprachtechnologien und der Entwicklung innovativer Lösungen zu übernehmen. Lettland hat in diesem Bereich bereits ein hohes Niveau erreicht, dank der engen Zusammenarbeit zwischen Wissenschaft und Wirtschaft. Lettland beteiligt sich an der Forschung mit anderen europäischen Nationen und eignet sich für die Schaffung eines regionalen Zentrums für Sprachtechnologieforschung und -innovation. Das Projekt wird verschiedene NT-Algorithmen (sowohl automatische Methoden als auch manuell) untersuchen, analysieren und bewerten, um die am besten geeigneten Lösungen für eine Reihe wichtiger sprachlicher technologischer Herausforderungen zu finden:- schriftliche Textverarbeitung – syntaktische Analyse von Texten, grammatikalische Auswertung und Korrektur von grammatikalischen Fehlern (diese Komponenten können auch zur Lösung von Problemen der automatisierten Übersetzung, gesprochener Sprache und Mensch-Computer-Kommunikation verwendet werden); — in Sprachtechnologien – effektive Spracherkennung und Sprachsynthese, die Erfassung und Erstellung neuer Daten, bei denen die verfügbare Datenmenge gering ist;- in automatisierter Übersetzung die beste Übersetzung verschiedener Texteinheiten; automatisierte Vokabular-Erstellung;- Human-Computer-Kommunikationsmodellierung – natürliches Sprachverständnis, Dialogmanagement und natürliche Sprachgenerierung. Auch kognitive Aspekte der Dialogmodellierung, des Wissensabrufs und des Managements und deren Modellierung in neuronalen Netzwerken werden untersucht. Verschiedene NT-Architekturen, darunter tiefe rekursive, werden erkundet (auf Englisch: Tiefwiederholung), tiefe Einbahn (auf Englisch: NT und effektive NT-Trainingsalgorithmen zur Datenabtastung, morphologischer Vielfalt und Ressourcenknappheit. Kognitive Prozesse – Sprache, visuelle Wahrnehmung, semantische Verarbeitung – empirisch (korrelativ, experimentell) werden untersucht. Das erworbene Wissen wird genutzt, um innovative flexible Methoden der Sprachverarbeitung zu schaffen. Die theoretischen Ergebnisse der Studie werden in mindestens 15 Publikationen von Zeitschriften oder Tagungsartikeln in Web of Science oder SCOPUS-Datenbanken gesammelt. Die theoretischen Ergebnisse der Studie werden in Laborprototypen (TRL 4) sowie kombiniert zur Prototypierung der Mensch-Computer-Kommunikation (TRL 5) getestet. Die erfolgreichsten Lösungen werden als Open-Source-Lösungen veröffentlicht. Die Ergebnisse der geplanten Forschung haben ein großes Potenzial für die Kommerzialisierung, so dass sie nach Ende des Projekts weiter entwickelt und stabilisiert werden, um innovative Softwareprodukte für den lettischen und europäischen Markt zu schaffen. Das Projekt ist ein Projekt im Zusammenhang mit der Wirtschaftstätigkeit, es wird in Zusammenarbeit zwischen dem Händler (Tilde) und Forschungsinstitution (Universität Lettland) umgesetzt und wird vom 1. November 2016 bis zum 31. Oktober 2019 laufen. Die Gesamtkosten des Projekts belaufen sich auf 690 672,13 EUR, einschließlich EFRE-Unterstützung 484 384,04 EUR Projektforschung – experimentelle Entwicklung und industrielle Forschung. Das Frascati Handbook-Projekt entspricht dem IKT-Wissenschaftssektor „1.2 Informatik und Informatik“ (German)
    28 November 2021
    0 references
    De ontwikkeling van moderne ICT-oplossingen is ondenkbaar zonder taaltechnologieën die oplossingen beschikbaar stellen in de moedertaal van de gebruiker. De meta-NET studie (Rehm&Uszkoreit, 2013) wijst op significante verschillen in het niveau van de ontwikkeling van taaltechnologie. „S werelds belangrijkste talen worden beoordeeld „van goed tot uitstekend” en „medium tot laag” voor talen met een klein aantal sprekers. Het overbruggen van deze kloof is een grote uitdaging, de methoden die worden gebruikt in moderne taaltechnologieën vereisen grote hoeveelheden gegevens, die vooral ontbreken in de kleine, flexibele talen met een rijke morfologie. Een van de nieuwste en meest veelbelovende trends in ICT-oplossingen is het gebruik van neurale netwerktechnologieën (NT). NT wordt met succes gebruikt voor talen als Engels, Frans, Spaans en Chinees, maar diep onderzoek naar kleine talen met onvoldoende taalbronnen zoals wit, Fins en Slavische talen is nog niet uitgevoerd. De noodzaak om de kloof in de ontwikkeling van taaltechnologieën en het toekomstige gebruik van NT-technologie te overbruggen, biedt een grote kans voor het projectteam in Riga, Letland. Dit project en de verwachte resultaten ervan zullen Letland in staat stellen een leidende positie in te nemen bij het onderzoek naar taaltechnologieën en het creëren van innovatieve oplossingen. Letland heeft op dit gebied al een hoog niveau bereikt dankzij nauwe samenwerking tussen de academische wereld en commerciële instanties. Letland neemt deel aan onderzoek met andere Europese landen en is geschikt voor de oprichting van een regionaal centrum voor taaltechnologieonderzoek en -innovatie. Het project zal verschillende NT-algoritmen (zowel automatische als handmatige) onderzoeken, analyseren en evalueren om de meest geschikte oplossingen te vinden voor een aantal belangrijke uitdagingen op het gebied van taaltechnologie:- geschreven tekstverwerking — syntactische analyse van teksten, grammaticale evaluatie en correctie van grammaticale fouten (deze componenten kunnen ook worden gebruikt om problemen op het gebied van geautomatiseerde vertaling, gesproken taal en mens-computercommunicatie op te lossen); — in spraaktechnologieën — effectieve spraakherkenning en spraaksynthese, de verwerving en productie van nieuwe gegevens waarbij de hoeveelheid beschikbare gegevens klein is;- in geautomatiseerde vertaling, de beste vertaling van verschillende teksteenheden; geautomatiseerde vocabulaire creatie;- mens-computer communicatie modellering — natuurlijke taal begrijpen, dialoog management en natuurlijke taal generatie taken. Ook de cognitieve aspecten van dialoogmodellering, kennisopvraging en -beheer en hun modellering in neurale netwerken zullen worden onderzocht. Verschillende NT architecturen, waaronder diepe recursieve, zullen worden onderzocht (in het Engels: diep terugkerend), diep eenrichtingsverkeer (in het Engels: feed-forward) NT, en effectieve NT-trainingsalgoritmen om gegevensscanning, morfologische diversiteit en hulpbronnenschaarste aan te pakken. Cognitieve processen — taal, visuele waarneming, semantische verwerking — empirisch (correlatief, experimenteel) zullen worden bestudeerd. De verworven kennis zal worden gebruikt om innovatieve flexibele taalverwerkingsmethoden te creëren. De theoretische resultaten van het onderzoek worden verzameld in ten minste 15 publicaties van tijdschriften of conferentieartikelen die zijn opgenomen in Web of Science of SCOPUS-databases. De theoretische resultaten van de studie worden getest in laboratoriumprototypes (TRL 4) en gecombineerd voor prototyping van mens-computercommunicatie (TRL 5). De meest succesvolle oplossingen zullen worden gepubliceerd als open source oplossingen. De resultaten van het geplande onderzoek hebben een groot potentieel voor commercialisering, dus na het einde van het project zullen ze verder worden ontwikkeld en gestabiliseerd om innovatieve softwareproducten te creëren voor de Letse en Europese markt. Het project is een project met betrekking tot economische activiteit, het zal worden uitgevoerd in samenwerking tussen de handelaar (Tilde) en onderzoeksinstelling (Universiteit van Letland) en zal duren van 1 november 2016 tot 31 oktober 2019. De totale kosten van het project bedragen 690 672,13 EUR, inclusief EFRO-steun 484 384,04 EUR. Projectonderzoek — experimentele ontwikkeling en industrieel onderzoek. Het Frascati Handbook-project komt overeen met de ICT-wetenschapssector „1.2 Computer- en informatiewetenschappen” (Dutch)
    28 November 2021
    0 references
    Lo sviluppo di soluzioni TIC moderne è inconcepibile senza tecnologie linguistiche che rendano disponibili soluzioni nella lingua madre dell'utente. Lo studio meta-NET (Rehm&Uszkoreit, 2013) evidenzia differenze significative nel livello di sviluppo della tecnologia linguistica. Le principali lingue del mondo sono valutate "da buono a eccellente" e "da medio a basso" per le lingue con un piccolo numero di oratori. Colmare questa lacuna è una sfida importante, i metodi utilizzati nelle moderne tecnologie linguistiche richiedono grandi quantità di dati, che sono particolarmente carenti nei linguaggi piccoli e flessibili con una ricca morfologia. Una delle tendenze più recenti e più promettenti nelle soluzioni TIC è l'uso delle tecnologie di rete neurale (NT). NT è utilizzato con successo per lingue come l'inglese, il francese, lo spagnolo e il cinese, ma non è stata ancora effettuata una profonda ricerca sulle lingue piccole con risorse linguistiche insufficienti come le lingue bianche, finlandesi e slave. La necessità di colmare il divario nello sviluppo delle tecnologie linguistiche e l'uso prospettico della tecnologia NT apre una grande opportunità per il team di progetto a Riga, in Lettonia. Questo progetto e i risultati attesi consentiranno alla Lettonia di assumere una posizione di primo piano nella ricerca delle tecnologie linguistiche e nella creazione di soluzioni innovative. La Lettonia ha già raggiunto un livello elevato in questo settore, grazie a una stretta cooperazione tra il mondo accademico e gli organismi commerciali. La Lettonia partecipa alla ricerca con altre nazioni europee ed è idonea alla creazione di un centro regionale per la ricerca e l'innovazione nel campo delle tecnologie linguistiche. Il progetto esplorerà, analizzerà e valuterà vari algoritmi NT (sia metodi automatici che manualmente) al fine di trovare le soluzioni più adatte a una serie di importanti sfide tecnologiche linguistiche:- elaborazione del testo scritto — analisi sintattica dei testi, valutazione grammaticale e correzione di errori grammaticali (queste componenti possono essere utilizzate anche per risolvere problemi di traduzione automatica, lingua parlata e comunicazione uomo-computer); — nelle tecnologie vocali — riconoscimento vocale efficace e sintesi vocale, acquisizione e produzione di nuovi dati in cui la quantità di dati disponibili è limitata;- nella traduzione automatica, la migliore traduzione di diverse unità di testo; creazione automatica del vocabolario;- modellazione di comunicazione uomo-computer — comprensione del linguaggio naturale, gestione del dialogo e compiti di generazione del linguaggio naturale. Saranno inoltre esplorati gli aspetti cognitivi della modellizzazione del dialogo, del recupero e della gestione delle conoscenze e della loro modellazione nelle reti neurali. Saranno esplorate varie architetture NT, comprese quelle profonde ricorsive (in inglese: profondo ricorrente), profondo a senso unico (in inglese: feed-forward) NT, e algoritmi di addestramento NT efficaci per affrontare la scansione dei dati, la diversità morfologica e la scarsità di risorse. Verranno studiati processi cognitivi — linguaggio, percezione visiva, elaborazione semantica — empirici (correlativi, sperimentali). Le conoscenze acquisite saranno utilizzate per creare metodi innovativi e flessibili di elaborazione del linguaggio. I risultati teorici dello studio saranno raccolti in almeno 15 pubblicazioni di riviste o articoli di conferenza inclusi nelle banche dati Web of Science o SCOPUS. I risultati teorici dello studio saranno testati in prototipi di laboratorio (TRL 4) e combinati per la prototipazione della comunicazione uomo-computer (TRL 5). Le soluzioni di maggior successo saranno pubblicate come soluzioni open source. I risultati della ricerca pianificata hanno un grande potenziale di commercializzazione, quindi dopo la fine del progetto continueranno a essere sviluppati e stabilizzati al fine di creare prodotti software innovativi per il mercato lettone ed europeo. Il progetto è un progetto relativo all'attività economica, sarà attuato in collaborazione tra il commerciante (Tilde) e l'istituto di ricerca (Università di Lettonia) e durerà dal 1º novembre 2016 al 31 ottobre 2019. Il costo totale del progetto è di 690 672,13 EUR, compreso il sostegno FESR 484 384,04 EUR. Categoria di ricerca del progetto — sviluppo sperimentale e ricerca industriale. Il progetto Frascati Handbook corrisponde al settore della scienza delle TIC "1.2 Scienze informatiche e dell'informazione" (Italian)
    11 January 2022
    0 references
    El desarrollo de soluciones TIC modernas es inconcebible sin tecnologías lingüísticas que hagan que las soluciones estén disponibles en la lengua materna del usuario. El estudio meta-NET (Rehm&Uszkoreit, 2013) apunta a diferencias significativas en el nivel de desarrollo de la tecnología lingüística. Los idiomas más importantes del mundo se clasifican «de bueno a excelente» y «medio a bajo» para los idiomas con un pequeño número de hablantes. Colmar esta brecha es un gran desafío, los métodos utilizados en las tecnologías del lenguaje moderna requieren grandes cantidades de datos, que son particularmente inexistentes en los lenguajes pequeños y flexibles con una rica morfología. Una de las tendencias más recientes y prometedoras en las soluciones de TIC es el uso de las tecnologías de redes neuronales (NT). NT se utiliza con éxito en idiomas como el inglés, el francés, el español y el chino, pero aún no se ha llevado a cabo una investigación profunda sobre lenguas pequeñas con recursos lingüísticos insuficientes como las lenguas blanca, finlandesa y eslava. La necesidad de colmar la brecha en el desarrollo de las tecnologías del lenguaje y el uso prospectivo de la tecnología NT abre una gran oportunidad para el equipo del proyecto en Riga, Letonia. Este proyecto y sus resultados esperados permitirán a Letonia asumir una posición de liderazgo en la investigación de las tecnologías lingüísticas y la creación de soluciones innovadoras. Letonia ya ha alcanzado un alto nivel en este ámbito, gracias a una estrecha cooperación entre el mundo académico y los organismos comerciales. Letonia participa en la investigación con otras naciones europeas y es adecuada para la creación de un centro regional de investigación e innovación en tecnología lingüística. El proyecto explorará, analizará y evaluará varios algoritmos NT (tanto automáticos como manualmente) con el fin de encontrar las soluciones más adecuadas para una serie de retos importantes en materia de tecnología lingüística:- procesamiento de textos escritos — análisis sintáctico de textos, evaluación gramatical y corrección de errores gramaticales (estos componentes también pueden utilizarse para resolver problemas de traducción automatizada, lenguaje hablado y comunicación humano-ordenador); — en tecnologías del habla — reconocimiento efectivo y síntesis del habla, la adquisición y producción de nuevos datos donde la cantidad de datos disponibles es pequeña;- en la traducción automatizada, la mejor traducción de diferentes unidades de texto; creación automatizada de vocabulario;- modelado de comunicación humano-ordenador — comprensión del lenguaje natural, gestión del diálogo y tareas de generación de lenguaje natural. También se explorarán los aspectos cognitivos de la modelización del diálogo, la recuperación y gestión del conocimiento y su modelización en las redes neuronales. Se explorarán varias arquitecturas NT, incluidas las arquitecturas recursivas profundas (en inglés: recidivante profundo), unidireccional profundo (en inglés: feed-forward) NT, y algoritmos efectivos de entrenamiento de NT para abordar el escaneo de datos, la diversidad morfológica y la escasez de recursos. Se estudiarán los procesos cognitivos — lenguaje, percepción visual, procesamiento semántico — empírico (correlativo, experimental). Los conocimientos adquiridos se utilizarán para crear métodos innovadores y flexibles de procesamiento de idiomas. Los resultados teóricos del estudio se recogerán en al menos 15 publicaciones de revistas o artículos de conferencia incluidos en bases de datos Web of Science o SCOPUS. Los resultados teóricos del estudio serán probados en prototipos de laboratorio (TRL 4), así como combinados para la creación de prototipos de comunicación humano-ordenador (TRL 5). Las soluciones más exitosas se publicarán como soluciones de código abierto. Los resultados de la investigación planificada tienen un gran potencial de comercialización, por lo que tras el final del proyecto continuarán siendo desarrollados y estabilizados con el fin de crear productos de software innovadores para el mercado letón y europeo. El proyecto es un proyecto relacionado con la actividad económica, se ejecutará en cooperación entre el comerciante (Tilde) y la institución de investigación (Universidad de Letonia) y tendrá una duración del 1 de noviembre de 2016 al 31 de octubre de 2019. El coste total del proyecto asciende a 690 672,13 EUR, incluida la ayuda del FEDER 484 384,04 EUR. El proyecto Frascati Handbook corresponde al sector de las TIC «1.2 Ciencias de la informática y la información» (Spanish)
    12 January 2022
    0 references
    Kaasaegsete IKT-lahenduste väljatöötamine on mõeldamatu ilma keeletehnoloogiata, mis tagaks lahenduste kättesaadavuse kasutaja emakeeles. Meta-NET uuring (Rehm&Uszkoreit, 2013) osutab märkimisväärsetele erinevustele keeletehnoloogia arengutasemes. Maailma suurepärased keeled on hinnatud „hea kuni suurepärane“, samas kui väikese arvu kõnelejate arvuga keeled on hinnatud „keskmisest madalaks“. Selle lünga ületamine on suur väljakutse, kaasaegses keeletehnoloogias kasutatavad meetodid nõuavad suuri andmekasutusi, mis on eriti puudulikud rikkaliku morfoloogiaga väikeste fleXive keelte puhul. IKT lahenduste üks paljutõotavamaid arenguid on neurovõrgutehnoloogiate (NT) kasutamine. NTSi kasutatakse edukalt sellistes keeltes nagu inglise, prantsuse, hispaania ja hiina keel, kuid põhjalikke uuringuid ei ole veel läbi viidud väikestes ebapiisavate keeleressurssidega keeltes, nagu valged, soome-ugri ja slaavi keeled. Vajadus ületada lõhe keeletehnoloogia arengus ja uue tehnoloogia tulevane kasutamine avab suurepärase võimaluse projektimeeskonnale Riias, Lätis. See projekt ja selle oodatavad tulemused võimaldavad Lätil asuda keeletehnoloogia uurimises ja uuenduslike lahenduste loomises juhtivale kohale. Läti on selles valdkonnas juba saavutanud kõrge taseme, mille tagab tihe koostöö akadeemilise keskkonna ja äristruktuuride vahel. Läti osaleb teadusuuringutes koos teiste Euroopa rahvastega ning sobib keeletehnoloogia uurimise ja innovatsiooni piirkondliku keskuse loomiseks. Projekt uurib, analüüsib ja hindab erinevaid mittetariifseid algoritme (nii automaatseid kui ka käsitsi), et leida kõige sobivamad lahendused keeletehnoloogia mitme olulise ülesande täitmiseks: – kirjaliku teksti töötlemine – tekstide süntaktiline analüüs, grammatika hindamine ja grammatikavigade parandamine (neid komponente kasutatakse ka automaattõlke, kõnekeele ja inim-arvuti kommunikatsiooni probleemide korral); Kõnetehnoloogias – tõhus kõnetuvastus ja kõnesüntees, uute andmete hankimine ja ettevalmistamine, kui kättesaadavate andmete hulk on väike; – automaattõlge – erinevate tekstiüksuste parimate tõlgete loomiseks; Automatiseeritud sõnaraamatud;- inim-arvuti side modelleerimine – ülesanded mõista loomulikku keelt, hallata dialoogi ja luua loomulik keel. Uuritakse ka dialoogi modelleerimise, teadmiste hankimise ja haldamise kognitiivseid aspekte ning nende modelleerimist närvivõrkudes. Uuritakse erinevaid NT arhitektuure, sealhulgas sügavat rekursiivset (inglise keeles: Sügav korduv), sügav ühesuunaline (inglise keeles: Funktsioon-edasi) NT, ja tõhusad NT koolitus algoritme, et lahendada andmete kriimustamise, morfoloogilise mitmekesisuse ja ressursside nappuse probleeme. Uuritakse kognitiivseid protsesse – keelt, visuaalset tajumist, semantilist töötlemist – empiirilist (korrelatiivset, eksperimentaalset). Omandatud teadmisi kasutatakse uuenduslike paindlike keeletöötlusmeetodite loomiseks. Uuringu teoreetilised tulemused võetakse kokku vähemalt 15 ajakirjade või konverentsiartiklite väljaannetes Web of Science’i või SCOPUSe andmebaasidest. Uuringu teoreetilisi tulemusi katsetatakse laboratoorsete prototüüpidega (TRL 4) ning ühendatud inim-arvuti sidega (TRL 5). Kõige edukamad lahendused avaldatakse avatud lähtekoodiga lahendustena. Kavandatud uuringute tulemustel on suur kommertskasutuse potentsiaal, mistõttu pärast projekti lõppu jätkub nende arendamine ja stabiliseerimine, et luua uuenduslikke tarkvaratooteid Läti ja Euroopa turule. Projekt on majandustegevusega seotud projekt, seda rakendatakse koostöös kaupmehe (Tilde) ja teadusasutuse (Läti Ülikool) vahel ning see kestab 1. novembrist 2016 kuni 31. oktoobrini 2019. Projekti kogumaksumus on 690672,13 eurot, sealhulgas ERFi toetus 484384,04 eurot. Projekti uurimiskategooria – tootearendus ja rakendusuuringud. Frascati käsiraamatu kohaselt vastab projekt IKT teadustööstusele „1.2 Arvuti- ja infoteadused“. (Estonian)
    3 August 2022
    0 references
    Šiuolaikinių IRT sprendimų kūrimas neįsivaizduojamas be kalbos technologijų, užtikrinančių sprendimų prieinamumą vartotojo gimtąja kalba. Meta-NET tyrimas (Rehm&Uszkoreit, 2013) rodo, kad kalbos technologijų išsivystymo lygis labai skiriasi. Puikios pasaulio kalbos vertinamos „gerai iki puikios“, o kalbos, kuriose yra nedaug kalbėtojų, vertinamos „nuo vidutinio iki žemo“. Įveikti šį atotrūkį yra didelis iššūkis, nes šiuolaikinėse kalbos technologijose naudojamiems metodams reikia didelių duomenų skverbčių, kurių ypač trūksta mažoms fleXive kalboms, turinčioms turtingą morfologiją. Vienas iš perspektyviausių IRT sprendimų pokyčių yra neuroninių tinklų technologijų (NT) naudojimas. NTS sėkmingai vartojamos tokiose kalbose kaip anglų, prancūzų, ispanų ir kinų, tačiau dar neatlikti gilūs tyrimai mažomis kalbomis, neturinčiomis pakankamai kalbinių išteklių, pavyzdžiui, baltosiomis, suomių-ugrų ir slavų kalbomis. Būtinybė užpildyti atotrūkį tarp kalbos technologijų plėtros ir būsimo NT technologijų naudojimo atveria puikią galimybę projekto komandai Rygoje, Latvijoje. Šis projektas ir jo laukiami rezultatai leis Latvijai užimti pirmaujančią poziciją kalbos technologijų mokslinių tyrimų ir novatoriškų sprendimų kūrimo srityje. Latvija jau pasiekė aukštą lygį šioje srityje, tai užtikrina glaudus akademinės aplinkos ir komercinių struktūrų bendradarbiavimas. Latvija dalyvauja moksliniuose tyrimuose su kitomis Europos tautomis ir yra tinkama regioniniam kalbos technologijų mokslinių tyrimų ir inovacijų centrui sukurti. Projekte bus nagrinėjami, analizuojami ir vertinami įvairūs NT algoritmai (tiek automatiniai, tiek rankiniu būdu), kad būtų rasti tinkamiausi sprendimai kelioms svarbioms kalbos technologijų užduotims:- rašytinio teksto apdorojimas – sintaksinė tekstų analizė, gramatikos vertinimas ir gramatikos klaidų taisymas (šie komponentai taip pat bus naudojami automatizuotam vertimui, šnekamosios kalbos ir žmogaus-kompiuterinės komunikacijos problemoms); Kalbos technologijose – efektyvus kalbos atpažinimas ir kalbos sintezė, naujų duomenų gavimas ir paruošimas, kai turimų duomenų kiekis yra mažas; – automatizuotas vertimas – už geriausių skirtingų tekstinių vienetų vertimų kūrimą; Automatizuoti žodynai;- žmogaus-kompiuterio komunikacijos modeliavimas – užduotys suprasti natūralią kalbą, valdyti dialogą ir kurti natūralią kalbą. Taip pat bus tiriami dialogo modeliavimo, žinių paieškos ir valdymo bei jų modeliavimo neuroniniuose tinkluose pažinimo aspektai. Bus tiriamos įvairios NT architektūros, įskaitant gilų rekursyvumą (anglų kalba: Giliai pasikartojantis), giliai į vieną pusę (anglų kalba: NT ir veiksmingi NT mokymo algoritmai, skirti duomenų braižymo, morfologinės įvairovės ir išteklių trūkumo problemoms spręsti. Bus tiriami kognityviniai procesai – kalba, vizualinis suvokimas, semantinis apdorojimas – empirinis (koreliacinis, eksperimentinis). Įgytos žinios bus naudojamos kuriant naujoviškus lanksčius kalbos apdorojimo metodus. Teoriniai tyrimo rezultatai bus apibendrinti bent 15 žurnalų ar konferencijų straipsnių iš Web of Science arba SCOPUS duomenų bazių leidiniuose. Tyrimo teoriniai rezultatai bus išbandyti laboratoriniuose prototipuose (TRL 4), taip pat sutelkti žmogaus ir kompiuterio ryšiai (TRL 5). Sėkmingiausi sprendimai bus paskelbti kaip atviro kodo sprendimai. Planuojamų mokslinių tyrimų rezultatai turi didelį potencialą komercializuoti, todėl pasibaigus projektui jų kūrimas ir stabilizavimas bus tęsiamas siekiant sukurti inovatyvius programinės įrangos produktus Latvijos ir Europos rinkai. Projektas yra susijęs su ekonomine veikla, jis bus įgyvendinamas bendradarbiaujant prekybininkams (Tilde) ir mokslinių tyrimų įstaigai (Latvijos universitetui) ir bus vykdomas nuo 2016 m. lapkričio 1 d. iki 2019 m. spalio 31 d. Bendros projekto išlaidos yra 690 672,13 EUR, įskaitant ERPF paramą 484 384,04 EUR. Projekto mokslinių tyrimų kategorija – eksperimentinė taikomoji veikla ir pramoniniai tyrimai. Pagal Frascati vadovą projektas atitinka IRT mokslo pramonę „1.2 Kompiuterių ir informacijos mokslai“ (Lithuanian)
    3 August 2022
    0 references
    Razvoj suvremenih ICT rješenja nezamisliv je bez jezičnih tehnologija koje osiguravaju dostupnost rješenja na materinskom jeziku korisnika. Meta-NET studija (Rehm&Uszkoreit, 2013) ukazuje na značajne razlike u stupnju razvoja jezičnih tehnologija. Svjetski sjajni jezici ocijenjeni su „dobrim do izvrsnim”, dok su jezici s malim brojem govornika ocijenjeni „od srednjeg do niskog”. Premošćivanje tog jaza veliki je izazov, a metode koje se koriste u suvremenim jezičnim tehnologijama zahtijevaju velike prodore podataka, koje posebno nedostaju za male fleXive jezike s bogatom morfologijom. Jedan od najperspektivnijih razvoja rješenja IKT-a je upotreba tehnologija neuronskih mreža (NT). NTS se uspješno koristi u jezicima kao što su engleski, francuski, španjolski i kineski, ali duboke studije još nisu provedene na malim jezicima s nedovoljnim jezičnim resursima, kao što su bijeli, finsko-ugrski i slavenski jezici. Potreba za premošćivanjem jaza u razvoju jezičnih tehnologija i prospektivno korištenje NT tehnologije otvara veliku priliku projektnom timu u Rigi u Latviji. Ovaj projekt i njegovi očekivani rezultati omogućit će Latviji da zauzme vodeću poziciju u istraživanju jezičnih tehnologija i stvaranju inovativnih rješenja. Latvija je već dosegla visoku razinu u tom području, što je osigurano bliskom suradnjom između akademskog okruženja i komercijalnih struktura. Latvija sudjeluje u istraživanju s drugim europskim narodima i pogodan je za stvaranje regionalnog centra za istraživanje i inovacije jezičnih tehnologija.Projekt će istražiti, analizirati i ocijeniti različite algoritme NT-a (automatske metode i ručno) kako bi se pronašla najprikladnija rješenja za nekoliko važnih zadataka jezičnih tehnologija:- obrada pisanog teksta – sintaktička analiza tekstova, evaluacija gramatike i ispravljanje gramatičkih pogrešaka (te će se komponente koristiti i za automatizirano prevođenje, govorni jezik i probleme komunikacije između ljudi i računala); U govornim tehnologijama – učinkovito prepoznavanje govora i sinteza govora, stjecanje i priprema novih podataka gdje je količina dostupnih podataka mala;- automatizirano prevođenje – za stvaranje najboljih prijevoda različitih tekstnih jedinica; Automatizirani rječnici;- modeliranje komunikacije između ljudi i računala – zadaci razumijevanja prirodnog jezika, upravljanja dijalogom i generiranja prirodnog jezika. Proučavat će se i kognitivni aspekti modeliranja dijaloga, pronalaženja znanja i upravljanja njima te njihova modeliranja u neuronskim mrežama. Proučavat će se različite NT arhitekture, uključujući duboku rekurzivnost (na engleskom: Duboko ponavljanje), duboko jednosmjerno (na engleskom jeziku: Značajka-naprijed) NT, i učinkoviti NT trening algoritmi za rješavanje problema grebanja podataka, morfološke raznolikosti i problema s oskudicom resursa. Proučavat će se kognitivni procesi – jezik, vizualna percepcija, semantička obrada – empirijska (korelativna, eksperimentalna). Stečena znanja koristit će se za stvaranje inovativnih fleksibilnih metoda obrade jezika. Teorijski rezultati studije bit će sažeti u publikacijama najmanje 15 časopisa ili konferencijskih članaka iz Web of Science ili SCOPUS baza podataka.Teoretski rezultati studije ispitat će se u laboratorijskim prototipovima (TRL 4), kao i objedinjenoj komunikaciji čovjeka i računala (TRL 5). Najuspješnija rješenja bit će objavljena kao rješenja otvorenog koda.Rezultati planiranog istraživanja imaju veliki potencijal za komercijalizaciju, stoga će se nakon završetka projekta nastaviti njihov razvoj i stabilizacija kako bi se stvorili inovativni softverski proizvodi za latvijsko i europsko tržište. Projekt je projekt povezan s gospodarskim aktivnostima, provodit će se u suradnji trgovca (Tilde) i istraživačke ustanove (Sveučilište u Latviji), a trajat će od 1. studenog 2016. do 31. listopada 2019. Ukupni trošak projekta iznosi 690 672,13 EUR, uključujući potporu EFRR-a 484 384,04 EUR. Kategorija istraživanja projekta – eksperimentalni razvoj i industrijsko istraživanje. Projekt, prema Frascati priručniku, odgovara ICT znanstvenoj industriji „1.2 Računalne i informacijske znanosti” (Croatian)
    3 August 2022
    0 references
    Η ανάπτυξη σύγχρονων λύσεων ΤΠΕ είναι αδιανόητη χωρίς γλωσσικές τεχνολογίες που εξασφαλίζουν τη διαθεσιμότητα λύσεων στη μητρική γλώσσα του χρήστη. Η μελέτη meta-NET (Rehm&Uszkoreit, 2013) επισημαίνει σημαντικές διαφορές στο επίπεδο ανάπτυξης των γλωσσικών τεχνολογιών. Οι μεγάλες γλώσσες του κόσμου χαρακτηρίζονται «καλές έως εξαιρετικές», ενώ οι γλώσσες με μικρό αριθμό ομιλητών βαθμολογούνται «από μέτριο σε χαμηλό». Η γεφύρωση αυτού του χάσματος αποτελεί μείζονα πρόκληση, οι μέθοδοι που χρησιμοποιούνται στις σύγχρονες γλωσσικές τεχνολογίες απαιτούν μεγάλες διεισδύσεις δεδομένων, οι οποίες απουσιάζουν ιδιαίτερα για τις μικρές γλώσσες με πλούσια μορφολογία. Μία από τις πιο ελπιδοφόρες εξελίξεις στις λύσεις ΤΠΕ είναι η χρήση των τεχνολογιών νευρωνικών δικτύων (NT). Τα NTS χρησιμοποιούνται με επιτυχία σε γλώσσες όπως τα αγγλικά, τα γαλλικά, τα ισπανικά και τα κινεζικά, αλλά δεν έχουν πραγματοποιηθεί ακόμη βαθιές μελέτες σε μικρές γλώσσες με ανεπαρκείς γλωσσικούς πόρους, όπως λευκές, φινλανδικές-ουγκρανικές και σλαβικές γλώσσες. Η ανάγκη να γεφυρωθεί το χάσμα στην ανάπτυξη των γλωσσικών τεχνολογιών και η μελλοντική χρήση της τεχνολογίας NT ανοίγει μια μεγάλη ευκαιρία για την ομάδα του έργου στη Ρίγα της Λετονίας. Το σχέδιο αυτό και τα αναμενόμενα αποτελέσματά του θα επιτρέψουν στη Λετονία να αναλάβει ηγετική θέση στην έρευνα των γλωσσικών τεχνολογιών και στη δημιουργία καινοτόμων λύσεων. Η Λετονία έχει ήδη φθάσει σε υψηλό επίπεδο στον τομέα αυτό, χάρη στη στενή συνεργασία μεταξύ του ακαδημαϊκού περιβάλλοντος και των εμπορικών δομών. Η Λετονία συμμετέχει στην έρευνα με άλλα ευρωπαϊκά έθνη και είναι κατάλληλη για τη δημιουργία ενός περιφερειακού κέντρου έρευνας και καινοτομίας στον τομέα των γλωσσικών τεχνολογιών.Το σχέδιο θα διερευνήσει, θα αναλύσει και θα αξιολογήσει διάφορους αλγορίθμους ΝΤ (τόσο αυτόματες μέθοδοι όσο και χειροκίνητα) για την εξεύρεση των καταλληλότερων λύσεων για διάφορα σημαντικά καθήκοντα γλωσσικών τεχνολογιών: — επεξεργασία γραπτού κειμένου — συντακτική ανάλυση κειμένων, αξιολόγηση γραμματικής και διόρθωση γραμματικών σφαλμάτων (τα στοιχεία αυτά θα χρησιμοποιηθούν επίσης για την αυτοματοποιημένη μετάφραση, την προφορική γλώσσα και τα προβλήματα επικοινωνίας ανθρώπου-υπολογιστή)· Στις τεχνολογίες ομιλίας — αποτελεσματική αναγνώριση ομιλίας και σύνθεση ομιλίας, απόκτηση και προετοιμασία νέων δεδομένων όπου ο όγκος των διαθέσιμων δεδομένων είναι μικρός·- αυτοματοποιημένη μετάφραση — για τη δημιουργία των καλύτερων μεταφράσεων των διαφόρων μονάδων κειμένου· Αυτοματοποιημένα λεξικά·- μοντελοποίηση επικοινωνίας ανθρώπου-υπολογιστή — καθήκοντα κατανόησης της φυσικής γλώσσας, διαχείρισης του διαλόγου και δημιουργίας φυσικής γλώσσας. Θα μελετηθούν επίσης γνωστικές πτυχές της μοντελοποίησης του διαλόγου, της ανάκτησης και διαχείρισης γνώσεων και της μοντελοποίησής τους σε νευρωνικά δίκτυα. Θα μελετηθούν διαφορετικές NT αρχιτεκτονικές, συμπεριλαμβανομένων βαθέων αναδρομικών (στα αγγλικά: Βαθιά επανάληψη), βαθιά μονόδρομος (στα αγγλικά: NT, και αποδοτικοί αλγόριθμοι εκπαίδευσης NT για την αντιμετώπιση προβλημάτων ξύσιμου δεδομένων, μορφολογικής ποικιλομορφίας και έλλειψης πόρων. Θα μελετηθούν γνωστικές διεργασίες — γλώσσα, οπτική αντίληψη, σημασιολογική επεξεργασία — εμπειρικές (σχετικές, πειραματικές). Οι γνώσεις που αποκτήθηκαν θα χρησιμοποιηθούν για τη δημιουργία καινοτόμων ευέλικτων μεθόδων γλωσσικής επεξεργασίας. Τα θεωρητικά αποτελέσματα της μελέτης θα συνοψιστούν στις δημοσιεύσεις τουλάχιστον 15 περιοδικών ή άρθρων συνεδρίων από βάσεις δεδομένων Web of Science ή SCOPUS.Τα θεωρητικά αποτελέσματα της μελέτης θα εξεταστούν σε εργαστηριακά πρωτότυπα (TRL 4), καθώς και σε συγκεντρωτική επικοινωνία ανθρώπου-υπολογιστή (TRL 5). Οι πιο επιτυχημένες λύσεις θα δημοσιευθούν ως λύσεις ανοικτής πηγής. Τα αποτελέσματα της προγραμματισμένης έρευνας έχουν μεγάλες δυνατότητες εμπορευματοποίησης, ως εκ τούτου μετά το τέλος του έργου θα συνεχιστεί η ανάπτυξη και η σταθεροποίησή τους προκειμένου να δημιουργηθούν καινοτόμα προϊόντα λογισμικού για τη λετονική και την ευρωπαϊκή αγορά. Το έργο είναι ένα έργο που σχετίζεται με οικονομικές δραστηριότητες, θα υλοποιηθεί σε συνεργασία μεταξύ του εμπόρου (Tilde) και του ερευνητικού ιδρύματος (Πανεπιστήμιο της Λετονίας) και θα διαρκέσει από την 1η Νοεμβρίου 2016 έως τις 31 Οκτωβρίου 2019. Το συνολικό κόστος του έργου ανέρχεται σε 690 672,13 EUR, συμπεριλαμβανομένης της στήριξης του ΕΤΠΑ 484 384,04 EUR. Ερευνητική κατηγορία του έργου — πειραματική ανάπτυξη και βιομηχανική έρευνα. Το έργο, σύμφωνα με το εγχειρίδιο Frascati, αντιστοιχεί στην επιστημονική βιομηχανία ΤΠΕ «1.2 Επιστήμες υπολογιστών και πληροφοριών» (Greek)
    3 August 2022
    0 references
    Vývoj moderných riešení IKT je nepredstaviteľný bez jazykových technológií zabezpečujúcich dostupnosť riešení v materinskom jazyku používateľa. Štúdia meta-NET (Rehm&Uszkoreit, 2013) poukazuje na výrazné rozdiely v úrovni vývoja jazykových technológií. Veľké svetové jazyky sú hodnotené ako „dobré až vynikajúce“, zatiaľ čo jazyky s malým počtom reproduktorov sú hodnotené „stredné až nízke“. Preklenutie tejto priepasti je veľkou výzvou, metódy používané v moderných jazykových technológiách si vyžadujú veľké prenikanie dát, ktoré chýbajú najmä pre malé jazyky fleXive s bohatou morfológiou. Jedným z najsľubnejších riešení v oblasti IKT je využívanie technológií neurónových sietí (NT). NTS sa úspešne používajú v jazykoch, ako je angličtina, francúzština, španielčina a čínština, ale hlboké štúdium sa ešte neuskutočnilo v malých jazykoch s nedostatočnými jazykovými zdrojmi, ako sú biele, fínsko-ugričské a slovanské jazyky. Potreba preklenúť priepasť vo vývoji jazykových technológií a perspektívne využívanie technológie NT otvára pre projektový tím v Rige v Lotyšsku veľkú príležitosť. Tento projekt a jeho očakávané výsledky umožnia Lotyšsku zaujať vedúce postavenie vo výskume jazykových technológií a vytváraní inovatívnych riešení. Lotyšsko už v tejto oblasti dosiahlo vysokú úroveň, ktorú zabezpečuje úzka spolupráca medzi akademickým prostredím a obchodnými štruktúrami. Lotyšsko sa podieľa na výskume s inými európskymi národmi a je vhodné na vytvorenie regionálneho centra pre výskum a inováciu jazykových technológií. Projekt bude skúmať, analyzovať a hodnotiť rôzne NT algoritmy (automatické aj manuálne) s cieľom nájsť najvhodnejšie riešenia pre niekoľko dôležitých úloh jazykových technológií:- spracovanie písaného textu – syntaktická analýza textov, vyhodnotenie gramatiky a oprava gramatických chýb (tieto zložky sa použijú aj na automatizovaný preklad, hovorený jazyk a problémy s komunikáciou človek-počítač); V oblasti reči – účinné rozpoznávanie reči a syntéza reči, získavanie a príprava nových údajov, kde je množstvo dostupných údajov malé;- automatizovaný preklad – na vytvorenie najlepších prekladov rôznych textových jednotiek; Automatizované slovníky;- modelovanie komunikácie človek-počítač – úlohy rozumieť prirodzenému jazyku, riadiť dialóg a vytvárať prirodzený jazyk. Preskúmajú sa aj kognitívne aspekty modelovania dialógu, získavanie a riadenie poznatkov a ich modelovanie v neurónových sieťach. Budú sa študovať rôzne architektúry NT vrátane hlboko rekurzívnych (v angličtine: Hlboké opakujúce sa), hlboké jednosmerné (v angličtine: Funkcia vpred) NT a efektívne NT tréningové algoritmy na riešenie škrabania údajov, morfologickej rozmanitosti a problémov s nedostatkom zdrojov. Budú sa študovať kognitívne procesy – jazyk, vizuálne vnímanie, sémantické spracovanie – empirické (korelatívne, experimentálne). Získané znalosti sa použijú na vytvorenie inovatívnych flexibilných metód spracovania jazykov. Teoretické výsledky štúdie budú zhrnuté v publikáciách minimálne 15 časopisov alebo konferenčných článkov z Web of Science alebo SCOPUS databáz.Teoretické výsledky štúdie budú testované v laboratórnych prototypoch (TRL 4), ako aj v združenej komunikácii človek-počítač (TRL 5). Najúspešnejšie riešenia budú zverejnené ako open source riešenia.Výsledky plánovaného výskumu majú veľký potenciál komercializácie, preto po ukončení projektu budú pokračovať ich vývoj a stabilizácia s cieľom vytvárať inovatívne softvérové produkty pre lotyšský a európsky trh. Projekt je projekt týkajúci sa hospodárskych aktivít, bude realizovaný v spolupráci medzi obchodníkom (Tilde) a výskumnou inštitúciou (Univerzita Lotyšska) a bude prebiehať od 1. novembra 2016 do 31. októbra 2019. Celkové náklady na projekt sú 690 672,13 EUR vrátane podpory z EFRR 484 384,04 EUR. Kategória výskumu projektu – experimentálny vývoj a priemyselný výskum. Projekt podľa príručky Frascati zodpovedá vedeckému priemyslu IKT „1.2 Počítačové a informačné vedy“. (Slovak)
    3 August 2022
    0 references
    Nykyaikaisten tieto- ja viestintäteknisten ratkaisujen kehittäminen on käsittämätöntä ilman kieliteknologiaa, joka takaa ratkaisujen saatavuuden käyttäjän äidinkielellä. Meta-NET-tutkimus (Rehm&Uszkoreit, 2013) viittaa merkittäviin eroihin kieliteknologian kehitystasossa. Maailman suuret kielet on luokiteltu ”hyvästä erinomaiseen”, kun taas kielet, joissa on pieni määrä puhujia, luokitellaan ”keskitasosta alhaiseen”. Tämän kuilun umpeen kurominen on suuri haaste, ja nykyaikaisessa kielitekniikassa käytettävät menetelmät edellyttävät suuria tiedonsiirtoja, jotka puuttuvat erityisesti pienistä fleXive-kielistä, joilla on rikas morfologia. Yksi lupaavimmista tieto- ja viestintäteknisten ratkaisujen kehityksestä on Neural Network Technologiesin (NT) käyttö. NTS:ää käytetään menestyksekkäästi englannin, ranskan, espanjan ja kiinan kaltaisilla kielillä, mutta perusteellisia tutkimuksia ei ole vielä suoritettu pienillä kielillä, joilla ei ole riittävästi kielellisiä resursseja, kuten valkoisilla, suomen-ugrilais- ja slaavilaiskielillä. Tarve kuroa umpeen kuilu kieliteknologian kehittämisessä ja NT-teknologian tuleva käyttö avaa suuren tilaisuuden Riian hankeryhmälle Latviassa. Tämä hanke ja sen odotetut tulokset antavat Latvialle mahdollisuuden ottaa johtava asema kieliteknologian tutkimuksessa ja innovatiivisten ratkaisujen luomisessa. Latvia on jo saavuttanut korkean tason tällä alalla, mikä varmistetaan akateemisen ympäristön ja kaupallisten rakenteiden tiiviillä yhteistyöllä. Latvia osallistuu tutkimukseen muiden Euroopan maiden kanssa ja soveltuu kieliteknologian alueellisen tutkimus- ja innovaatiokeskuksen perustamiseen. Hankkeessa tutkitaan, analysoidaan ja arvioidaan erilaisia NT-algoritmeja (sekä automaattisia että käsin) sopivimpia ratkaisuja moniin tärkeisiin kieliteknologian tehtäviin: – kirjallisen tekstin käsittely – tekstien syntaktinen analyysi, kieliopin arviointi ja kielioppivirheiden korjaaminen (näitä komponentteja käytetään myös automaattiseen kääntämiseen, puhuttuun kieleen ja ihmisen ja tietokoneen viestintäongelmiin); Puheteknologioissa – tehokas puheentunnistus ja puhesynteesi, uusien tietojen hankkiminen ja valmistelu silloin, kun käytettävissä oleva tietomäärä on pieni; – automatisoitu kääntäminen – eri tekstiyksiköiden parhaiden käännösten luomiseksi; Automatisoidut sanakirjat;- ihmisen ja tietokoneen viestinnän mallintaminen – luonnollisen kielen ymmärtäminen, vuoropuhelun hallinta ja luonnollisen kielen luominen. Lisäksi tutkitaan vuoropuhelun mallintamisen kognitiivisia näkökohtia, tiedonhakua ja hallintaa sekä niiden mallintamista hermoverkostoissa. Tutkitaan erilaisia NT-arkkitehtuureja, myös syvärekursiivisia (englanniksi: Deep Recurrent), syvä yksisuuntainen (englanniksi: Ominaisuus eteenpäin) NT ja tehokkaat NT-koulutusalgoritmit, joilla puututaan tietojen raapimiseen, morfologiseen monimuotoisuuteen ja resurssien niukkuuteen liittyviin ongelmiin. Kognitiivisia prosesseja – kieltä, visuaalista havainnointia, semanttista käsittelyä – empiirisiä (korrelatiivisia, kokeellisia) tutkitaan. Hankittua osaamista käytetään innovatiivisten joustavien kielten käsittelymenetelmien luomiseen. Tutkimuksen teoreettiset tulokset esitetään tiivistetysti vähintään 15 julkaisussa tai konferenssiartikkeleissa Web of Science- tai SCOPUS-tietokannoista. Tutkimuksen teoreettiset tulokset testataan laboratorioprototyypeissä (TRL 4) sekä yhdistetyssä ihmisen ja tietokoneen välisessä viestinnässä (TRL 5). Menestyksekkäimmät ratkaisut julkaistaan avoimen lähdekoodin ratkaisuina. Suunnitellun tutkimuksen tuloksilla on hyvät mahdollisuudet kaupallistamiseen, joten hankkeen päätyttyä niiden kehittäminen ja vakauttaminen jatkuu innovatiivisten ohjelmistotuotteiden luomiseksi Latvian ja Euroopan markkinoille. Hanke on taloudellista toimintaa koskeva hanke, joka toteutetaan yhteistyössä kauppiaan (Tilde) ja tutkimuslaitoksen (Latvian yliopisto) välillä ja kestää 1. marraskuuta 2016–31. lokakuuta 2019. Hankkeen kokonaiskustannukset ovat 690672,13 euroa, mukaan lukien EAKR:n tuki 484384,04 euroa. Hankkeen tutkimusluokka – kokeellinen kehittäminen ja teollinen tutkimus. Frascatin käsikirjan mukaan hanke vastaa tieto- ja viestintätekniikan tiedeteollisuutta ”1.2 Tieto- ja viestintätekniikka”. (Finnish)
    3 August 2022
    0 references
    Rozwój nowoczesnych rozwiązań ICT jest niewyobrażalny bez technologii językowych zapewniających dostępność rozwiązań w języku ojczystym użytkownika. Badanie meta-NET (Rehm&Uszkoreit, 2013) wskazuje na znaczne różnice w poziomie rozwoju technologii językowych. Wielkie języki świata są oceniane jako „dobre do doskonałego”, podczas gdy języki z niewielką liczbą głośników są oceniane „od średniego do niskiego”. Zniwelowanie tej luki jest poważnym wyzwaniem, metody stosowane w nowoczesnych technologiach językowych wymagają dużej penetracji danych, których szczególnie brakuje w przypadku małych języków fleXive o bogatej morfologii. Jednym z najbardziej obiecujących rozwiązań w dziedzinie ICT jest wykorzystanie technologii sieci neuronowej (NT). NTS są z powodzeniem stosowane w takich językach jak angielski, francuski, hiszpański i chiński, ale nie przeprowadzono jeszcze głębokich studiów w małych językach o niewystarczających zasobach językowych, takich jak języki białe, fińskie i słowiańskie. Potrzeba zniwelowania luki w rozwoju technologii językowych i perspektywicznego wykorzystania technologii NT otwiera dla zespołu projektowego w Rydze na Łotwie wielką szansę. Projekt ten i jego oczekiwane wyniki umożliwią Łotwie zajęcie wiodącej pozycji w badaniach nad technologiami językowymi i tworzeniu innowacyjnych rozwiązań. Łotwa osiągnęła już wysoki poziom w tej dziedzinie, co zapewniła ścisła współpraca między środowiskiem akademickim a strukturami handlowymi. Łotwa uczestniczy w badaniach z innymi narodami europejskimi i nadaje się do utworzenia regionalnego centrum badań i innowacji w zakresie technologii językowych. Projekt będzie analizował, analizował i oceniał różne algorytmy NT (zarówno metody automatyczne, jak i ręcznie), aby znaleźć najbardziej odpowiednie rozwiązania dla kilku ważnych zadań technologii językowych: – przetwarzanie tekstu pisanego – syntaktyczna analiza tekstów, ocena gramatyki i korekta błędów gramatycznych (te elementy będą również wykorzystywane do tłumaczenia automatycznego, mówionego języka i problemów komunikacyjnych między człowiekiem a komputerem); W technologiach mowy – skuteczne rozpoznawanie mowy i synteza mowy, pozyskiwanie i przygotowywanie nowych danych tam, gdzie ilość dostępnych danych jest niewielka;- automatyczne tłumaczenie – do tworzenia najlepszych tłumaczeń różnych działów tekstowych; Automatyczne słowniki;- modelowanie komunikacji człowiek-komputer – zadania zrozumienia języka naturalnego, zarządzania dialogiem i generowania języka naturalnego. Zbadane zostaną również poznawcze aspekty modelowania dialogu, pozyskiwania wiedzy i zarządzania nimi oraz ich modelowania w sieciach neuronowych. Zostaną zbadane różne architektury NT, w tym głębokie rekursywne (w języku angielskim: Deep Recurrent), głębokie jednokierunkowe (w języku angielskim: Funkcja do przodu) NT i skuteczne algorytmy szkoleniowe NT w celu rozwiązania problemów związanych z drapaniem danych, różnorodnością morfologiczną i niedoborem zasobów. Procesy poznawcze – język, percepcja wizualna, przetwarzanie semantyczne – empiryczne (korelacyjne, eksperymentalne). Zdobyta wiedza zostanie wykorzystana do stworzenia innowacyjnych, elastycznych metod przetwarzania języka. Teoretyczne wyniki badania zostaną podsumowane w publikacjach co najmniej 15 czasopism lub artykułów konferencyjnych z baz danych Web of Science lub SCOPUS. Teoretyczne wyniki badania będą testowane w prototypach laboratoryjnych (TRL 4), a także w zbiorczej komunikacji człowiek-komputer (TRL 5). Najbardziej udane rozwiązania zostaną opublikowane jako rozwiązania open source.Wyniki planowanych badań mają ogromny potencjał komercjalizacji, dlatego po zakończeniu projektu ich rozwój i stabilizacja będą kontynuowane w celu stworzenia innowacyjnych produktów oprogramowania na rynku łotewskim i europejskim. Projekt jest projektem związanym z działalnością gospodarczą, będzie realizowany we współpracy między handlowcem (Tilde) a instytucją badawczą (Uniwersytet Łotewski) i będzie realizowany od 1 listopada 2016 r. do 31 października 2019 r. Całkowity koszt projektu wynosi 690 672,13 EUR, w tym wsparcie z EFRR 484 384,04 EUR. Kategoria badawcza projektu – rozwój eksperymentalny i badania przemysłowe. Projekt, zgodnie z podręcznikiem Frascati, odpowiada sektorowi nauki ICT „1.2 Informatyka i informatyka” (Polish)
    3 August 2022
    0 references
    A modern IKT-megoldások kifejlesztése elképzelhetetlen anélkül, hogy nyelvi technológiák biztosítanák a megoldások elérhetőségét a felhasználó anyanyelvén. A meta-NET tanulmány (Rehm&Uszkoreit, 2013) jelentős különbségeket mutat a nyelvi technológiák fejlettségi szintjében. A világ nagyszerű nyelveit „jótól kiválóig” értékelik, míg a kevés beszélővel rendelkező nyelveket „közepestől az alacsonyig” értékelik. E szakadék áthidalása nagy kihívást jelent, a modern nyelvi technológiákban alkalmazott módszerek nagy adatátvitelt igényelnek, ami különösen hiányzik a gazdag morfológiával rendelkező kis fleXív nyelvek esetében. Az IKT-megoldások egyik legígéretesebb fejleménye a Neural Network Technologies (NT) alkalmazása. Az NTS-t sikeresen használják olyan nyelveken, mint az angol, a francia, a spanyol és a kínai, de még nem végeztek mély tanulmányokat olyan kis nyelveken, amelyek nem rendelkeznek elegendő nyelvi forrással, például fehér, finn-ugrikus és szláv nyelven. A nyelvi technológiák fejlesztésében mutatkozó szakadék áthidalásának és az NT-technológia jövőbeli alkalmazásának szükségessége nagy lehetőséget kínál a lettországi rigai projektcsapat számára. Ez a projekt és várható eredményei lehetővé teszik Lettország számára, hogy vezető szerepet töltsön be a nyelvi technológiák kutatásában és az innovatív megoldások létrehozásában. Lettország már magas szintet ért el ezen a területen, amelyet a tudományos környezet és a kereskedelmi struktúrák közötti szoros együttműködés biztosít. Lettország részt vesz más európai nemzetekkel folytatott kutatásban, és alkalmas a nyelvi technológiák kutatására és innovációjára szolgáló regionális központ létrehozására.A projekt különböző NT algoritmusokat (mind automatikus módszereket, mind manuálisan) vizsgál, elemez és értékel, hogy megtalálja a legmegfelelőbb megoldásokat a nyelvi technológiák számos fontos feladatára:- az írott szöveg feldolgozása – szövegek szintaktikai elemzése, nyelvtani értékelés és nyelvtani hibák korrekciója (ezeket az összetevőket automatizált fordításra, beszélt nyelvre és ember-számítógép kommunikációs problémákra is használják); A beszédtechnológiákban – hatékony beszédfelismerés és beszédszintézis, új adatok beszerzése és előkészítése, ahol a rendelkezésre álló adatok mennyisége kicsi;- automatizált fordítás – a különböző szövegegységek legjobb fordításainak létrehozása érdekében; Automatizált szótárak;- ember-számítógép kommunikációs modellezés – a természetes nyelv megértésével, a párbeszéd irányításával és a természetes nyelv generálásával kapcsolatos feladatok. A párbeszéd modellezésének, a tudás visszakeresésének és kezelésének kognitív szempontjait, valamint a neurális hálózatokon belüli modellezésüket szintén tanulmányozni fogják. Különböző NT architektúrákat fognak tanulmányozni, beleértve a mély rekurzív (angol nyelven: Mély visszatérő), mély egyirányú (angolul: Funkció előre) NT, és hatékony NT képzési algoritmusok az adatkarcolások, a morfológiai sokféleség és az erőforráshiány problémáinak kezelésére. Kognitív folyamatok – nyelv, vizuális érzékelés, szemantikai feldolgozás – empirikus (korrelatív, kísérleti) fogják tanulmányozni. A megszerzett ismereteket innovatív, rugalmas nyelvfeldolgozási módszerek létrehozására használják fel. A tanulmány elméleti eredményeit a Web of Science vagy a SCOPUS adatbázisok legalább 15 folyóiratának vagy konferenciacikkének kiadványai foglalják össze.A tanulmány elméleti eredményeit laboratóriumi prototípusokban (TRL 4), valamint az egyesített ember-számítógép kommunikációban (TRL 5) tesztelik. A legsikeresebb megoldásokat nyílt forráskódú megoldásként teszik közzé.A tervezett kutatás eredményei nagy lehetőségeket rejtenek magukban a kereskedelmi hasznosítás szempontjából, ezért a projekt befejezése után fejlesztésük és stabilizációjuk folytatódni fog annak érdekében, hogy innovatív szoftvertermékeket hozzanak létre a lett és az európai piacon. A projekt gazdasági tevékenységekhez kapcsolódó projekt, a kereskedő (Tilde) és a kutatóintézet (Lett Egyetem) együttműködésével valósul meg, és 2016. november 1-jétől 2019. október 31-ig tart. A projekt összköltsége 690 672,13 EUR, beleértve az ERFA-támogatást 484 384,04 EUR. A projekt kutatási kategóriája – kísérleti fejlesztés és ipari kutatás. A Frascati-kézikönyv szerint a projekt megfelel az „1.2 Számítógép- és információtudományok” IKT-tudományos iparágnak. (Hungarian)
    3 August 2022
    0 references
    Vývoj moderních řešení IKT je nepředstavitelný bez jazykových technologií zajišťujících dostupnost řešení v mateřském jazyce uživatele. Studie meta-NET (Rehm&Uszkoreit, 2013) poukazuje na významné rozdíly v úrovni vývoje jazykových technologií. Světové skvělé jazyky jsou hodnoceny jako „dobré až vynikající“, zatímco jazyky s malým počtem mluvčích jsou hodnoceny „od střední až po nízkou“. Překlenutí této mezery je velkou výzvou, protože metody používané v moderních jazykových technologiích vyžadují rozsáhlé rozšíření dat, které chybí zejména pro malé fleXive jazyky s bohatou morfologií. Jedním z nejslibnějších vývoje v oblasti řešení IKT je využívání technologií neuronové sítě (NT). NTS se úspěšně používá v jazycích, jako je angličtina, francouzština, španělština a čínština, ale hluboké studium dosud nebylo provedeno v malých jazycích s nedostatečnými jazykovými zdroji, jako je bílý, finsko-ugrský a slovanský jazyk. Potřeba překlenout mezeru ve vývoji jazykových technologií a budoucí využití technologie NT otevírá projektovému týmu v lotyšské Rize velkou příležitost. Tento projekt a jeho očekávané výsledky umožní Lotyšsku zaujmout vedoucí postavení ve výzkumu jazykových technologií a při vytváření inovativních řešení. Lotyšsko již v této oblasti dosáhlo vysoké úrovně, kterou zajišťuje úzká spolupráce mezi akademickým prostředím a obchodními strukturami. Lotyšsko se podílí na výzkumu s dalšími evropskými národy a je vhodné pro vytvoření regionálního centra pro výzkum a inovace jazykových technologií. Projekt bude zkoumat, analyzovat a vyhodnocovat různé algoritmy NT (a to jak automatické metody, tak ručně) s cílem nalézt nejvhodnější řešení pro několik důležitých úkolů jazykových technologií:- zpracování písemného textu – syntaktická analýza textů, hodnocení gramatiky a korekce gramatických chyb (tyto složky budou rovněž použity pro automatizovaný překlad, mluvený jazyk a problémy komunikace mezi člověkem a počítačem); V řečových technologiích – efektivní rozpoznávání řeči a syntéze řeči, získávání a příprava nových dat, kde je množství dostupných dat malé;- automatizovaný překlad – pro vytvoření nejlepších překladů různých textových jednotek; Automatizované slovníky;- modelování komunikace člověk-počítač – úkoly porozumění přirozenému jazyku, řízení dialogu a vytváření přirozeného jazyka. Budou rovněž zkoumány kognitivní aspekty modelování dialogu, získávání a řízení znalostí a jejich modelování v neuronových sítích. Budou studovány různé architektury NT, včetně hluboké rekurzivní (v angličtině: Hluboké opakování), hluboké jednosměrné (v angličtině: Funkce-forward) NT a efektivní NT tréninkové algoritmy pro řešení poškrábání dat, morfologické rozmanitosti a problémů s nedostatkem zdrojů. Budou studovány kognitivní procesy – jazyk, vizuální vnímání, sémantické zpracování – empirické (korelativní, experimentální). Získané znalosti budou využity k vytvoření inovativních flexibilních metod zpracování jazyka. Teoretické výsledky studie budou shrnuty v publikacích alespoň 15 časopisů nebo konferenčních článků z databází Web of Science nebo SCOPUS. Teotické výsledky studie budou testovány v laboratorních prototypech (TRL 4), jakož i v kombinované komunikaci člověk-počítač (TRL 5). Nejúspěšnější řešení budou zveřejněna jako open source řešení.Výsledky plánovaného výzkumu mají velký potenciál pro komercializaci, a proto po skončení projektu bude jejich vývoj a stabilizace pokračovat s cílem vytvořit inovativní softwarové produkty pro lotyšský a evropský trh. Projekt je projekt týkající se ekonomických činností, bude realizován ve spolupráci mezi obchodníkem (Tilde) a výzkumnou institucí (Lotyšská univerzita) a bude probíhat od 1. listopadu 2016 do 31. října 2019. Celkové náklady na projekt činí 690 672,13 EUR, včetně podpory z EFRR 484 384,04 EUR. Výzkumná kategorie projektu – experimentální vývoj a průmyslový výzkum. Projekt podle příručky Frascati odpovídá odvětví informačních a komunikačních technologií „1.2 Počítačové a informační vědy“. (Czech)
    3 August 2022
    0 references
    Ní féidir réitigh nua-aimseartha TFC a fhorbairt gan teicneolaíochtaí teanga, rud a chinnteoidh go mbeidh réitigh ar fáil i máthairtheanga an úsáideora. Léiríonn an staidéar meta-NET (Rehm &Uszkoreit, 2013) difríochtaí suntasacha i leibhéal forbartha na dteicneolaíochtaí teanga. Tá rátáil “mhaith don scoth” ar theangacha móra an domhain, agus déantar na teangacha a bhfuil líon beag cainteoirí acu a rátáil “ó mheán go híseal”. Is dúshlán mór é an bhearna seo a dhúnadh, tá gá le dul i bhfód mór sonraí ar na modhanna a úsáidtear i dteicneolaíochtaí nua-aimseartha, rud atá in easnamh go háirithe do na teangacha beaga solúbtha ina bhfuil moirfeolaíocht shaibhir. Ceann de na forbairtí is mó a bhfuil gealladh fúthu i réitigh TFC is ea úsáid Teicneolaíochtaí Líonra Neural (NT). Úsáidtear NTS go rathúil i dteangacha amhail an Béarla, an Fhraincis, an Spáinnis agus an tSínis, ach ní dhearnadh staidéar domhain go fóill i dteangacha beaga nach bhfuil go leor acmhainní teanga acu, amhail teangacha bána, Fionlainnise-Úgracha agus Slavacha. Tugann an gá atá ann an bhearna i bhforbairt teicneolaíochtaí teanga a dhúnadh agus an úsáid a d’fhéadfaí a bhaint as teicneolaíocht NT deis iontach d’fhoireann an tionscadail i Ríge na Laitvia. Leis an tionscadal seo agus na torthaí a bhfuiltear ag súil leo, beidh an Laitvia in ann ról ceannasach a ghlacadh sa taighde ar theicneolaíochtaí teanga agus ar réitigh nuálacha a chruthú. Tá ardleibhéal bainte amach ag an Laitvia sa réimse sin cheana féin, rud a chinntítear trí dhlúthchomhar idir an timpeallacht acadúil agus struchtúir thráchtála. Glacann an Laitvia páirt i dtaighde i gcomhar le náisiúin Eorpacha eile agus tá sí oiriúnach chun ionad réigiúnach a chruthú le haghaidh taighde agus nuálaíochta ar theicneolaíochtaí teanga.Déanfar iniúchadh, anailís agus meastóireacht sa tionscadal ar algartaim éagsúla NT (modhanna uathoibríocha agus de láimh araon) chun teacht ar na réitigh is oiriúnaí do roinnt tascanna tábhachtacha a bhaineann le teicneolaíochtaí teanga:- téacs scríofa a phróiseáil — anailís shinticiúil ar théacsanna, meastóireacht ar ghramadach agus ceartú earráidí gramadaí (úsáidfear na comhpháirteanna sin freisin le haghaidh aistriúcháin uathoibrithe, teanga labhartha agus fadhbanna cumarsáide idir daoine); I dteicneolaíochtaí urlabhra — aithint éifeachtach urlabhra agus sintéis urlabhra, sonraí nua a fháil agus a ullmhú i gcás inar beag an méid sonraí atá ar fáil;- aistriúchán uathoibríoch — chun na haistriúcháin is fearr ar aonaid téacs éagsúla a chruthú; Foclóirí uathoibrithe;- samhaltú cumarsáide idir daoine — tascanna chun an teanga nádúrtha a thuiscint, idirphlé a bhainistiú agus teanga nádúrtha a ghiniúint. Déanfar staidéar freisin ar ghnéithe cognaíocha de shamhaltú idirphlé, aisghabháil agus bainistiú eolais agus a samhaltú i líonraí néaracha. Déanfar staidéar ar ailtireacht NT éagsúla, lena n-áirítear atarlú domhain (i mBéarla: Deep Recurrent), domhain aontreo (i mBéarla: Gné-ar aghaidh) NT, agus algartaim oiliúna NT éifeachtach chun aghaidh a thabhairt scratching sonraí, éagsúlacht mhoirfeolaíoch agus fadhbanna ganntanas acmhainní. Déanfar staidéar ar phróisis chognaíoch — teanga, dearcadh amhairc, próiseáil séimeantach — eimpíreach (comhghaolmhar, turgnamhach). Úsáidfear an t-eolas a fuarthas chun modhanna nuálacha solúbtha próiseála teanga a chruthú. Beidh na torthaí teoiriciúla an staidéir a achoimriú i bhfoilseacháin ar a laghad 15 irisí nó ailt comhdhála ó Web of Science nó SCOPUS bunachair sonraí.Beidh na torthaí teoiriciúla an staidéir a thástáil i fréamhshamhlacha saotharlainne (TRL 4), chomh maith le cumarsáid duine-ríomhaire comhthiomsaithe (TRL 5). Foilseofar na réitigh is rathúla mar réitigh foinse oscailte.Tá acmhainneacht mhór ag torthaí an taighde atá beartaithe chun tráchtálú a dhéanamh, dá bhrí sin, tar éis dheireadh an tionscadail, leanfar lena bhforbairt agus lena gcobhsú chun táirgí bogearraí nuálacha a chruthú don mhargadh Laitviach agus don mhargadh Eorpach.Is tionscadal é a bhaineann le gníomhaíochtaí eacnamaíocha, cuirfear chun feidhme é i gcomhar idir an ceannaí (Tilde) agus an institiúid taighde (Ollscoil na Laitvia) agus beidh sé ar siúl ón 1 Samhain 2016 go dtí an 31 Deireadh Fómhair 2019. Is é EUR 690672,13 costas iomlán an tionscadail, lena n-áirítear tacaíocht CFRE EUR 484384,04. Catagóir taighde an tionscadail — forbairt thurgnamhach agus taighde tionsclaíoch. De réir lámhleabhar Frascati, comhfhreagraíonn an tionscadal do thionscal eolaíochta TFC “1.2 Eolaíochtaí ríomhaireachta agus faisnéise” (Irish)
    3 August 2022
    0 references
    Razvoj sodobnih rešitev IKT je nepredstavljiv brez jezikovnih tehnologij, ki bi zagotavljale razpoložljivost rešitev v maternem jeziku uporabnika. Študija meta-NET (Rehm&Uszkoreit, 2013) opozarja na pomembne razlike v stopnji razvoja jezikovnih tehnologij. Veliki svetovni jeziki so ocenjeni kot „dobri do odlični“, jeziki z majhnim številom govorcev pa so ocenjeni „od srednjega do nizkega“. Premostitev te vrzeli je velik izziv, metode, ki se uporabljajo v sodobnih jezikovnih tehnologijah, zahtevajo velike prodore podatkov, ki jih še posebej primanjkuje za majhne jezike fleXive z bogato morfologijo. Eden od najobetavnejših dosežkov na področju rešitev IKT je uporaba tehnologij nevronske mreže (NT). NTS se uspešno uporabljajo v jezikih, kot so angleščina, francoščina, španščina in kitajščina, vendar poglobljeni študij še ni bil izveden v majhnih jezikih z nezadostnimi jezikovnimi viri, kot so beli, finsko-ugroški in slovanski jeziki. Potreba po premostitvi vrzeli v razvoju jezikovnih tehnologij in morebitni uporabi tehnologije NT je odlična priložnost za projektno skupino v Rigi v Latviji. Ta projekt in njegovi pričakovani rezultati bodo Latviji omogočili, da prevzame vodilno vlogo na področju raziskav jezikovnih tehnologij in ustvarjanja inovativnih rešitev. Latvija je že dosegla visoko raven na tem področju, kar zagotavlja tesno sodelovanje med akademskim okoljem in poslovnimi strukturami. Latvija sodeluje pri raziskavah z drugimi evropskimi narodi in je primerna za ustanovitev regionalnega centra za raziskave in inovacije jezikovnih tehnologij. Projekt bo raziskal, analiziral in ovrednotil različne algoritme NT (tako avtomatske metode kot ročno), da bi našli najprimernejše rešitve za več pomembnih nalog jezikovnih tehnologij:- obdelavo pisnega besedila – sintaktično analizo besedil, vrednotenje slovnice in popravljanje slovničnih napak (te komponente se bodo uporabljale tudi za avtomatizirano prevajanje, govorjeni jezik in komunikacijske težave med človekom in računalnikom); V govornih tehnologijah – učinkovito prepoznavanje govora in sinteza govora, pridobivanje in priprava novih podatkov, kjer je količina razpoložljivih podatkov majhna;- avtomatiziran prevod – za ustvarjanje najboljših prevodov različnih besedilnih enot; Avtomatizirani slovarji;- modeliranje komunikacije med človekom in računalnikom – naloge razumevanja naravnega jezika, vodenja dialoga in ustvarjanja naravnega jezika. Preučeni bodo tudi kognitivni vidiki modeliranja dialoga, pridobivanja znanja in upravljanja ter njihovega modeliranja v nevronskih mrežah. Preučevali bomo različne NT arhitekture, vključno z globoko rekurzivno (v angleščini: Globoko ponavljanje), globoko enosmerno (v angleščini: Zunanja oblika naprej) NT in učinkoviti algoritmi usposabljanja NT za obravnavanje praskanja podatkov, morfološke raznolikosti in težav s pomanjkanjem virov. Preučevali se bodo kognitivni procesi – jezik, vizualno zaznavanje, semantična obdelava – empirični (korelativni, eksperimentalni). Pridobljeno znanje se bo uporabilo za ustvarjanje inovativnih prožnih metod obdelave jezikov. Teoretični rezultati študije bodo povzeti v publikacijah vsaj 15 revij ali konferenčnih člankov iz Web of Science ali podatkovnih baz SCOPUS.Teoretični rezultati študije bodo preizkušeni v laboratorijskih prototipih (TRL 4) in združeni komunikaciji med človekom in računalnikom (TRL 5). Najuspešnejše rešitve bodo objavljene kot odprtokodne rešitve. Rezultati načrtovanih raziskav imajo velik potencial za komercializacijo, zato se bo po koncu projekta nadaljeval njihov razvoj in stabilizacija, da bi ustvarili inovativne programske izdelke za latvijski in evropski trg. Projekt je projekt, povezan z gospodarskimi dejavnostmi, bo izveden v sodelovanju med trgovcem (Tilde) in raziskovalno institucijo (Univerza v Latviji) in bo potekal od 1. novembra 2016 do 31. oktobra 2019. Skupni stroški projekta znašajo 690 672,13 EUR, vključno s podporo ESRR 484 384,04 EUR. Raziskovalna kategorija projekta – eksperimentalni razvoj in industrijske raziskave. V skladu s Frascatijevim priročnikom projekt ustreza znanstveni industriji IKT „1.2 Računalniška in informacijska znanost“. (Slovenian)
    3 August 2022
    0 references
    Разработването на съвременни ИКТ решения е немислимо, без езиковите технологии да гарантират наличието на решения на майчиния език на потребителя. Проучването Meta-NET (Rehm&Uszkoreit, 2013) сочи значителни различия в нивото на развитие на езиковите технологии. Великите езици в света са оценени като „добри до отлични„, докато езиците с малък брой високоговорители се оценяват „от средни до ниски“. Преодоляването на тази празнина е голямо предизвикателство, тъй като методите, използвани в съвременните езикови технологии, изискват големи проникване на данни, които са особено недостатъчни за малките езици с богата морфология. Едно от най-обещаващите разработки в областта на ИКТ решенията е използването на невронни мрежови технологии (НТ). НТС се използват успешно на езици като английски, френски, испански и китайски, но все още не са проведени задълбочени проучвания на малки езици с недостатъчни езикови ресурси, като например бели, фински-угрични и славянски езици. Необходимостта от запълване на празнината в развитието на езиковите технологии и бъдещото използване на технологията NT отваря чудесна възможност за екипа по проекта в Рига, Латвия. Този проект и очакваните резултати от него ще позволят на Латвия да заеме водеща позиция в изследването на езиковите технологии и в създаването на иновативни решения. Латвия вече е достигнала високо равнище в тази област, гарантирано от тясното сътрудничество между академичната среда и търговските структури. Латвия участва в научни изследвания с други европейски нации и е подходяща за създаването на регионален център за научни изследвания и иновации в областта на езиковите технологии.Проектът ще проучи, анализира и оцени различни алгоритми на NT (както автоматични методи, така и ръчно), за да намери най-подходящите решения за няколко важни задачи на езиковите технологии:- обработка на писмен текст — синтактичен анализ на текстове, оценка на граматиката и коригиране на граматически грешки (тези компоненти ще бъдат използвани и за автоматизиран превод, говорим език и проблеми, свързани с комуникацията човек-компютър); В говорните технологии — ефективно разпознаване на речта и синтез на реч, придобиване и подготовка на нови данни, когато количеството налични данни е малко;- автоматизиран превод — за създаване на най-добрите преводи на различни текстови единици; Автоматизирани речници;- моделиране на комуникацията човек-компютър — задачи за разбиране на естествения език, управление на диалога и генериране на естествен език. Ще бъдат проучени и когнитивните аспекти на моделирането на диалога, извличането и управлението на знания и тяхното моделиране в невронните мрежи. Ще бъдат проучени различни архитектури на НТ, включително дълбоки рекурсивни (на английски език: Дълбоко повтарящо се), дълбоко еднопосочно (на английски език: Характеристика напред) NT, и ефективни NT тренировъчни алгоритми за справяне с надраскване на данни, морфологично разнообразие и проблеми с недостига на ресурси. Когнитивните процеси — език, визуално възприятие, семантична обработка — емпирични (корелативни, експериментални) ще бъдат проучени. Придобитите знания ще бъдат използвани за създаване на иновативни гъвкави методи за езикова обработка. Теоретичните резултати от проучването ще бъдат обобщени в публикациите на най-малко 15 списания или конферентни статии от Web of Science или SCOPUS бази данни.Теоретичните резултати от изследването ще бъдат тествани в лабораторни прототипи (TRL 4), както и в обединена комуникация човек-компютър (TRL 5). Най-успешните решения ще бъдат публикувани като решения с отворен код.Резултатите от планираните изследвания имат голям потенциал за комерсиализация, затова след края на проекта тяхното разработване и стабилизиране ще продължи, за да се създадат иновативни софтуерни продукти за латвийския и европейския пазар. Проектът е проект, свързан с икономически дейности, той ще бъде реализиран в сътрудничество между търговеца (Tilde) и научноизследователската институция (Университет на Латвия) и ще продължи от 1 ноември 2016 г. до 31 октомври 2019 г. Общата стойност на проекта възлиза на 690 672,13 EUR, включително подкрепата от ЕФРР 484 384,04 EUR. Научноизследователска категория на проекта — експериментално развитие и индустриални изследвания. Проектът, според наръчника на Фраскати, съответства на ИКТ научната индустрия „1.2 Компютърни и информационни науки“. (Bulgarian)
    3 August 2022
    0 references
    L-iżvilupp ta’ soluzzjonijiet moderni tal-ICT huwa inkonċepibbli mingħajr teknoloġiji tal-lingwa li jiżguraw id-disponibbiltà ta’ soluzzjonijiet fil-lingwa materna tal-utent. L-istudju meta-NET (Rehm&Uszkoreit, 2013) jindika differenzi sinifikanti fil-livell ta’ żvilupp tat-teknoloġiji tal-lingwa. Il-lingwi l-kbar tad-dinja huma kklassifikati bħala “tajba għal eċċellenti”, filwaqt li l-lingwi b’numru żgħir ta’ kelliema huma kklassifikati bħala “minn medji sa baxxi”. It-tnaqqis ta’ din id-diskrepanza hija sfida ewlenija, il-metodi użati fit-teknoloġiji moderni tal-lingwa jeħtieġu penetrazzjonijiet kbar tad-data, li huma partikolarment nieqsa għal-lingwi żgħar fleXive b’morfoloġija rikka. Wieħed mill-aktar żviluppi promettenti fis-soluzzjonijiet tal-ICT huwa l-użu tat-Teknoloġiji tan-Netwerk Neurali (NT). L-NTS jintużaw b’suċċess f’lingwi bħall-Ingliż, il-Franċiż, l-Ispanjol u ċ-Ċiniż, iżda għadhom ma sarux studji profondi f’lingwi żgħar b’riżorsi lingwistiċi insuffiċjenti, bħal-lingwi bojod, Finlandiżi-Ugriċi u Slavi. Il-ħtieġa li jitnaqqas id-distakk fl-iżvilupp tat-teknoloġiji tal-lingwa u l-użu prospettiv tat-teknoloġija NT tiftaħ opportunità kbira għat-tim tal-proġett f’Riga, il-Latvja. Dan il-proġett u r-riżultati mistennija tiegħu se jippermettu lil-Latvja tieħu pożizzjoni ta’ tmexxija fir-riċerka tat-teknoloġiji tal-lingwa u l-ħolqien ta’ soluzzjonijiet innovattivi. Il-Latvja diġà laħqet livell għoli f’dan il-qasam, żgurat permezz ta’ kooperazzjoni mill-qrib bejn l-ambjent akkademiku u l-istrutturi kummerċjali. Il-Latvja tipparteċipa fir-riċerka ma’ nazzjonijiet Ewropej oħra u hija adatta għall-ħolqien ta’ ċentru reġjonali għar-riċerka u l-innovazzjoni tat-teknoloġiji tal-lingwa. Il-proġett se jesplora, janalizza u jevalwa diversi algoritmi NT (kemm metodi awtomatiċi kif ukoll manwalment) biex jinstabu l-aktar soluzzjonijiet xierqa għal diversi kompiti importanti tat-teknoloġiji tal-lingwa:- l-ipproċessar ta’ test bil-miktub — analiżi sintattika ta’ testi, evalwazzjoni tal-grammatika u l-korrezzjoni ta’ żbalji grammatikali (dawn il-komponenti se jintużaw ukoll għal problemi ta’ traduzzjoni awtomatizzata, lingwa mitkellma u ta’ komunikazzjoni tal-kompjuter uman); Fit-teknoloġiji tad-diskors — ir-rikonoxximent effettiv tad-diskors u s-sinteżi tad-diskors, l-akkwist u t-tħejjija ta’ data ġdida fejn l-ammont ta’ data disponibbli huwa żgħir;- traduzzjoni awtomatizzata — għall-ħolqien tal-aħjar traduzzjonijiet ta’ unitajiet testwali differenti; Dizzjunarji awtomatizzati;- mudellar tal-komunikazzjoni bejn il-bniedem u l-kompjuter — kompiti ta’ fehim tal-lingwa naturali, il-ġestjoni tad-djalogu u l-ġenerazzjoni tal-lingwa naturali. Ser jiġu studjati wkoll l-aspetti konjittivi tal-immudellar tad-djalogu, l-irkupru u l-ġestjoni tal-għarfien u l-immudellar tagħhom f’netwerks newrali. Se jiġu studjati arkitetturi differenti tal-NT, inklużi arkitetturi rikursivi fil-fond (bl-Ingliż: Deep Recurrent), fil-fond f’direzzjoni waħda (bl-Ingliż: Karatteristika ‘l quddiem) NT, u effiċjenti NT taħriġ algoritmi biex jindirizzaw grif tad-data, id-diversità morfoloġika u problemi ta’ skarsezza tar-riżorsi. Il-proċessi konjittivi — il-lingwa, il-perċezzjoni viżiva, l-ipproċessar semantiku — empiriku (korrelattiv, sperimentali) se jiġu studjati. L-għarfien miksub se jintuża biex jinħolqu metodi innovattivi u flessibbli tal-ipproċessar tal-lingwa. Ir-riżultati teoretiċi tal-istudju se jinġabru fil-qosor fil-pubblikazzjonijiet ta’ mill-inqas 15-il ġurnal jew artiklu tal-konferenzi mill-Web of Science jew mill-bażijiet tad-dejta SCOPUS. Ir-riżultati teoretiċi tal-istudju se jiġu ttestjati fil-prototipi tal-laboratorju (TRL 4), kif ukoll komunikazzjoni miġbura bejn il-bniedem u l-kompjuter (TRL 5). L-aktar soluzzjonijiet ta’ suċċess se jiġu ppubblikati bħala soluzzjonijiet b’sors miftuħ. Ir-riżultati tar-riċerka ppjanata għandhom potenzjal kbir għall-kummerċjalizzazzjoni, għalhekk wara tmiem il-proġett l-iżvilupp u l-istabbilizzazzjoni tagħhom se jkomplu sabiex jinħolqu prodotti ta’ softwer innovattivi għas-suq Latvjan u Ewropew. Il-proġett huwa proġett relatat ma’ attivitajiet ekonomiċi, se jiġi implimentat f’kooperazzjoni bejn in-negozjant (Tilde) u l-istituzzjoni ta’ riċerka (l-Università tal-Latvja) u se jibda mill-1 ta’ Novembru 2016 sal-31 ta’ Ottubru 2019. L-ispiża totali tal-proġett hija ta’ EUR 690672,13, inkluż l-appoġġ tal-FEŻR EUR 484384,04. Kategorija ta’ riċerka tal-proġett — żvilupp sperimentali u riċerka industrijali. Il-proġett, skont il-manwal ta’ Frascati, jikkorrispondi għall-industrija tax-xjenza tal-ICT “1.2 Xjenzi tal-kompjuter u tal-informazzjoni” (Maltese)
    3 August 2022
    0 references
    O desenvolvimento de soluções TIC modernas é inconcebível sem tecnologias linguísticas que garantam a disponibilidade de soluções na língua materna do utilizador. O estudo meta-NET (Rehm&Uszkoreit, 2013) aponta para diferenças significativas no nível de desenvolvimento das tecnologias da linguagem. As grandes línguas do mundo são classificadas como «boas a excelentes», enquanto as línguas com um pequeno número de falantes são classificadas «de médio a baixo». Colmatar essa lacuna é um grande desafio, os métodos usados nas modernas tecnologias da linguagem exigem grandes penetrações de dados, que são particularmente inexistentes para as pequenas linguagens fleXive com rica morfologia. Um dos desenvolvimentos mais promissores em soluções TIC é o uso de Neural Network Technologies (NT). Os NTS são utilizados com sucesso em línguas como o inglês, o francês, o espanhol e o chinês, mas ainda não foram realizados estudos aprofundados em línguas pequenas com recursos linguísticos insuficientes, como as línguas branca, finlandesa-úgrica e eslava. A necessidade de colmatar a lacuna no desenvolvimento das tecnologias linguísticas e a futura utilização da tecnologia NT abre uma grande oportunidade para a equipa do projeto em Riga, Letónia. Este projeto e os resultados esperados permitirão à Letónia assumir uma posição de liderança na investigação das tecnologias linguísticas e na criação de soluções inovadoras. A Letónia já atingiu um nível elevado neste domínio, garantido por uma estreita cooperação entre o ambiente académico e as estruturas comerciais. A Letónia participa na investigação com outras nações europeias e é adequada para a criação de um centro regional de investigação e inovação de tecnologias linguísticas.O projeto explorará, analisará e avaliará vários algoritmos NT (métodos automáticos e manualmente) para encontrar as soluções mais adequadas para várias tarefas importantes das tecnologias linguísticas:- processamento de texto escrito — análise sintática de textos, avaliação da gramática e correção de erros gramaticais (estes componentes também serão utilizados para a tradução automatizada, linguagem falada e problemas de comunicação homem-computador); Em tecnologias de fala — reconhecimento efetivo de fala e síntese de fala, aquisição e preparação de novos dados onde a quantidade de dados disponíveis é pequena;- tradução automatizada — para a criação das melhores traduções de diferentes unidades de texto; Dicionários automatizados;- modelagem de comunicação humano-computador — tarefas de compreensão da linguagem natural, gerenciamento do diálogo e geração de linguagem natural. Aspetos cognitivos da modelagem do diálogo, recuperação e gestão do conhecimento e sua modelagem em redes neurais também serão estudados. Diferentes arquiteturas NT serão estudadas, incluindo profunda recursiva (em inglês: Profunda Recorrente), profunda de sentido único (em inglês: NT, e algoritmos de treinamento de NT eficientes para lidar com riscos de dados, diversidade morfológica e problemas de escassez de recursos. Processos cognitivos — linguagem, perceção visual, processamento semântico — empírico (correlativo, experimental) serão estudados. Os conhecimentos adquiridos serão utilizados para criar métodos inovadores e flexíveis de processamento linguístico. Os resultados teóricos do estudo serão resumidos nas publicações de pelo menos 15 periódicos ou artigos de conferência de bases de dados Web of Science ou SCOPUS. Os resultados teóricos do estudo serão testados em protótipos de laboratório (TRL 4), bem como em comunicação entre homem e computador (TRL 5). As soluções mais bem sucedidas serão publicadas como soluções de código aberto.Os resultados da investigação planeada têm grande potencial de comercialização, pelo que, após o final do projeto, o seu desenvolvimento e estabilização continuarão a ser desenvolvidos a fim de criar produtos de software inovadores para o mercado letão e europeu. O projeto é um projeto relacionado com atividades económicas, será implementado em cooperação entre o comerciante (Tilde) e a instituição de investigação (Universidade da Letónia) e decorrerá de 1 de novembro de 2016 a 31 de outubro de 2019. O custo total do projeto é de 690 672,13 EUR, incluindo o apoio do FEDER 484 384,04 EUR. Categoria de investigação do projeto — desenvolvimento experimental e investigação industrial. O projeto, de acordo com o manual Frascati, corresponde à indústria das TIC «1.2 Ciências da Computação e da Informação» (Portuguese)
    3 August 2022
    0 references
    Udviklingen af moderne IKT-løsninger er utænkelig uden sprogteknologier, der sikrer, at der findes løsninger på brugerens modersmål. Meta-NET-undersøgelsen (Rehm&Uszkoreit, 2013) peger på betydelige forskelle i sprogteknologiernes udviklingsniveau. Verdens store sprog er bedømt som "gode til fremragende", mens sprog med et lille antal talere er bedømt "fra medium til lav". At bygge bro over denne kløft er en stor udfordring, og de metoder, der anvendes i moderne sprogteknologier, kræver store datagennemtrængninger, som især mangler for de små fleXive sprog med rig morfologi. En af de mest lovende udviklinger inden for IKT-løsninger er brugen af Neural Network Technologies (NT). NTS anvendes med succes på sprog som engelsk, fransk, spansk og kinesisk, men der er endnu ikke gennemført dybtgående undersøgelser på små sprog med utilstrækkelige sproglige ressourcer, f.eks. hvide, finsk-ugriske og slaviske sprog. Behovet for at bygge bro over kløften i udviklingen af sprogteknologier og den fremtidige brug af NT-teknologi åbner en stor mulighed for projektteamet i Riga, Letland. Dette projekt og dets forventede resultater vil gøre det muligt for Letland at indtage en førende position inden for forskning i sprogteknologier og skabelse af innovative løsninger. Letland har allerede nået et højt niveau på dette område, hvilket sikres gennem et tæt samarbejde mellem det akademiske miljø og handelsstrukturerne. Letland deltager i forskning sammen med andre europæiske nationer og er egnet til oprettelse af et regionalt center for forskning og innovation af sprogteknologier.Projektet vil undersøge, analysere og evaluere forskellige NT algoritmer (både automatiske metoder og manuelt) for at finde de mest egnede løsninger til flere vigtige opgaver sprogteknologier:- behandling af skriftlig tekst — syntaktisk analyse af tekster, evaluering af grammatik og korrektion af grammatik fejl (disse komponenter vil også blive brugt til automatiseret oversættelse, tale sprog og menneskelige-computer kommunikationsproblemer); I taleteknologier — effektiv talegenkendelse og talesyntese, erhvervelse og forberedelse af nye data, hvor mængden af tilgængelige data er lille — automatiseret oversættelse — til skabelse af de bedste oversættelser af forskellige tekstenheder; Automatiserede ordbøger — modellering af kommunikation mellem mennesker og computere — opgaver med at forstå det naturlige sprog, styre dialogen og skabe naturligt sprog. Kognitive aspekter af dialogmodellering, indhentning og forvaltning af viden og modellering heraf i neurale netværk vil også blive undersøgt. Forskellige NT-arkitekturer vil blive undersøgt, herunder dyb rekursiv (på engelsk: Deep Recurrent), dyb envejs (på engelsk: Feature-frem) NT, og effektive NT træningsalgoritmer til at løse data ridser, morfologiske mangfoldighed og ressourceknaphed problemer. Kognitive processer — sprog, visuel opfattelse, semantisk behandling — empirisk (korrelativ, eksperimentel) vil blive undersøgt. Den erhvervede viden vil blive brugt til at skabe innovative fleksible sprogbehandlingsmetoder. De teoretiske resultater af undersøgelsen vil blive sammenfattet i publikationer af mindst 15 tidsskrifter eller konferenceartikler fra Web of Science eller SCOPUS databaser.De teoretiske resultater af undersøgelsen vil blive afprøvet i laboratorieprototyper (TRL 4) samt samlet kommunikation mellem mennesker og computere (TRL 5). De mest succesfulde løsninger vil blive offentliggjort som open source løsninger.Resultaterne af den planlagte forskning har et stort potentiale for kommercialisering, derfor efter afslutningen af projektet deres udvikling og stabilisering vil fortsætte for at skabe innovative software produkter til det lettiske og europæiske marked.Projektet er et projekt relateret til økonomiske aktiviteter, det vil blive gennemført i samarbejde mellem købmand (Tilde) og forskningsinstitution (Letlands Universitet) og vil løbe fra November 1, 2016 til oktober 31, 2019. De samlede projektomkostninger beløber sig til 690 672,13 EUR, inkl. EFRU-støtte 484 384,04 EUR. Projektets forskningskategori — eksperimentel udvikling og industriel forskning. Projektet svarer ifølge Frascati-håndbogen til IKT-videnskabsindustrien "1.2 Computer- og informationsvidenskab". (Danish)
    3 August 2022
    0 references
    Dezvoltarea unor soluții TIC moderne este de neconceput fără tehnologii lingvistice care să asigure disponibilitatea soluțiilor în limba maternă a utilizatorului. Studiul meta-NET (Rehm&Uszkoreit, 2013) indică diferențe semnificative în ceea ce privește nivelul de dezvoltare a tehnologiilor lingvistice. Marile limbi din lume sunt evaluate „bun la excelent”, în timp ce limbile cu un număr mic de vorbitori sunt evaluate „de la mediu la scăzut”. Reducerea acestui decalaj este o provocare majoră, metodele utilizate în tehnologiile limbajului modern necesită pătrunderi masive de date, care lipsesc în special pentru limbile fleXive mici cu morfologie bogată. Una dintre cele mai promițătoare evoluții în ceea ce privește soluțiile TIC este utilizarea tehnologiilor rețelelor neurale (NT). NTS sunt utilizate cu succes în limbi precum engleza, franceza, spaniola și chineza, dar studiile aprofundate nu au fost încă efectuate în limbi mici, cu resurse lingvistice insuficiente, cum ar fi limbile albă, finlandeză-ugrică și slavică. Necesitatea de a elimina decalajul în ceea ce privește dezvoltarea tehnologiilor lingvistice și utilizarea prospectivă a tehnologiei NT deschide o mare oportunitate pentru echipa de proiect din Riga, Letonia. Acest proiect și rezultatele sale preconizate vor permite Letoniei să ocupe o poziție de lider în cercetarea tehnologiilor lingvistice și în crearea de soluții inovatoare. Letonia a atins deja un nivel ridicat în acest domeniu, asigurat printr-o cooperare strânsă între mediul academic și structurile comerciale. Letonia participă la activități de cercetare cu alte națiuni europene și este potrivită pentru crearea unui centru regional de cercetare și inovare a tehnologiilor lingvistice. Proiectul va explora, analiza și evalua diverși algoritmi NT (atât metode automate, cât și manual) pentru a găsi soluțiile cele mai potrivite pentru mai multe sarcini importante ale tehnologiilor lingvistice:- prelucrarea textului scris – analiza sintactică a textelor, evaluarea gramatica și corectarea erorilor gramaticale (aceste componente vor fi utilizate și pentru traducerea automată, limbajul vorbit și problemele de comunicare om-computer); În tehnologiile de vorbire – recunoașterea eficientă a vorbirii și sinteza vorbirii, achiziționarea și pregătirea de noi date în cazul în care cantitatea de date disponibile este mică;- traducere automată – pentru crearea celor mai bune traduceri ale diferitelor unități de text; Dicționare automate;- modelarea comunicării om-calculator – sarcini de înțelegere a limbajului natural, de gestionare a dialogului și de generare a limbajului natural. Vor fi studiate, de asemenea, aspectele cognitive ale modelării dialogului, ale recuperării și gestionării cunoștințelor, precum și modelarea acestora în rețelele neuronale. Vor fi studiate diferite arhitecturi NT, inclusiv profund recursive (în limba engleză: Deep Recurrent), profund într-un singur sens (în limba engleză: Feature-forward) NT, și algoritmi de formare NT eficiente pentru a aborda zgârierea datelor, diversitatea morfologică și problemele legate de deficitul de resurse. Procesele cognitive – limbajul, percepția vizuală, prelucrarea semantică – empirice (corelative, experimentale) vor fi studiate. Cunoștințele dobândite vor fi utilizate pentru a crea metode inovatoare și flexibile de prelucrare a limbajului. Rezultatele teoretice ale studiului vor fi rezumate în publicațiile a cel puțin 15 reviste sau articole de conferință din bazele de date Web of Science sau SCOPUS. Rezultatele teoretice ale studiului vor fi testate în prototipuri de laborator (TRL 4), precum și în comunicarea om-calculatoare (TRL 5). Cele mai de succes soluții vor fi publicate ca soluții open source. Rezultatele cercetării planificate au un mare potențial de comercializare, prin urmare, după încheierea proiectului, dezvoltarea și stabilizarea lor vor continua pentru a crea produse software inovatoare pentru piața letonă și europeană. Proiectul este un proiect legat de activitățile economice, va fi implementat în cooperare între comerciant (Tilde) și instituția de cercetare (Universitatea Letoniei) și se va derula în perioada 1 noiembrie 2016-31 octombrie 2019. Costul total al proiectului este de 690 672,13 EUR, incluzând sprijinul FEDR 484 384,04 EUR. Categoria de cercetare a proiectului – dezvoltare experimentală și cercetare industrială. Conform manualului Frascati, proiectul corespunde industriei TIC „1.2 Științe Informatice și Informaționale” (Romanian)
    3 August 2022
    0 references
    Utvecklingen av moderna IKT-lösningar är otänkbar utan språkteknik som säkerställer tillgången till lösningar på användarens modersmål. Meta-NET-studien (Rehm&Uszkoreit, 2013) pekar på betydande skillnader i utvecklingsnivå för språkteknik. Världens stora språk rankas ”bra till utmärkt”, medan språk med ett litet antal talare får betyget ”från medelhög till låg”. Att överbrygga denna klyfta är en stor utmaning, och de metoder som används inom modern språkteknik kräver stora datapenetreringar, som särskilt saknas för de små språken med rik morfologi. En av de mest lovande utvecklingen inom IKT-lösningar är användningen av Neural Network Technologies (NT). NTS används framgångsrikt på språk som engelska, franska, spanska och kinesiska, men djupgående studier har ännu inte genomförts på små språk med otillräckliga språkliga resurser, såsom vita, finsk-ugriska och slaviska språk. Behovet av att överbrygga klyftan i utvecklingen av språkteknik och den framtida användningen av NT-teknik öppnar en stor möjlighet för projektteamet i Riga, Lettland. Detta projekt och dess förväntade resultat kommer att göra det möjligt för Lettland att inta en ledande position inom forskning om språkteknik och skapande av innovativa lösningar. Lettland har redan nått en hög nivå på detta område, vilket garanteras genom ett nära samarbete mellan den akademiska miljön och kommersiella strukturer. Lettland deltar i forskning med andra europeiska nationer och lämpar sig för inrättandet av ett regionalt centrum för forskning och innovation inom språkteknik. Projektet kommer att utforska, analysera och utvärdera olika NT-algoritmer (både automatiska metoder och manuellt) för att hitta de lämpligaste lösningarna för flera viktiga uppgifter inom språkteknik:- bearbetning av skriven text – syntaktisk analys av texter, utvärdering av grammatik och korrigering av grammatikfel (dessa komponenter kommer också att användas för automatiserad översättning, talspråk och kommunikationsproblem mellan människa och dator). Inom talteknik – effektiv taligenkänning och talsyntes, insamling och framställning av nya data där mängden tillgängliga data är liten – automatisk översättning – för att skapa de bästa översättningarna av olika textenheter, Automatiserade ordböcker;- Människa-datorkommunikation modellering – uppgifter att förstå det naturliga språket, hantera dialog och generera naturligt språk. Kognitiva aspekter av dialogmodellering, kunskapshämtning och förvaltning och deras modellering i neurala nätverk kommer också att studeras. Olika NT-arkitekturer kommer att studeras, inklusive djup rekursiv (på engelska: Deep Recurrent), djup enkelriktad (på engelska: Funktionsframåt) NT, och effektiva NT-utbildningsalgoritmer för att ta itu med dataskrapning, morfologisk mångfald och resursbristsproblem. Kognitiva processer – språk, visuell perception, semantisk bearbetning – empirisk (korrelativ, experimentell) kommer att studeras. De förvärvade kunskaperna kommer att användas för att skapa innovativa flexibla språkbehandlingsmetoder. Studiens teoretiska resultat kommer att sammanfattas i publikationer av minst 15 tidskrifter eller konferensartiklar från Web of Science eller SCOPUS databaser.De teoretiska resultaten av studien kommer att testas i laboratorieprototyper (TRL 4), samt poolad kommunikation mellan människa och dator (TRL 5). De mest framgångsrika lösningarna kommer att publiceras som öppna källkodslösningar.Resultaten av den planerade forskningen har stor potential för kommersialisering, därför efter projektets slut kommer deras utveckling och stabilisering att fortsätta för att skapa innovativa mjukvaruprodukter för den lettiska och europeiska marknaden.Projektet är ett projekt relaterat till ekonomisk verksamhet, det kommer att genomföras i samarbete mellan köpman (Tilde) och forskningsinstitut (Lettlands universitet) och kommer att löpa från 1 november 2016 till 31 oktober 2019. Den totala kostnaden för projektet är 690 672,13 EUR, inklusive Eruf-stöd 484 384,04 EUR. Projektets forskningskategori – experimentell utveckling och industriell forskning. Projektet, enligt Frascati-handboken, motsvarar IKT-vetenskapsbranschen ”1.2 Data- och informationsvetenskap”. (Swedish)
    3 August 2022
    0 references
    Vienības gatve 75, Rīga, LV-1004
    0 references
    Raiņa bulvāris 19, Rīga, LV-1050
    0 references

    Identifiers

    1.1.1.1/16/A/215
    0 references