Develop VoiceLab Automatic Speech Recognition System (ARM) based on Deep Neural Networks (DNN) and develop an innovative RAMD (Rapid Acoustic Model Development) data collection and training system to achieve super-human performance. (Q120773)
Jump to navigation
Jump to search
Project Q120773 in Poland
Language | Label | Description | Also known as |
---|---|---|---|
English | Develop VoiceLab Automatic Speech Recognition System (ARM) based on Deep Neural Networks (DNN) and develop an innovative RAMD (Rapid Acoustic Model Development) data collection and training system to achieve super-human performance. |
Project Q120773 in Poland |
Statements
4,704,949.0 zloty
0 references
6,772,330.0 zloty
0 references
69.47 percent
0 references
1 July 2016
0 references
30 June 2020
0 references
VOICELAB.AI SP. Z O.O.
0 references
Projekt polega na zbudowaniu systemu ARM (Automatyczne Rozpoznawanie Mowy) VoiceLab w celu osiągnięcia najwyższej skuteczności rozpoznawania mowy na poziomie dorównującym człowiekowi w analogicznych warunkach akustycznych (super human performance) w oparciu o głębokie sieci neuronowe DNN (Deep Neural Network). Nowy system ARM VoiceLab będzie działał w trudnych warunkach akustycznych w oparciu o bardzo dużą ilości danych treningowych, dla różnych typów języków, przy uzyskaniu poziomu wyników konkurencyjnych do najlepszych tego typu rozwiązań na świecie. Równorzędnym celem projektu jest również zbudowanie systemu do szybkiego zbierania danych wykorzystywanych do treningu modeli akustycznych RAMD (Rapid Acoustic Model Development). System ten będzie umożliwiał iteracyjnie prowadzenie badań i kontynuowanie dalszych prac rozwojowych nad rozpoznawaniem mowy. (Polish)
0 references
The project consists of building a VoiceLab (Automatic Speech Recognition) system in order to achieve the highest efficiency of speech recognition at a level equal to humans under super human performance based on deep neural networks DNN (Deep Neural Network). The new ARM VoiceLab system will operate in difficult acoustic conditions based on a very large amount of training data, for different types of languages, with a level of competitive results to the best of this type in the world. The equivalent goal of the project is also to build a system for quick data collection used for training RAMD acoustic models (Rapid Acoustic Model Development). This system will enable iterative research and further development of speech recognition. (English)
21 October 2020
0 references
Le projet consiste à construire le système VoiceLab ARM (Automatic Speech Recognition) afin d’obtenir la plus grande efficacité de la reconnaissance vocale à un niveau égal à l’homme dans des conditions acoustiques similaires (super performance humaine) basé sur les réseaux neuronaux profonds DNN (Deep Neural Network). Le nouveau système ARM VoiceLab fonctionnera dans des environnements acoustiques difficiles basés sur une très grande quantité de données d’entraînement, pour différents types de langues, avec un niveau de résultats compétitifs pour les meilleures solutions de ce type dans le monde. Un objectif égal du projet est également de construire un système de collecte rapide de données utilisé pour la formation des modèles acoustiques RAMD (Rapid Acoustic Model Development). Ce système permettra la recherche itérative et le développement ultérieur de la reconnaissance vocale. (French)
2 December 2021
0 references
Das Projekt besteht aus dem Aufbau eines VoiceLab ARM-Systems (Automatic Speech Recognition), um die höchste Wirksamkeit der Spracherkennung auf einem Niveau zu erreichen, das dem Menschen unter ähnlichen akustischen Bedingungen (super human performance) auf Basis tiefer neuronaler Netzwerke DNN (Deep Neural Network) entspricht. Das neue ARM VoiceLab-System wird in schwierigen akustischen Umgebungen auf Basis einer sehr großen Anzahl von Trainingsdaten für verschiedene Sprachen betrieben, mit einem Niveau an Wettbewerbsergebnissen zu den besten Lösungen dieser Art in der Welt. Ein gleiches Ziel des Projekts ist es auch, ein System zur schnellen Datenerfassung zu entwickeln, das für das Training von RAMD (Rapid Acoustic Model Development) akustischen Modellen verwendet wird. Dieses System wird iterative Forschung und Weiterentwicklung der Spracherkennung ermöglichen. (German)
8 December 2021
0 references
Het project bestaat uit het bouwen van VoiceLab ARM (Automatic Speech Recognition) systeem om de hoogste effectiviteit van spraakherkenning te bereiken op een niveau dat gelijk is aan de mens in vergelijkbare akoestische omstandigheden (super menselijke prestaties) op basis van diepe neurale netwerken DNN (Deep Neural Network). Het nieuwe ARM VoiceLab systeem zal werken in moeilijke akoestische omgevingen op basis van een zeer grote hoeveelheid trainingsgegevens, voor verschillende soorten talen, met een niveau van concurrerende resultaten naar de beste oplossingen van dit type in de wereld. Een gelijk doel van het project is ook het bouwen van een systeem voor snelle gegevensverzameling gebruikt voor de training van RAMD (Rapid Acoustic Model Development) akoestische modellen. Dit systeem zal iteratief onderzoek en verdere ontwikkeling op het gebied van spraakherkenning mogelijk maken. (Dutch)
17 December 2021
0 references
Il progetto consiste nel costruire il sistema VoiceLab ARM (Automatic Speech Recognition) al fine di ottenere la massima efficacia del riconoscimento vocale ad un livello pari all'uomo in condizioni acustiche simili (prestazioni super umane) basate su reti neurali profonde DNN (Deep Neural Network). Il nuovo sistema ARM VoiceLab opererà in ambienti acustici difficili basati su una grandissima quantità di dati formativi, per diversi tipi di linguaggi, con un livello di risultati competitivi alle migliori soluzioni di questo tipo al mondo. Un obiettivo equivalente del progetto è anche quello di costruire un sistema per la raccolta rapida dei dati utilizzato per la formazione di modelli acustici RAMD (Rapid Acoustic Model Development). Questo sistema consentirà la ricerca iterativa e l'ulteriore sviluppo del riconoscimento vocale. (Italian)
15 January 2022
0 references
El proyecto consiste en la construcción del sistema VoiceLab ARM (Automatic Speech Recognition) con el fin de lograr la máxima eficacia del reconocimiento del habla a un nivel igual al hombre en condiciones acústicas similares (rendimiento súper humano) basado en redes neuronales profundas DNN (Red Neural Profunda). El nuevo sistema ARM VoiceLab funcionará en entornos acústicos difíciles basados en una gran cantidad de datos de formación, para diferentes tipos de idiomas, con un nivel de resultados competitivos a las mejores soluciones de este tipo en el mundo. Un objetivo igual del proyecto es también construir un sistema para la recopilación rápida de datos utilizados para la formación de modelos acústicos RAMD (Rapid Acoustic Model Development). Este sistema permitirá la investigación iterativa y un mayor desarrollo del reconocimiento del habla. (Spanish)
18 January 2022
0 references
Projekt hõlmab VoiceLab’i (Automatic Speech Recognition) süsteemi (Automatic Speech Recognition) loomist, et saavutada kõnetuvastuse kõrgeim tõhusus tasemel, mis on võrdne inimestega üliinimliku jõudluse all, mis põhineb sügaval närvivõrgul DNN (sügav närvivõrk). Uus ARM VoiceLab süsteem töötab keerulistes akustilistes tingimustes, mis põhinevad väga suurel hulgal koolitusandmetel eri liiki keelte kohta, millel on konkurentsivõimelised tulemused seda tüüpi maailma parimatele. Projekti samaväärne eesmärk on ka luua süsteem kiire andmekogumise jaoks, mida kasutatakse RAMD akustiliste mudelite koolitamiseks (Rapid Acoustic Model Development). See süsteem võimaldab teha korduvaid uuringuid ja arendada edasi kõnetuvastust. (Estonian)
27 July 2022
0 references
Projektą sudaro VoiceLab (Automatinio kalbos atpažinimo) sistemos kūrimas, kad būtų pasiektas aukščiausias kalbos atpažinimo efektyvumas lygiu, lygiu, lygiu, atitinkančiu žmones pagal super žmogaus pasirodymą, pagrįstą giliaisiais neuroniniais tinklais DNN (Deep Neural Network). Naujoji ARM VoiceLab sistema veiks sudėtingomis akustinėmis sąlygomis, pagrįstomis labai dideliu mokymo duomenų kiekiu, įvairių rūšių kalbomis, o konkurencingų rezultatų lygis yra geriausias pasaulyje. Lygiavertis projekto tikslas – sukurti greitojo duomenų rinkimo sistemą, naudojamą RAMD akustinių modelių mokymui (Rapid Acoustic Model Development). Ši sistema leis atlikti kartotinius tyrimus ir toliau plėtoti kalbos atpažinimą. (Lithuanian)
27 July 2022
0 references
Projekt se sastoji od izgradnje sustava automatskog prepoznavanja govora kako bi se postigla najveća učinkovitost prepoznavanja govora na razini jednakoj ljudima pod super ljudskim performansama na temelju dubokih neuronskih mreža DNN (Deep Neural Network). Novi ARM VoiceLab sustav će raditi u teškim akustičnim uvjetima na temelju vrlo velike količine podataka treninga, za različite vrste jezika, s razinom konkurentnih rezultata na najbolji od ove vrste u svijetu. Istovrijedan cilj projekta je i izgradnja sustava za brzo prikupljanje podataka koji se koristi za obuku akustičkih modela RAMD-a (Rapid Acoustic Model Development). Taj će sustav omogućiti iterativno istraživanje i daljnji razvoj prepoznavanja govora. (Croatian)
27 July 2022
0 references
Το έργο αποτελείται από την κατασκευή ενός συστήματος VoiceLab (Automatic Speech Recognition) προκειμένου να επιτευχθεί η υψηλότερη αποτελεσματικότητα της αναγνώρισης της ομιλίας σε επίπεδο ίσο με τον άνθρωπο υπό υπερανθρώπινες επιδόσεις με βάση τα βαθιά νευρωνικά δίκτυα DNN (Deep Neural Network). Το νέο σύστημα ARM VoiceLab θα λειτουργεί σε δύσκολες ακουστικές συνθήκες με βάση ένα πολύ μεγάλο αριθμό δεδομένων κατάρτισης, για διαφορετικούς τύπους γλωσσών, με ένα επίπεδο ανταγωνιστικών αποτελεσμάτων στο καλύτερο αυτού του τύπου στον κόσμο. Ο αντίστοιχος στόχος του έργου είναι επίσης η δημιουργία ενός συστήματος ταχείας συλλογής δεδομένων που χρησιμοποιείται για την εκπαίδευση ακουστικών μοντέλων RAMD (Rapid Acoustic Model Development). Το σύστημα αυτό θα επιτρέψει την επαναληπτική έρευνα και την περαιτέρω ανάπτυξη της αναγνώρισης της ομιλίας. (Greek)
27 July 2022
0 references
Projekt pozostáva z vybudovania systému VoiceLab (Automatic Speech Recognition) s cieľom dosiahnuť najvyššiu účinnosť rozpoznávania reči na úrovni rovnajúcej sa človeku pri superľudských výkonoch založených na hlbokých neurónových sieťach DNN (Deep Neural Network). Nový systém ARM VoiceLab bude fungovať v náročných akustických podmienkach na základe veľkého množstva školiacich údajov pre rôzne typy jazykov, s úrovňou konkurenčných výsledkov k najlepším z tohto typu na svete. Ekvivalentným cieľom projektu je tiež vybudovať systém pre rýchly zber dát, ktorý sa používa na výcvik akustických modelov RAMD (Rapid Acoustic Model Development). Tento systém umožní iteratívny výskum a ďalší rozvoj rozpoznávania reči. (Slovak)
27 July 2022
0 references
Hanke koostuu VoiceLab-järjestelmän (Automatic Speech Recognition) rakentamisesta, jotta voidaan saavuttaa mahdollisimman tehokas puheentunnistuksen tehokkuus tasolla, joka vastaa ihmisen superihmisen suorituskykyä syvän hermoverkon DNN (Deep Neural Network) pohjalta. Uusi ARM VoiceLab -järjestelmä toimii vaikeissa akustisissa olosuhteissa, jotka perustuvat hyvin suureen määrään koulutustietoja eri kielille, ja kilpailutulokset ovat maailman parhaita tämäntyyppisiä. Projektin vastaavana tavoitteena on myös rakentaa nopean tiedonkeruun järjestelmä, jota käytetään RAMD-akustisten mallien (Rapid Acoustic Model Development) harjoitteluun. Järjestelmä mahdollistaa toistuvan tutkimuksen ja puheentunnistuksen jatkokehittämisen. (Finnish)
27 July 2022
0 references
A projekt egy VoiceLab (automatikus beszédfelismerő) rendszer kiépítéséből áll, amelynek célja a beszédfelismerés legmagasabb hatékonyságának elérése az emberi szuper emberi teljesítmény mellett, mély neurális hálózatok DNN (mély neurális hálózat) alapján. Az új ARM VoiceLab rendszer nehéz akusztikus körülmények között fog működni, nagyon nagy mennyiségű képzési adat alapján, különböző típusú nyelveken, a világ legjobbjai számára versenyképes eredményekkel. A projekt ezzel egyenértékű célja a RAMD akusztikus modelljeinek (Rapid Acoustic Model Development) képzéséhez használt gyors adatgyűjtési rendszer kiépítése is. Ez a rendszer lehetővé teszi az iteratív kutatást és a beszédfelismerés továbbfejlesztését. (Hungarian)
27 July 2022
0 references
Projekt se skládá z vybudování systému VoiceLab (Automatic Spematic Recognition) s cílem dosáhnout nejvyšší účinnosti rozpoznávání řeči na úrovni, která se rovná lidem při super lidské výkonnosti založené na hlubokých neuronových sítích DNN (Deep Neural Network). Nový systém ARM VoiceLab bude fungovat v obtížných akustických podmínkách na základě velmi velkého množství tréninkových dat pro různé typy jazyků, s úrovní konkurenceschopných výsledků pro nejlepší z tohoto typu na světě. Rovnocenným cílem projektu je také vybudování systému rychlého sběru dat pro školení RAMD akustických modelů (Rapid Acoustic Model Development). Tento systém umožní iterativní výzkum a další rozvoj rozpoznávání řeči. (Czech)
27 July 2022
0 references
Projekts sastāv no VoiceLab (automātiskās runas atpazīšanas) sistēmas izveidošanas, lai panāktu visaugstāko runas atpazīšanas efektivitāti līmenī, kas vienāds ar cilvēkiem saskaņā ar super cilvēka sniegumu, pamatojoties uz dziļiem neironu tīkliem DNN (Deep Neural Network). Jaunā ARM VoiceLab sistēma darbosies sarežģītos akustiskos apstākļos, pamatojoties uz ļoti lielu mācību datu apjomu, dažādiem valodu veidiem, ar konkurētspējīgu rezultātu līmeni, kas ir vislabākais šāda veida pasaulē. Projekta ekvivalentais mērķis ir arī izveidot sistēmu ātrai datu vākšanai, ko izmanto RAMD akustisko modeļu apmācībā (Rapid Acoustic Model Development). Šī sistēma ļaus veikt atkārtotu izpēti un turpmāku runas atpazīšanas attīstību. (Latvian)
27 July 2022
0 references
Is éard atá sa tionscadal ná córas VoiceLab (Aitheantas Uathoibríoch Urlabhra) a thógáil chun an éifeachtúlacht is airde aitheantais cainte a bhaint amach ag leibhéal is comhionann le daoine faoi fheidhmíocht dhaonna Super bunaithe ar líonraí néaracha domhain DNN (Líonra Doimhne Neural). Beidh an córas nua VoiceLab ARM ag feidhmiú i ndálaí deacra fuaimiúla bunaithe ar chuid mhór sonraí oiliúna, le haghaidh cineálacha éagsúla teangacha, le leibhéal torthaí iomaíocha is fearr den chineál seo ar domhan. Is é sprioc choibhéiseach an tionscadail freisin córas a thógáil chun sonraí a bhailiú go tapa a úsáidtear chun oiliúint a chur ar mhúnlaí fuaimiúla RAMD (Rapid Acoustic Model Development). Leis an gcóras seo, beifear in ann taighde atriallach a dhéanamh agus aitheantas cainte a fhorbairt tuilleadh. (Irish)
27 July 2022
0 references
Projekt je sestavljen iz izgradnje sistema VoiceLab (Avtomatic Speech Recognition), da bi dosegli najvišjo učinkovitost prepoznavanja govora na ravni, ki je enaka ljudem pod super človeškim delovanjem, ki temelji na globokih nevronskih mrežah DNN (Deep Neural Network). Novi ARM VoiceLab sistem bo deloval v težkih akustičnih pogojih, ki temeljijo na zelo velikem številu podatkov o usposabljanju, za različne vrste jezikov, s stopnjo konkurenčnih rezultatov, ki so najboljši od te vrste na svetu. Enakovreden cilj projekta je tudi izgradnja sistema za hitro zbiranje podatkov, ki se uporablja za usposabljanje RAMD akustičnih modelov (Rapid Acoustic Model Development). Ta sistem bo omogočil iterativno raziskovanje in nadaljnji razvoj prepoznavanja govora. (Slovenian)
27 July 2022
0 references
Проектът се състои в изграждането на система VoiceLab (Автоматично разпознаване на речи), за да се постигне най-висока ефективност на разпознаването на речта на ниво, равно на това на хората при свръхчовешките постижения въз основа на дълбоки невронни мрежи DNN (Deep Neural Network). Новата ARM VoiceLab система ще работи в трудни акустични условия, базирани на много голямо количество тренировъчни данни, за различни видове езици, с ниво на конкурентни резултати до най-добрите от този тип в света. Еквивалентната цел на проекта е също така да се изгради система за бързо събиране на данни, използвана за обучение на RAMD акустични модели (Rapid Acoustic Model Development). Тази система ще даде възможност за повтарящи се изследвания и по-нататъшно развитие на разпознаването на речта. (Bulgarian)
27 July 2022
0 references
Il-proġett jikkonsisti fil-bini ta’ sistema VoiceLab (Automatic Speech Recognition) sabiex tinkiseb l-ogħla effiċjenza ta’ rikonoxximent tad-diskors f’livell ugwali għall-bnedmin taħt prestazzjoni super-bniedem ibbażata fuq netwerks newrali profondi DNN (Deep Neural Network). Is-sistema l-ġdida ARM VoiceLab se topera f’kundizzjonijiet akustiċi diffiċli bbażati fuq ammont kbir ħafna ta’ data ta’ taħriġ, għal tipi differenti ta’ lingwi, b’livell ta’ riżultati kompetittivi għall-aħjar minn dan it-tip fid-dinja. L-għan ekwivalenti tal-proġett huwa wkoll li tinbena sistema għall-ġbir rapidu tad-data użata għat-taħriġ ta’ mudelli akustiċi RAMD (Żvilupp ta’ Mudell Akustiku Rapidu). Din is-sistema se tippermetti riċerka iterattiva u aktar żvilupp tar-rikonoxximent tad-diskors. (Maltese)
27 July 2022
0 references
O projeto consiste na construção de um sistema VoiceLab (Automatic Speech Recognition) a fim de alcançar a maior eficiência de reconhecimento de fala em um nível igual ao dos seres humanos sob desempenho super humano ganza em redes neurais profundas DNN (Deep Neural Network). O novo sistema ARM VoiceLab funcionará em condições acústicas difíceis com base em uma grande quantidade de dados de treinamento, para diferentes tipos de idiomas, com um nível de resultados competitivos para o melhor deste tipo no mundo. O objetivo equivalente do projeto é também construir um sistema de coleta rápida de dados usado para treinar modelos acústicos RAMD (Rapid Acoustic Model Development). Este sistema permitirá uma investigação iterativa e um maior desenvolvimento do reconhecimento de fala. (Portuguese)
27 July 2022
0 references
Projektet består i at opbygge et VoiceLab-system (Automatic Speech Recognition) for at opnå den højeste effektivitet af talegenkendelse på et niveau svarende til mennesker under fremragende menneskelige præstationer baseret på dybe neurale netværk DNN (Deep Neural Network). Det nye ARM VoiceLab-system vil fungere under vanskelige akustiske forhold baseret på en meget stor mængde træningsdata for forskellige sprogtyper med et konkurrencedygtigt resultat til det bedste af denne type i verden. Det tilsvarende mål med projektet er også at opbygge et system til hurtig dataindsamling, der anvendes til træning af RAMD akustiske modeller (Rapid Acoustic Model Development). Dette system vil muliggøre iterativ forskning og videreudvikling af talegenkendelse. (Danish)
27 July 2022
0 references
Proiectul constă în construirea unui sistem VoiceLab (Automatic Speech Recognition) pentru a obține cea mai mare eficiență a recunoașterii vorbirii la un nivel egal cu cel al oamenilor sub superperformanță umană, bazat pe rețele neuronale profunde DNN (Rețeaua Neurală profundă). Noul sistem ARM VoiceLab va funcționa în condiții acustice dificile, bazate pe o cantitate foarte mare de date de formare, pentru diferite tipuri de limbi, cu un nivel de rezultate competitive la cele mai bune de acest tip din lume. Obiectivul echivalent al proiectului este, de asemenea, de a construi un sistem de colectare rapidă a datelor utilizat pentru formarea modelelor acustice RAMD (Rapid Acoustic Model Development). Acest sistem va permite cercetarea iterativă și dezvoltarea în continuare a recunoașterii vorbirii. (Romanian)
27 July 2022
0 references
Projektet består av att bygga ett VoiceLab-system (Automatic Speech Recognition) för att uppnå högsta effektivitet för taligenkänning på en nivå som är lika med människor under supermänskliga prestanda baserat på djupa neurala nätverk DNN (Deep Neural Network). Det nya ARM VoiceLab-systemet kommer att fungera under svåra akustiska förhållanden baserat på en mycket stor mängd träningsdata, för olika typer av språk, med en nivå av konkurrenskraftiga resultat till det bästa av denna typ i världen. Motsvarande mål med projektet är också att bygga ett system för snabb datainsamling som används för träning av RAMD akustiska modeller (Rapid Acoustic Model Development). Detta system kommer att möjliggöra iterativ forskning och vidareutveckling av taligenkänning. (Swedish)
27 July 2022
0 references
Identifiers
RPPM.01.01.01-22-0026/16
0 references