Develop VoiceLab Automatic Speech Recognition System (ARM) based on Deep Neural Networks (DNN) and develop an innovative RAMD (Rapid Acoustic Model Development) data collection and training system to achieve super-human performance. (Q120773)

(‎Changed an Item)
Property / contained in Local Administrative Unit: Gdańsk / qualifier
Property / contained in NUTS: Trójmiejski / qualifier

Revision as of 10:55, 15 January 2024

Project Q120773 in Poland
Language Label Description Also known as
Develop VoiceLab Automatic Speech Recognition System (ARM) based on Deep Neural Networks (DNN) and develop an innovative RAMD (Rapid Acoustic Model Development) data collection and training system to achieve super-human performance.
Project Q120773 in Poland


    0 references
    4,678,454.99 zloty
    0 references
    1,040,020.54 Euro
    13 January 2020
    0 references
    6,756,041.84 zloty
    0 references
    1,501,868.1 Euro
    13 January 2020
    0 references
    69.25 percent
    0 references
    1 July 2016
    0 references
    30 June 2020
    0 references
    0 references
    0 references

    54°22'14.48"N, 18°36'46.73"E
    0 references
    Projekt polega na zbudowaniu systemu ARM (Automatyczne Rozpoznawanie Mowy) VoiceLab w celu osiągnięcia najwyższej skuteczności rozpoznawania mowy na poziomie dorównującym człowiekowi w analogicznych warunkach akustycznych (super human performance) w oparciu o głębokie sieci neuronowe DNN (Deep Neural Network). Nowy system ARM VoiceLab będzie działał w trudnych warunkach akustycznych w oparciu o bardzo dużą ilości danych treningowych, dla różnych typów języków, przy uzyskaniu poziomu wyników konkurencyjnych do najlepszych tego typu rozwiązań na świecie. Równorzędnym celem projektu jest również zbudowanie systemu do szybkiego zbierania danych wykorzystywanych do treningu modeli akustycznych RAMD (Rapid Acoustic Model Development). System ten będzie umożliwiał iteracyjnie prowadzenie badań i kontynuowanie dalszych prac rozwojowych nad rozpoznawaniem mowy. (Polish)
    0 references
    The project consists of building a VoiceLab (Automatic Speech Recognition) system in order to achieve the highest efficiency of speech recognition at a level equal to humans under super human performance based on deep neural networks DNN (Deep Neural Network). The new ARM VoiceLab system will operate in difficult acoustic conditions based on a very large amount of training data, for different types of languages, with a level of competitive results to the best of this type in the world. The equivalent goal of the project is also to build a system for quick data collection used for training RAMD acoustic models (Rapid Acoustic Model Development). This system will enable iterative research and further development of speech recognition. (English)
    21 October 2020
    0 references
    Le projet consiste à construire le système ARM (Automatic Speech Recognition) de VoiceLab afin d’obtenir la plus grande efficacité de la reconnaissance vocale à un niveau comparable à l’homme dans des conditions acoustiques analogues (super performance humaine) basées sur des réseaux neuronaux profonds DNN (Deep Neural Network). Le nouveau système ARM VoiceLab fonctionnera dans des conditions acoustiques difficiles basées sur une très grande quantité de données de formation, pour différents types de langues, avec un niveau de résultats compétitifs pour les meilleures solutions de ce type dans le monde. Un objectif équivalent du projet est également de construire un système pour la collecte rapide de données utilisées pour l’entraînement des modèles acoustiques RAMD (Rapid Acoustic Model Development). Ce système permettra la recherche itérative et la poursuite des travaux de développement sur la reconnaissance vocale. (French)
    2 December 2021
    0 references
    Das Projekt besteht darin, VoiceLabs ARM (Automatic Speech Recognition) System aufzubauen, um die höchste Wirksamkeit der Spracherkennung auf einem Niveau zu erreichen, das mit dem Menschen unter analogen akustischen Bedingungen (super human performance) vergleichbar ist, basierend auf tiefen neuronalen Netzwerken DNN (Deep Neural Network). Das neue ARM VoiceLab System wird unter schwierigen akustischen Bedingungen arbeiten, basierend auf einer sehr großen Menge an Trainingsdaten für verschiedene Arten von Sprachen, mit einem Niveau von Wettbewerbsergebnissen zu den besten Lösungen dieser Art in der Welt. Ein gleichwertiges Ziel des Projekts ist es auch, ein System zur schnellen Erfassung von Daten zu entwickeln, die für das Training von akustischen Modellen RAMD (Rapid Acoustic Model Development) verwendet werden. Dieses System wird iterative Forschung und Weiterentwicklung der Spracherkennung ermöglichen. (German)
    8 December 2021
    0 references
    Het project bestaat uit de bouw van VoiceLab’s ARM-systeem (Automatic Speech Recognition) om de hoogste effectiviteit van spraakherkenning te bereiken op een niveau dat vergelijkbaar is met mensen in analoge akoestische omstandigheden (super menselijke prestaties) op basis van diepe neurale netwerken DNN (Deep Neural Network). Het nieuwe ARM VoiceLab systeem zal werken in moeilijke akoestische omstandigheden op basis van een zeer grote hoeveelheid trainingsgegevens, voor verschillende soorten talen, met een niveau van concurrerende resultaten tot de beste oplossingen van dit type in de wereld. Een gelijkwaardig doel van het project is ook om een systeem te bouwen voor de snelle verzameling van gegevens die worden gebruikt voor het trainen van akoestische modellen RAMD (Rapid Acoustic Model Development). Dit systeem zal iteratief onderzoek en verdere ontwikkeling van spraakherkenning mogelijk maken. (Dutch)
    17 December 2021
    0 references
    Il progetto consiste nella costruzione del sistema ARM (Automatic Speech Recognition) di VoiceLab al fine di ottenere la massima efficacia del riconoscimento vocale a un livello paragonabile agli esseri umani in condizioni acustiche analoghe (prestazioni super umane) basate su reti neurali profonde DNN (Deep Neural Network). Il nuovo sistema ARM VoiceLab opererà in condizioni acustiche difficili sulla base di una grande quantità di dati di formazione, per diverse tipologie di lingue, con un livello di risultati competitivi alle migliori soluzioni di questo tipo nel mondo. Un obiettivo equivalente del progetto è anche quello di costruire un sistema per la rapida raccolta dei dati utilizzati per la formazione di modelli acustici RAMD (Rapid Acoustic Model Development). Questo sistema consentirà la ricerca iterativa e ulteriori lavori di sviluppo sul riconoscimento vocale. (Italian)
    15 January 2022
    0 references
    El proyecto consiste en construir el sistema ARM (Automatic Speech Recognition) de VoiceLab con el fin de lograr la mayor efectividad del reconocimiento de voz a un nivel comparable a los humanos en condiciones acústicas análogas (desempeño súper humano) basado en redes neuronales profundas DNN (Deep Neural Network). El nuevo sistema ARM VoiceLab operará en condiciones acústicas difíciles basadas en una gran cantidad de datos de entrenamiento, para diferentes tipos de idiomas, con un nivel de resultados competitivos a las mejores soluciones de este tipo en el mundo. Un objetivo equivalente del proyecto también es construir un sistema para la recopilación rápida de datos utilizados para entrenar modelos acústicos RAMD (Rapid Acoustic Model Development). Este sistema permitirá la investigación iterativa y el trabajo de desarrollo adicional sobre el reconocimiento de voz. (Spanish)
    18 January 2022
    0 references
    Projekt koosneb VoiceLab’s ARM (Automatic Speech Recognition) süsteemi loomisest, et saavutada kõnetuvastuse kõrgeim tõhusus inimestega võrreldaval tasemel analoogsetes akustilistes tingimustes (super inimese jõudlus), mis põhineb sügavatel närvivõrkudel DNN (Deep Neural Network). Uus ARM VoiceLab süsteem töötab keerulistes akustilistes tingimustes, mis põhinevad väga suurel hulgal koolitusandmetel, eri tüüpi keelte puhul, millel on konkurentsivõimelised tulemused seda tüüpi parimatele lahendustele maailmas. Projekti võrdväärne eesmärk on ka luua süsteem kiireks andmete kogumiseks, mida kasutatakse akustiliste mudelite RAMD (Rapid Acoustic Model Development) koolitamiseks. See süsteem võimaldab korduvaid teadusuuringuid ja edasist tööd kõnetuvastuse valdkonnas. (Estonian)
    27 July 2022
    0 references
    Projektą sudaro „VoiceLab“ ARM (automatinio kalbėjimo atpažinimo) sistemos sukūrimas, kad būtų pasiektas aukščiausias kalbos atpažinimo efektyvumas, palyginti su žmonėmis analogiškomis akustinėmis sąlygomis (super žmogaus veikimas), remiantis giliaisiais neuroniniais tinklais DNN (Deep Neural Network). Naujoji „ARM VoiceLab“ sistema veiks sudėtingomis akustinėmis sąlygomis, remiantis labai dideliu mokymo duomenų kiekiu skirtingų kalbų atžvilgiu, užtikrinant konkurencingus rezultatus geriausiems šio tipo sprendimams pasaulyje. Lygiavertis projekto tikslas taip pat yra sukurti greito duomenų rinkimo sistemą, naudojamą mokant akustinius modelius RAMD (Rapid Acoustic Model Development). Ši sistema sudarys sąlygas kartotiniams moksliniams tyrimams ir tolesniam kalbos atpažinimo kūrimo darbui. (Lithuanian)
    27 July 2022
    0 references
    Projekt se sastoji od izgradnje VoiceLabovog sustava ARM (Automatsko prepoznavanje govora) kako bi se postigla najveća učinkovitost prepoznavanja govora na razini usporedivoj s ljudima u analognim akustičnim uvjetima (super ljudske performanse) na temelju dubokih neuronskih mreža DNN (Deep Neural Network). Novi ARM VoiceLab sustav će raditi u teškim akustičnim uvjetima na temelju vrlo velike količine podataka o treningu, za različite vrste jezika, s razinom konkurentnih rezultata do najboljih rješenja ovog tipa na svijetu. Jednakovrijedan cilj projekta je i izgradnja sustava za brzo prikupljanje podataka koji se koriste za obuku akustičkih modela RAMD (Rapid Acoustic Model Development). Ovaj sustav će omogućiti iterativno istraživanje i daljnji razvoj rada na prepoznavanju govora. (Croatian)
    27 July 2022
    0 references
    Το έργο συνίσταται στην κατασκευή του συστήματος ARM (Automatic Speech Recognition) της VoiceLab, προκειμένου να επιτευχθεί η υψηλότερη αποτελεσματικότητα της αναγνώρισης ομιλίας σε επίπεδο συγκρίσιμο με τον άνθρωπο σε ανάλογες ακουστικές συνθήκες (υπερ ανθρώπινη απόδοση) με βάση τα βαθιά νευρωνικά δίκτυα DNN (Deep Neural Network). Το νέο σύστημα ARM VoiceLab θα λειτουργεί σε δύσκολες ακουστικές συνθήκες με βάση ένα πολύ μεγάλο όγκο δεδομένων εκπαίδευσης, για διαφορετικούς τύπους γλωσσών, με ένα επίπεδο ανταγωνιστικών αποτελεσμάτων για τις καλύτερες λύσεις αυτού του τύπου στον κόσμο. Ένας ισοδύναμος στόχος του έργου είναι επίσης η δημιουργία ενός συστήματος για την ταχεία συλλογή δεδομένων που χρησιμοποιούνται για την εκπαίδευση ακουστικών μοντέλων RAMD (Rapid Acoustic Model Development). Το σύστημα αυτό θα επιτρέψει την επαναληπτική έρευνα και περαιτέρω ανάπτυξη εργασιών για την αναγνώριση της ομιλίας. (Greek)
    27 July 2022
    0 references
    Projekt pozostáva z budovania systému ARM (Automatic Speech Recognition) od VoiceLab s cieľom dosiahnuť najvyššiu účinnosť rozpoznávania reči na úrovni porovnateľnej s ľuďmi v podobných akustických podmienkach (super ľudský výkon) na základe hlbokých neurónových sietí DNN (Deep Neural Network). Nový systém ARM VoiceLab bude fungovať v náročných akustických podmienkach založených na veľmi veľkom množstve tréningových dát pre rôzne typy jazykov, s úrovňou konkurenčných výsledkov k najlepším riešeniam tohto typu na svete. Rovnocenným cieľom projektu je aj vybudovanie systému rýchleho zberu údajov používaných na výcvik akustických modelov RAMD (Rapid Acoustic Model Development). Tento systém umožní iteratívny výskum a ďalšiu vývojovú prácu v oblasti rozpoznávania reči. (Slovak)
    27 July 2022
    0 references
    Hanke koostuu VoiceLabin ARM-järjestelmän (Automatic Speech Recognition) rakentamisesta, jotta voidaan saavuttaa mahdollisimman tehokas puheentunnistus tasolla, joka on verrattavissa ihmisiin vastaavissa akustisissa olosuhteissa (super ihmisen suorituskyky), joka perustuu syviin hermoverkkoihin DNN (Deep Neural Network). Uusi ARM VoiceLab -järjestelmä toimii vaikeissa akustisissa olosuhteissa, jotka perustuvat erittäin suureen määrään koulutustietoja eri kielille ja joilla on kilpailukykyisiä tuloksia tämäntyyppisille maailman parhaille ratkaisuille. Vastaavana tavoitteena on myös rakentaa järjestelmä akustisten RAMD-mallien (Rapid Acoustic Model Development) koulutukseen käytettävän tiedon nopeaan keräämiseen. Järjestelmä mahdollistaa puheentunnistusta koskevan iteratiivisen tutkimuksen ja jatkokehitystyön. (Finnish)
    27 July 2022
    0 references
    A projekt a VoiceLab ARM (Automatic Speech Recognition – Automatic Speech Recognition) rendszerének felépítéséből áll, hogy a beszédfelismerés legmagasabb hatékonyságát olyan szinten érjük el, mint az emberek analóg akusztikai körülmények között (szuper emberi teljesítmény) a mély neurális hálózatok DNN (Deep Neural Network) alapján. Az új ARM VoiceLab rendszer nehéz akusztikus körülmények között fog működni, nagyon nagy mennyiségű képzési adat alapján, különböző típusú nyelvek esetében, versenyképes eredményeket biztosítva a világ legjobb megoldásaihoz. A projekt ezzel egyenértékű célja a RAMD (Rapid Acoustic Model Development) akusztikus modellek képzéséhez használt gyors adatgyűjtési rendszer kiépítése is. Ez a rendszer lehetővé teszi az iteratív kutatást és a beszédfelismeréssel kapcsolatos további fejlesztéseket. (Hungarian)
    27 July 2022
    0 references
    Projekt se skládá z budování systému ARM (Automatic Speech Recognition) společnosti VoiceLab s cílem dosáhnout nejvyšší účinnosti rozpoznávání řeči na úrovni srovnatelné s lidmi v analogických akustických podmínkách (super lidský výkon) na základě hlubokých neuronových sítí DNN (Deep Neural Network). Nový systém ARM VoiceLab bude fungovat v obtížných akustických podmínkách na základě velmi velkého množství tréninkových dat, pro různé typy jazyků, s úrovní konkurenčních výsledků pro nejlepší řešení tohoto typu na světě. Rovnocenným cílem projektu je také vybudování systému pro rychlý sběr dat používaných pro školení akustických modelů RAMD (Rapid Acoustic Model Development). Tento systém umožní iterativní výzkum a další vývojovou práci v oblasti rozpoznávání řeči. (Czech)
    27 July 2022
    0 references
    Projekts sastāv no VoiceLab ARM (automātiskās runas atpazīšanas) sistēmas izbūves, lai sasniegtu augstāko runas atpazīšanas efektivitāti līmenī, kas salīdzināms ar cilvēkiem analogos akustiskos apstākļos (super cilvēka veiktspēja), pamatojoties uz dziļiem neironu tīkliem DNN (Deep Nural Network). Jaunā ARM VoiceLab sistēma darbosies sarežģītos akustiskos apstākļos, pamatojoties uz ļoti lielu skaitu mācību datu par dažādiem valodu veidiem, ar konkurētspējīgu rezultātu līmeni labākajiem šāda veida risinājumiem pasaulē. Līdzvērtīgs projekta mērķis ir arī izveidot sistēmu ātrai datu vākšanai, ko izmanto akustisko modeļu apmācībai RAMD (Rapid Acoustic Model Development). Šī sistēma ļaus veikt iteratīvu izpēti un tālāku attīstību runas atpazīšanas jomā. (Latvian)
    27 July 2022
    0 references
    Is éard atá sa tionscadal a thógáil ARM VoiceLab ar (Aitheantas Uathoibríoch Urlabhra) d’fhonn a bhaint amach ar an éifeachtacht is airde aitheantais urlabhra ag leibhéal inchomparáide le daoine i gcoinníollacha fuaime analógacha (feidhmíocht Super daonna) bunaithe ar líonraí néaracha domhain DNN (Líonra Neural Doimhne). Beidh an córas nua VoiceLab ARM ag feidhmiú i ndálaí deacra fuaimiúla bunaithe ar chuid mhór sonraí oiliúna, do chineálacha éagsúla teangacha, le leibhéal torthaí iomaíocha ar na réitigh is fearr den chineál seo ar domhan. Sprioc choibhéiseach de chuid an tionscadail is ea córas a thógáil chun sonraí a bhailiú go tapa a úsáidtear chun samhlacha fuaimiúla RAMD (Rapid Acoustic Model Development) a oiliúint. Leis an gcóras seo, beifear in ann taighde atriallach agus obair forbartha bhreise a dhéanamh ar aitheantas cainte. (Irish)
    27 July 2022
    0 references
    Projekt je sestavljen iz izgradnje sistema VoiceLab’s ARM (Automatic Speech Recognition), da bi dosegli najvišjo učinkovitost prepoznavanja govora na ravni, primerljivi s človekom v analognih akustičnih pogojih (super človeški zmogljivosti), ki temeljijo na globokih nevronskih omrežjih DNN (Deep Neural Network). Novi sistem ARM VoiceLab bo deloval v težkih akustičnih pogojih, ki temeljijo na zelo veliki količini podatkov o usposabljanju, za različne vrste jezikov, z ravnjo konkurenčnih rezultatov do najboljših rešitev te vrste na svetu. Enakovreden cilj projekta je tudi izgradnja sistema za hitro zbiranje podatkov, ki se uporabljajo za usposabljanje akustičnih modelov RAMD (Rapid Acoustic Model Development). Ta sistem bo omogočil iterativne raziskave in nadaljnje razvojno delo na področju prepoznavanja govora. (Slovenian)
    27 July 2022
    0 references
    Проектът се състои в изграждането на ARM (Automatic Speech Recognition) на VoiceLab, за да се постигне най-висока ефективност на разпознаването на реч на ниво, сравнимо с това на хората в аналогични акустични условия (свръхчовешко представяне) въз основа на дълбоки невронни мрежи DNN (Deep Neural Network). Новата система ARM VoiceLab ще работи в трудни акустични условия въз основа на много голямо количество данни за обучение, за различни видове езици, с ниво на конкурентни резултати за най-добрите решения от този тип в света. Еквивалентна цел на проекта е и изграждането на система за бързо събиране на данни, използвани за обучение на акустични модели RAMD (Rapid Acoustic Model Development). Тази система ще даде възможност за итеративни изследвания и по-нататъшна работа в областта на разпознаването на речи. (Bulgarian)
    27 July 2022
    0 references
    Il-proġett jikkonsisti fil-bini tas-sistema ARM (Awtomatika Diskors Rikonoxximent Awtomatiku) ta’ VoiceLab sabiex tinkiseb l-ogħla effettività tar-rikonoxximent tad-diskors f’livell komparabbli mal-bnedmin f’kundizzjonijiet akustiċi analogi (prestazzjoni super umana) ibbażati fuq netwerks newrali profondi DNN (Deep Neural Network). Is-sistema l-ġdida ARM VoiceLab se topera f’kundizzjonijiet akustiċi diffiċli bbażati fuq ammont kbir ħafna ta’ data ta’ taħriġ, għal tipi differenti ta’ lingwi, b’livell ta’ riżultati kompetittivi għall-aħjar soluzzjonijiet ta’ dan it-tip fid-dinja. Għan ekwivalenti tal-proġett huwa wkoll li tinbena sistema għall-ġbir rapidu ta’ data użata għat-taħriġ tal-mudelli akustiċi RAMD (Rapid Acoustic Model Development). Din is-sistema se tippermetti riċerka iterattiva u aktar ħidma ta’ żvilupp dwar ir-rikonoxximent tad-diskorsi. (Maltese)
    27 July 2022
    0 references
    O projeto consiste na construção do sistema ARM (Automatic Speech Recognition) do VoiceLab, a fim de alcançar a maior eficácia do reconhecimento de fala em um nível comparável aos humanos em condições acústicas análogas (desempenho super humano) com base em redes neurais profundas DNN (Deep Neural Network). O novo sistema ARM VoiceLab funcionará em condições acústicas difíceis com base em uma grande quantidade de dados de treinamento, para diferentes tipos de idiomas, com um nível de resultados competitivos para as melhores soluções deste tipo no mundo. Um objetivo equivalente do projeto é também construir um sistema para a rápida recolha de dados utilizados para o treinamento de modelos acústicos RAMD (Rapid Acoustic Model Development). Este sistema permitirá uma investigação iterativa e um maior trabalho de desenvolvimento sobre o reconhecimento da fala. (Portuguese)
    27 July 2022
    0 references
    Projektet består af at opbygge VoiceLabs ARM (Automatic Speech Recognition) system for at opnå den højeste effektivitet af talegenkendelse på et niveau, der kan sammenlignes med mennesker under analoge akustiske forhold (super menneskelige præstationer) baseret på dybe neurale netværk DNN (Deep Neural Network). Det nye ARM VoiceLab-system vil fungere under vanskelige akustiske forhold baseret på en meget stor mængde træningsdata for forskellige typer sprog, med et niveau af konkurrencedygtige resultater til de bedste løsninger af denne type i verden. Et tilsvarende mål med projektet er også at opbygge et system til hurtig indsamling af data, der anvendes til træning af akustiske modeller RAMD (Rapid Acoustic Model Development). Dette system vil muliggøre iterativ forskning og yderligere udviklingsarbejde vedrørende talegenkendelse. (Danish)
    27 July 2022
    0 references
    Proiectul constă în construirea sistemului ARM (Automatic Speech Recognition) al VoiceLab (Automatic Speech Recognition) pentru a obține cea mai mare eficacitate a recunoașterii vorbirii la un nivel comparabil cu cel al oamenilor în condiții acustice analoge (performanță superioară umană) pe baza rețelelor neuronale profunde DNN (Rețeaua Neurală Deep). Noul sistem VoiceLab ARM va funcționa în condiții acustice dificile, bazate pe o cantitate foarte mare de date de instruire, pentru diferite tipuri de limbi, cu un nivel de rezultate competitive la cele mai bune soluții de acest tip din lume. Un obiectiv echivalent al proiectului este de a construi un sistem pentru colectarea rapidă a datelor utilizate pentru formarea modelelor acustice RAMD (Rapid Acoustic Model Development). Acest sistem va permite cercetarea iterativă și continuarea activității de dezvoltare a recunoașterii vorbirii. (Romanian)
    27 July 2022
    0 references
    Projektet består av att bygga VoiceLabs ARM (Automatic Speech Recognition) system för att uppnå högsta effektivitet av taligenkänning på en nivå som är jämförbar med människor i analoga akustiska förhållanden (super mänsklig prestanda) baserat på djupa neurala nätverk DNN (Deep Neural Network). Det nya ARM VoiceLab-systemet kommer att fungera under svåra akustiska förhållanden baserat på en mycket stor mängd träningsdata, för olika typer av språk, med en nivå av konkurrenskraftiga resultat till de bästa lösningarna av denna typ i världen. Ett motsvarande mål med projektet är också att bygga ett system för snabb insamling av data som används för utbildning av akustiska modeller RAMD (Rapid Acoustic Model Development). Detta system kommer att möjliggöra iterativ forskning och vidareutveckling av taligenkänning. (Swedish)
    27 July 2022
    0 references
    WOJ.: POMORSKIE, POW.: Gdańsk
    0 references
    24 May 2023
    0 references


    0 references