Development and development of automatic speech recognition, fusion and adaptation technologies through R & D (Speech Cloud) (Q3777986)

Project Q3777986 in Lithuania
Development and development of automatic speech recognition, fusion and adaptation technologies through R & D (Speech Cloud)
    318,465.08 Euro
    614,504.45 Euro
    51.82 percent
    1 November 2016
    31 October 2018
    Uždaroji akcinė bendrovė "TILDE INFORMACINĖS TECHNOLOGIJOS"
    54°40'4.22"N, 25°15'19.87"E
    Šiuo metu elektroninėje erdvėje yra sukaupta daug audio bei video informacijos, kuri nėra indeksuota bei negali būti panaudojama tekstinei/statistinei analizei bei sparčiai paieškai. Galimybė indeksuoti tokio pobūdžio informaciją (paversti ją į tekstinę informaciją ir atvirkščiai) yra aktuali daugeliui viešojo sektoriaus institucijų bei privačių vartotojų. Turint tokį funkcionalumą padidėja susirinkimų protokolavimo efektyvumas bei atsekamumas, elektroninėse laikmenose saugoma informacija gali būti analizuojama daug sparčiau. Šiuo metu nėra sukurtas prieinamas didelės apimties ASR lietuvių kalbos žodynas, nėra aiškaus apibrėžto būdo, kaip kurti naują ASR mechanizmą, taip pat egzistuoja kiti neapibrėžtumai, kurie neleidžia sukurti rinkoje reikalingų bei paklausių produktų, neatlikus MTEP veiklų (pvz., nėra aišku, kaip įdiegti TTS ir ASR API, skirtingų mobiliųjų platformų galimybių poveikis ASR kokybei, skirtingų įrašų tipų, prastos kokybės įrašų transkribavimo mechanizmai, egzistuojančių TTS ribotas pritaikomumas bet kokio pobūdžio specializuotam tekstui, turinčiam specifinius sektoriaus terminus ar santrumpas (teisėje, medicinoje, fizikoje, ekonomikoje, kt.). Siekiant sukurti vartotojams aktualius įrankius/produktus/paslaugas, UAB "Tilde informacinės technologijos" kartu su Baltijos pažangių technologijų institutu planuoja įgyvendinti projektą "Automatinio šnekos atpažinimo, sintezės bei adaptavimo technologijų kūrimas ir tobulinimas, vykdant MTEP" (sutrumpintas pavadinimas - "Speech Cloud"). Įgyvendinus projektą, yra numatyta sukurti programėlę mobiliems įrenginiams, garso failų transkribavimo ir šnekos sintezės paslaugų tinklalapį, asmeniniam kompiuteriui skirtą diktavimo programinę įrangą, taip pat sukurti naujų paslaugų trečių šalių sistemų kūrėjams ir šnekos technologijų pritaikytojams prototipus. (Lithuanian)
    Currently, a large amount of audio and video information is accumulated in the electronic space, which is not indexed and cannot be used for text/statistical analysis and rapid search. The possibility of indexing this type of information (transforming it into textual information and vice versa) is relevant for many public authorities and private users. This functionality increases the efficiency and traceability of minutes of meetings, and the analysis of information stored in electronic media can be much faster. Currently, there is no available large-scale Lithuanian dictionary of ASR, there is no clear way to develop a new RAS mechanism, and there are other uncertainties that prevent the creation of market-needed and demanded products without R & D activities (e.g., it is not clear how to implement ITS and ASR APIs, the impact of different mobile platform options on ASR quality, different record types, poor quality record transcription mechanisms, existing LAS limited applicability to any type of specialised text with specific sector terms or abbreviations (law, medicine, physics, economy, etc.). In order to create user-relevant tools/products/services, UAB “Tilde Information Technologies” together with the Baltic Institute of Advanced Technologies is planning to implement the project “Development and improvement of automatic speech recognition, fusion and adaptation technologies through R & D” (abbreviated name — “Speech Cloud”). The project includes the development of an app for mobile devices, a website for audio file transcription and speech fusion services, a personal computer diction software, as well as prototypes of new services for third-party system developers and speech technology adaptors. (English)
    1 February 2022
    Actuellement, une grande quantité d’informations audio et vidéo est accumulée dans l’espace électronique, qui n’est pas indexé et ne peut pas être utilisé pour l’analyse textuelle/statistique et la recherche rapide. La possibilité d’indexer ce type d’informations (la transformer en informations textuelles et vice versa) est pertinente pour de nombreuses autorités publiques et utilisateurs privés. Cette fonctionnalité augmente l’efficacité et la traçabilité des procès-verbaux des réunions, et l’analyse des informations stockées dans les médias électroniques peut être beaucoup plus rapide. À l’heure actuelle, il n’existe pas de dictionnaire lituanien à grande échelle de la RSA, il n’existe pas de moyen clair de développer un nouveau mécanisme RAS, et il existe d’autres incertitudes qui empêchent la création de produits nécessaires et demandés sur le marché sans activités de R & D (par exemple, il n’est pas clair comment mettre en œuvre les ITS et les API ASR, l’impact des différentes options de plate-forme mobile sur la qualité des ASR, différents types d’enregistrements, les mécanismes de transcription des enregistrements de mauvaise qualité, l’applicabilité limitée de la LAS à tout type de texte spécialisé avec des termes sectoriels ou des abréviations spécifiques (loi, médecine, physique, économie, etc.). Afin de créer des outils/produits/services pertinents pour les utilisateurs, l’UAB «Tilde Information Technologies» et l’Institut balte des technologies avancées prévoient de mettre en œuvre le projet «Développement et amélioration des technologies automatiques de reconnaissance vocale, de fusion et d’adaptation grâce à la R & D» (nom abrégé «Speech Cloud»). Le projet comprend le développement d’une application pour les appareils mobiles, d’un site Web pour les services de transcription de fichiers audio et de fusion de la parole, d’un logiciel de diction informatique personnel, ainsi que de prototypes de nouveaux services pour les développeurs de systèmes tiers et les adaptateurs de technologie de la parole. (French)
    1 February 2022
    Derzeit wird eine große Menge an Audio- und Videoinformationen im elektronischen Raum angesammelt, der nicht indiziert ist und nicht für Text-/Statistikanalysen und schnelle Suche verwendet werden kann. Die Möglichkeit einer Indexierung dieser Art von Informationen (Umsetzung in Textinformationen und umgekehrt) ist für viele Behörden und private Nutzer relevant. Diese Funktionalität erhöht die Effizienz und Rückverfolgbarkeit von Sitzungsprotokollen, und die Analyse der in elektronischen Medien gespeicherten Informationen kann viel schneller erfolgen. Derzeit gibt es kein groß angelegtes litauisches Wörterbuch der ASR, es gibt keinen klaren Weg, um einen neuen RAS-Mechanismus zu entwickeln, und es gibt weitere Unsicherheiten, die die Schaffung marktnotwendiger und geforderter Produkte ohne F & E-Aktivitäten verhindern (z. B. ist nicht klar, wie ITS- und ASR-APIs implementiert werden können, wie sich verschiedene mobile Plattformoptionen auf die ASR-Qualität auswirken, unterschiedliche Plattentypen, Mechanismen für die Übertragung schlechter Qualität, bestehende LAS beschränkte Anwendbarkeit auf jede Art von spezialisierten Texten mit spezifischen Branchenbegriffen oder Abkürzungen (Gesetz, Medizin, Physik, Wirtschaft usw.). Um nutzerrelevante Tools/Produkte/Dienste zu schaffen, plant UAB „Tilde Information Technologies“ zusammen mit dem Baltic Institute of Advanced Technologies das Projekt „Entwicklung und Verbesserung von automatischen Spracherkennungs-, Fusions- und Anpassungstechnologien durch Forschung und Entwicklung“ (kurz: „Speech Cloud“). Das Projekt umfasst die Entwicklung einer App für mobile Geräte, eine Website für Audiodatei Transkription und Sprachfusionsdienste, eine PC-Diction-Software sowie Prototypen neuer Services für Drittanbieter-Systementwickler und Sprachtechnologie-Adapter. (German)
    2 February 2022
    Momenteel wordt een grote hoeveelheid audio- en video-informatie verzameld in de elektronische ruimte, die niet geïndexeerd is en niet kan worden gebruikt voor tekst-/statistische analyse en snel zoeken. De mogelijkheid om dit soort informatie te indexeren (om te zetten in tekstuele informatie en vice versa) is relevant voor veel overheidsinstanties en particuliere gebruikers. Deze functionaliteit verhoogt de efficiëntie en traceerbaarheid van notulen van vergaderingen en de analyse van in elektronische media opgeslagen informatie kan veel sneller verlopen. Momenteel is er geen grootschalig Litouws woordenboek van ASR, er is geen duidelijke manier om een nieuw RAS-mechanisme te ontwikkelen, en er zijn andere onzekerheden die het creëren van marktbenodigde en gevraagde producten zonder O & O-activiteiten verhinderen (het is bijvoorbeeld niet duidelijk hoe ITS- en ASR-API’s moeten worden geïmplementeerd, de impact van verschillende mobiele platformopties op ASR-kwaliteit, verschillende recordtypes, mechanismen voor slechte kwaliteit van de transcriptie van verslagen, bestaande LAS beperkte toepasbaarheid op elk type gespecialiseerde tekst met specifieke sectortermen of afkortingen (wet, geneeskunde, natuurkunde, economie, enz.). Om voor de gebruiker relevante tools/producten/diensten te creëren, is UAB „Tilde Information Technologies” samen met het Baltic Institute of Advanced Technologies van plan het project „Ontwikkeling en verbetering van automatische spraakherkenning, fusie en aanpassingstechnologieën door middel van O & O” (afgekorte naam — „Speech Cloud”) uit te voeren. Het project omvat de ontwikkeling van een app voor mobiele apparaten, een website voor audiobestand transcriptie en spraakfusie diensten, een personal computer diction software, evenals prototypes van nieuwe diensten voor externe systeemontwikkelaars en spraaktechnologie adapters. (Dutch)
    2 February 2022
    Actualmente, una gran cantidad de información de audio y vídeo se acumula en el espacio electrónico, que no está indexada y no se puede utilizar para el análisis texto/estadístico y la búsqueda rápida. La posibilidad de indexar este tipo de información (transformarla en información textual y viceversa) es relevante para muchas autoridades públicas y usuarios privados. Esta funcionalidad aumenta la eficiencia y trazabilidad de las actas de las reuniones, y el análisis de la información almacenada en medios electrónicos puede ser mucho más rápido. En la actualidad, no existe un diccionario lituano a gran escala de ASR disponible, no hay una manera clara de desarrollar un nuevo mecanismo de RAS, y hay otras incertidumbres que impiden la creación de productos necesarios y demandados en el mercado sin actividades de I+D (por ejemplo, no está claro cómo implementar las API de STI y ASR, el impacto de las diferentes opciones de plataformas móviles en la calidad de la RSA, los diferentes tipos de registros, los mecanismos de transcripción de registros de mala calidad, la aplicabilidad limitada de LAS existentes a cualquier tipo de texto especializado con términos o abreviaturas sectoriales específicos (ley, medicina, física, economía, etc.). Con el fin de crear herramientas/productos/servicios relevantes para el usuario, la UAB «Tilde Information Technologies» junto con el Instituto Báltico de Tecnologías Avanzadas tiene previsto ejecutar el proyecto «Desarrollo y mejora de las tecnologías automáticas de reconocimiento de voz, fusión y adaptación a través de la I+D» (nombre abreviado — «Speech Cloud»). El proyecto incluye el desarrollo de una aplicación para dispositivos móviles, un sitio web para la transcripción de archivos de audio y servicios de fusión de voz, un software de dicción informática personal, así como prototipos de nuevos servicios para desarrolladores de sistemas de terceros y adaptadores de tecnología de voz. (Spanish)
    3 February 2022
    Naugarduko g. 100, Vilnius
