MULTI-FACETED DOMAIN ADAPTATION FOR ADVANCED TEXTUAL SEMANTIC PROCESSING (Q3140121)

From EU Knowledge Graph
Revision as of 12:35, 2 December 2021 by DG Regio (talk | contribs) (‎Created claim: summary (P836): LES DIFFÉRENCES DANS LE DOMAINE DISCURSIF, LE STYLE ET LE VOCABULAIRE SONT LES CAUSES POUR QUE LES PERFORMANCES DES OUTILS DE TRAITEMENT DU LANGAGE NATUREL (PLN) S’AGGRAVENT CONSIDÉRABLEMENT LORSQU’ELLES SONT UTILISÉES EN DEHORS DU DOMAINE. CECI EST PRINCIPALEMENT DÛ À L’UTILISATION PRIVILÉGIÉE DANS LE PLN, EN RAISON DE SES MEILLEURES PERFORMANCES, DE TECHNIQUES D’APPRENTISSAGE AUTOMATIQUE SUPERVISÉS. TOUTEFOIS, POUR SON FONCTIONNEMENT OPTIMAL,...)
Jump to navigation Jump to search
Project Q3140121 in Spain
Language Label Description Also known as
English
MULTI-FACETED DOMAIN ADAPTATION FOR ADVANCED TEXTUAL SEMANTIC PROCESSING
Project Q3140121 in Spain

    Statements

    0 references
    95,953.0 Euro
    0 references
    191,906.0 Euro
    0 references
    50.0 percent
    0 references
    1 January 2016
    0 references
    31 December 2018
    0 references
    UNIVERSIDAD DEL PAIS VASCO/EUSKAL HERRIKO UNIBERTSITATEA
    0 references
    0 references

    43°19'20.71"N, 1°59'2.00"W
    0 references
    20069
    0 references
    LAS DIFERENCIAS EN DOMINIO DISCURSIVO, ESTILO Y VOCABULARIO SON LAS CAUSAS DE QUE EL RENDIMIENTO DE LAS HERRAMIENTAS DE PROCESAMIENTO DEL LENGUAJE NATURAL (PLN) EMPEOREN SUSTANCIALMENTE CUANDO SE USAN FUERA DE DOMINIO. ESTO SE DEBE PRINCIPALMENTE AL USO PREFERENTE EN EL PLN, POR SU MEJOR RENDIMIENTO, DE LAS TECNICAS DE APRENDIZAJE AUTOMATICO SUPERVISADO. SIN EMBARGO, PARA SU FUNCIONAMIENTO OPTIMO, EL ENFOQUE SUPERVISADO REQUIERE SER ENTRENADO SOBRE TEXTOS DEL DOMINIO DE APLICACION MANUALMENTE ETIQUETADOS. ASI, CUALQUIER ENTIDAD INTERESADA EN APLICAR TECNOLOGIA DE PLN EN SU SECTOR TENDRIA QUE DEDICAR UN GRAN ESFUERZO E INVERSION AL ETIQUETADO MANUAL DE TEXTOS DE UN DOMINIO ESPECIFICO. ESTO CLARAMENTE SUPONE UNA BARRERA INFRANQUEABLE PARA MUCHAS EMPRESAS (ESPECIALMENTE PYMES) QUE PIERDEN ASI OPORTUNIDADES CLARAS DE NEGOCIO. ADEMAS, ESTE PROBLEMA IMPIDE LA ADOPCION DE TECNOLOGIA DE PLN EN LA ADMINISTRACION PUBLICA. POR EJEMPLO, EN EL DOMINIO MEDICO, PLN PUEDE SER MUY UTIL PARA AYUDAR A LOS SISTEMAS DE SOPORTE A LA DECISION CLINICA, LO CUAL PERMITIRIA AYUDAR A PROFESIONALES DE LA MEDICINA A TOMAR DECISIONES CLINICAS, A LA GESTION DE LA GRAN CANTIDAD DE DATOS RELACIONADOS CON EL HISTORIAL DE PACIENTES, O CON EL CONOCIMIENTO NECESARIO PARA INTERPRETAR ESOS DATOS._x000D_ _x000D_ POR OTRA PARTE, EN EL DOMINIO TURISTICO, LOS PROFESIONALES DEL SECTOR NECESITAN CONOCIMIENTO NO-AMBIGUO Y ESTRUCTURADO PARA AYUDARLES A ENTENDER EL MERCADO TURISTICO, A REALIZAR ANALISIS COMPLETOS Y TOMAR DECISIONES ACERCA DE LA ESTRATEGIA COMERCIAL O PUBLICITARIA QUE DEBE SEGUIR LA INDUSTRIA O LA ADMINISTRACION PARA GESTIONAR SUS RECURSOS TURISTICOS, TODO ELLO BASADO EN LA INFORMACION PROPORCIONADA POR LOS USUARIOS EN SUS OPINIONES EXPRESADAS POR EJEMPLO EN REDES SOCIALES O PORTALES ESPECIALIZADOS._x000D_ _x000D_ POR TANTO, EN DOMINIOS COMO LOS MENCIONADOS, LA TECNOLOGIA DE PLN ES NECESARIA PARA EXTRAER CONOCIMIENTO ESTRUCTURADO A PARTIR DE CANTIDADES MASIVAS DE TEXTO NO-ESTRUCTURADO QUE SEA COMPLETO, PRECISO, RELEVANTE E INTER-OPERABLE PARA REALIZAR DECISIONES INFORMADAS. EN TUNER SE INVESTIGARAN TECNOLOGIAS GENERALES Y ESPECIFICAS DE CADA DOMINIO PARA INDUCIR LAS INFORMACION NECESARIA PARA DESARROLLAR HERRAMIENTAS DE PLN CUANDO NO HAY DISPONIBLES DATOS DE ENTRENAMIENTO ETIQUETADOS MANUALMENTE PARA ESE DOMINIO. A ESTE RESPECTO, TUNER DESARROLLARA SISTEMAS INTERLINGUISTICOS Y ORIENTADOS A UN DOMINIO QUE PROPORCIONARAN CAPACIDADES SEMANTICAS AVANZADAS PARA EL PROCESAMIENTO MASIVO DE DATOS. ADEMAS, TUNER PROPORCIONARA ESTAS TECNICAS EN UN ENTORNO MULTILINGUE PARA EL DESARROLLO DEL PLN EN CASTELLANO, CATALAN, GALLEGO, EUSKARA E INGLES._x000D_ PARA LA FORMACION DEL EQUIPO DE INVESTIGACION SE HAN SELECCIONADO CUIDADOSAMENTE UN GRUPO COMPLEMENTARIO DE INVESTIGADORES PROVENIENTES DE CINCO GRUPOS DE INVESTIGACION LOS CUALES SE CONFORMAN EN UN LABORATORIO VIRTUAL DE INVESTIGACION CON LA MASA CRITICA NECESARIA PARA TRATAR Y ALCANZAR LOS RETOS Y OBJETIVOS PLANTEADOS EN EL PROYECTO. TUNER ESTA POR TANTO FORMADO POR UN GRUPO INTERDISCIPLINAR CON EXPERIENCIA PROBADA TANTO EN INFORMATICA COMO EN PLN COMO EN CONOCIMIENTO EN LOS CINCO IDIOMAS INCLUIDOS EN EL PROYECTO._x000D_ _x000D_ LA TRANSFERENCIA DE TECNOLOGIA A LA INDUSTRIA SERA FACILITADA POR LA ADOPCION DE LOS ESTANDARES DE REPRESENTACION, LAS PRACTICAS Y LAS  LICENCIAS DE SOFTWARE Y RECURSOS LIBRES MAS ADECUADAS. LA CANTIDAD E IMPORTANCIA DE LAS EMPRESAS Y ORGANISMOS INTERESADOS EN ESTA PROPUESTA MUESTRAN CLARAMENTE EL INTERES QUE YA SUSCITA ESTE PROYECTO. (Spanish)
    0 references
    DIFFERENCES IN DISCURSIVE DOMAIN, STYLE, AND VOCABULARY ARE THE CAUSES FOR THE PERFORMANCE OF NATURAL LANGUAGE PROCESSING TOOLS (PLN) TO WORSEN SUBSTANTIALLY WHEN USED OUTSIDE THE DOMAIN. THIS IS MAINLY DUE TO THE PREFERRED USE IN THE PLN, DUE TO ITS BEST PERFORMANCE, OF SUPERVISED AUTOMATIC LEARNING TECHNIQUES. HOWEVER, FOR ITS OPTIMAL FUNCTIONING, THE SUPERVISED APPROACH REQUIRES BEING TRAINED ON MANUALLY LABELED APPLICATION DOMAIN TEXTS. THUS, ANY ENTITY INTERESTED IN APPLYING PLN TECHNOLOGY IN ITS SECTOR WOULD HAVE TO DEVOTE A GREAT EFFORT AND INVESTMENT TO MANUAL LABELING OF TEXTS OF A SPECIFIC DOMAIN. THIS CLEARLY REPRESENTS AN INSURMOUNTABLE BARRIER FOR MANY COMPANIES (ESPECIALLY SMES) WHICH THUS LOSE CLEAR BUSINESS OPPORTUNITIES. MOREOVER, THIS PROBLEM PREVENTS THE ADOPTION OF PLN TECHNOLOGY IN THE PUBLIC ADMINISTRATION. For example, IN THE MEDICAL DOMINUM, PLN can be used very much to assist the systems supporting the CLINICAL decision, which would enable it to assist professionals of the MEDICINE to take CLINICAL decisions, to the management of the great quantity of data related to the history of paternities, or with the necessary know-how to enter these data._x000D_ _x000D_ BY OTHER PART, IN THE TURISTIC DOMARY, the SECTOR’s PROFESSIONALS NECESITENT NON-ambiguous KNOWORKING AND STRUCTURED TO HEAD THE TURISTIC MARKET, to implement analyses and take decisions on trade or marketing strategies that must be followed by industry or administration to manage their turistic resources, all of which are based on the information provided by users in their operations in Europe special SOCIALISED SOCIALISED._x000D_ _x000D_ BY QUANT, IN DOMINIES AS MENCIONED, PLN’S TECHNOLOGY IS NEED TO EXTRACE STRATEGED KNOWING TO PART OF MASIVE QANTITIES OF NON-STRUCTURED TEXT THAT IS COMPLETE, PRICE, RELEVANT AND INTER-OPERABLE TO RELATED DECISIONS. TUNER WILL INVESTIGATE GENERAL AND DOMAIN-SPECIFIC TECHNOLOGIES TO INDUCE THE INFORMATION NEEDED TO DEVELOP PLN TOOLS WHEN MANUALLY LABELED TRAINING DATA ARE NOT AVAILABLE FOR THAT DOMAIN. IN THIS RESPECT, TUNER WILL DEVELOP INTERLINGUISTIC, DOMAIN-ORIENTED SYSTEMS THAT WILL PROVIDE ADVANCED SEMANTIC CAPABILITIES FOR MASS DATA PROCESSING. In addition, TUNER will provide these techniques in a multi-lingual environment for the development of the PLN in CASTELLANO, CATALAN, GALLEGO, EUSKARA and INGLES._x000D_ FOR THE FORMATION OF THE RESEARCH EQUIPMENT TECHNOLOGY A COMPLEMENTARY GROUP OF PROVENENT RESEARCH of FIVE RESEARCH GROUPS WHAT IS CONFORMED IN A VIRTUAL LABORATORY OF RESEARCH WITH THE CRITICAL WEEKS OF NECESARY TO TREAT AND ARE THE RETS AND OBJECTIVES PLANTED IN THE PROJECT. Tuner is for as long as it was formed by an interdisciplinary group with experienced experience in information as in PLN as in knowledge in the five countries included in the project._x000D__x000D__x000D_ THE TRANSFERENCE OF TECHNOLOGY TO INDUSTRY will be FACILITED by the adoption of the standards of replenishment, the PRACTICAS AND LICENCES OF SOFTWARE AND FREE RESOURCES MORE ADECTED. THE NUMBER AND IMPORTANCE OF THE COMPANIES AND BODIES INVOLVED IN THIS PROPOSAL CLEARLY SHOW THE INTEREST ALREADY AROUSED BY THIS PROJECT. (English)
    12 October 2021
    0 references
    LES DIFFÉRENCES DANS LE DOMAINE DISCURSIF, LE STYLE ET LE VOCABULAIRE SONT LES CAUSES POUR QUE LES PERFORMANCES DES OUTILS DE TRAITEMENT DU LANGAGE NATUREL (PLN) S’AGGRAVENT CONSIDÉRABLEMENT LORSQU’ELLES SONT UTILISÉES EN DEHORS DU DOMAINE. CECI EST PRINCIPALEMENT DÛ À L’UTILISATION PRIVILÉGIÉE DANS LE PLN, EN RAISON DE SES MEILLEURES PERFORMANCES, DE TECHNIQUES D’APPRENTISSAGE AUTOMATIQUE SUPERVISÉS. TOUTEFOIS, POUR SON FONCTIONNEMENT OPTIMAL, L’APPROCHE SUPERVISÉE NÉCESSITE UNE FORMATION SUR LES TEXTES DE DOMAINE D’APPLICATION ÉTIQUETÉS MANUELLEMENT. AINSI, TOUTE ENTITÉ INTÉRESSÉE PAR L’APPLICATION DE LA TECHNOLOGIE PLN DANS SON SECTEUR DEVRAIT CONSACRER BEAUCOUP D’EFFORTS ET D’INVESTISSEMENTS À L’ÉTIQUETAGE MANUEL DE TEXTES D’UN DOMAINE SPÉCIFIQUE. IL S’AGIT CLAIREMENT D’UN OBSTACLE INSURMONTABLE POUR DE NOMBREUSES ENTREPRISES (EN PARTICULIER LES PME) QUI PERDENT AINSI DES DÉBOUCHÉS COMMERCIAUX ÉVIDENTS. EN OUTRE, CE PROBLÈME EMPÊCHE L’ADOPTION DE LA TECHNOLOGIE PLN DANS L’ADMINISTRATION PUBLIQUE. Par exemple, DANS LE MÉDICAL Dominum, PLN peut être très utilisé pour aider les systèmes soutenant la décision CLINICAL, ce qui lui permettrait d’aider les professionnels de la MEDICINE à prendre des décisions CLINICAL, à la gestion de la grande quantité de données liées à l’histoire des paternités, ou avec le savoir-faire nécessaire pour saisir ces données._x000D_ _x000D_ PAR AUTRES PARTIES, au DOMAIRE TURISTIQUE, les PROFESSIONNELS DU SECTEUR NECESITENTS NON ambigueux KNOWORKING ET STRUCTURE DANS LE MARCHÉ TURISTIQUE, de mettre en œuvre des analyses et de prendre des décisions sur les stratégies commerciales ou commerciales qui doivent être suivies par l’industrie ou l’administration pour gérer leurs ressources turistiques, toutes basées sur les informations fournies par les utilisateurs dans leurs opérations en Europe SOCIALISED SPÉCIALISÉ._x000D_ _x000D_ BY QUANT, la TECHNOLOGIE DE LA TECHNOLOGIE DE PLN est nécessaire pour EXTRACE STRATÉGÉ STRATÉGÉ CONCERNANT une partie des qualités masives du TEXTE NON-STRUCTURED QUE est COMPLETE, PRIX, RELEVANT ET INTEROPÉRABLE aux DÉCISIONS RELATIVES. TUNER ÉTUDIERA LES TECHNOLOGIES GÉNÉRALES ET SPÉCIFIQUES AU DOMAINE AFIN D’INCITER LES INFORMATIONS NÉCESSAIRES À LA MISE AU POINT D’OUTILS PLN LORSQUE DES DONNÉES DE FORMATION ÉTIQUETÉES MANUELLEMENT NE SONT PAS DISPONIBLES POUR CE DOMAINE. À CET ÉGARD, TUNER DÉVELOPPERA DES SYSTÈMES INTERLINGUISTIQUES AXÉS SUR LE DOMAINE QUI FOURNIRONT DES CAPACITÉS SÉMANTIQUES AVANCÉES POUR LE TRAITEMENT DES DONNÉES DE MASSE. En outre, TUNER fournira ces techniques dans un environnement multilingue pour le développement du PLN à CASTELLANO, CATALAN, GALLEGO, EUSKARA et INGLES._x000D_ POUR LA FORMATION DE LA TECHNOLOGIE DE L’ÉQUIPEMENT DE RECHERCHE UNE GROUPE COMPLÉMENTAIRE DE RECHERCHE PROVENENTE DE CINQ GROUPS DE RECHERCHE QUE est conforme dans une LABORATOIRE VIRTUELLE DE RECHERCHE AVEC les SEMAINES CRITICALES DU TRAITEMENT ET DES OBJECTIFS DANS LE PROJET. Tuner est pour autant qu’il a été formé par un groupe interdisciplinaire ayant une expérience expérimentée dans l’information comme en PLN que dans les connaissances dans les cinq pays inclus dans le projet._x000D_x000D__x000D_La TRANSFERENCE DE TECHNOLOGIE À L’INDUSTRIE sera facilitée par l’adoption des normes de reconstitution, les PRACTIQUES ET LICENCES DE SOFTWARE ET LES RESSOURCES GRATUITES PLUS ADECTÉS. LE NOMBRE ET L’IMPORTANCE DES ENTREPRISES ET DES ORGANISMES CONCERNÉS PAR CETTE PROPOSITION TÉMOIGNENT CLAIREMENT DE L’INTÉRÊT DÉJÀ SUSCITÉ PAR CE PROJET. (French)
    2 December 2021
    0 references
    Donostia/San Sebastián
    0 references

    Identifiers

    TIN2015-65308-C5-1-R
    0 references