PARALLEL CORPUS OF ANCIENT ENGLISH PROSE. LABELLING, ANNOTATION AND RELATED LINGUISTIC STUDIES (Q3187875)

From EU Knowledge Graph
Revision as of 17:48, 9 December 2021 by DG Regio (talk | contribs) (‎Changed label, description and/or aliases in de, and other parts: Adding German translations)
Jump to navigation Jump to search
Project Q3187875 in Spain
Language Label Description Also known as
English
PARALLEL CORPUS OF ANCIENT ENGLISH PROSE. LABELLING, ANNOTATION AND RELATED LINGUISTIC STUDIES
Project Q3187875 in Spain

    Statements

    0 references
    27,225.0 Euro
    0 references
    54,450.0 Euro
    0 references
    50.0 percent
    0 references
    1 January 2018
    0 references
    31 December 2020
    0 references
    UNIVERSIDAD DE LA RIOJA
    0 references

    42°27'58.03"N, 2°26'22.81"W
    0 references
    26089
    0 references
    EL OBJETIVO GENERAL DEL PROYECTO ES RECOPILAR, ANALIZAR Y DIFUNDIR UN CORPUS PARALELO Y ALINEADO INGLES ANTIGUO-INGLES CONTEMPORANEO CON EL QUE LLEVAR A CABO ESTUDIOS LINGUISTICOS Y DE LINGUISTICA DE CORPUS. EL CORPUS ESTA GLOSADO, LEMATIZADO, ANOTADO Y ETIQUETADO EN SU PARTE ANGLOSAJONA, QUE COMPRENDE UNAS 50.000 PALABRAS DE TEXTOS EN PROSA REPRESENTATIVOS. LA METODOLOGIA DEL PROYECTO ESTA BASADA EN LA RECOPILACION, ALMACENAMIENTO, ANALISIS Y DIFUSION DEL LENGUAJE REAL CON SOFTWARE DE BASE DE DATOS; EL DISEÑO Y LA IMPLEMENTACION DEL CORPUS GUIADOS POR LAS CONCLUSIONES DE LA RECOPILACION DE UN CORPUS PILOTO; LA MAXIMIZACION DE LA LEMATIZACION, EL ETIQUETADO Y LA ANOTACION AUTOMATICAS; LA RETROALIMENTACION DEL ANALISIS MANUAL DEL CORPUS A LAS BASES DE DATOS Y EL LEMATIZADOR; Y LA DIFUSION DE LOS RESULTADOS EN OPEN ACCESS. EL PROYECTO PRETENDE CONTRIBUIR A LA LINGUISTICA DE CORPUS, YA QUE NO ES HABITUAL RECOPILAR CORPORA DIACRONICOS ALINEADOS Y, SOBRE TODO, SE PROPONE UN METODO DE ALINEAMIENTO BASADO EN EL LEXICO DERIVADO; (II) LA LINGUISTICA DE CORPUS DEL INGLES, PUESTO QUE NO EXISTE UN CORPUS PARALELO LEMATIZADO Y GLOSADO PALABRA POR PALABRA; (III) LA LEXICOGRAFIA ELECTRONICA, PORQUE SE PROPONE UN METODO DE ALIMENTACION DEL CORPUS A PARTIR DE BASES DE CONOCIMIENTO; (IV) LA LEXICOGRAFIA DEL INGLES ANTIGUO, YA QUE SE ABORDAN CUESTIONES DE CUESTIONES DE VARIACION ORTOGRAFICA Y FLEXIVA ATRIBUIBLE A LA DIVERSIDAD TEMPORAL, GEOGRAFICA Y DE TRANSMISION TEXTUAL, ASPECTOS DE NORMALIZACION Y LEMATIZACION AUTOMATICA Y SEMIAUTOMATICA; (V) EL INTERNET DE TERCERA GENERACION, CONSIDERANDO QUE LOS RESULTADOS DEL ANALISIS LINGUISTICO CON BASE DE DATOS CONSTITUYEN DATOS ESTRUCTURADOS, CON POSIBILIDAD DE SER PRESENTADOS COMO DATOS ENLAZADOS; (VI) LAS HUMANIDADES DIGITALES, TENIENDO EN CUENTA QUE SE VA A ELABORAR UN INTERFAZ DE USUARIO ONLINE QUE OFREZCA EL TEXTO PARALELO TANTO CON GLOSA PALABRA POR PALABRA COMO CON TRADUCCION POR FRAGMENTO, ASI COMO LA CORRESPONDENCIA Y EL REALCE, Y PERMITA LA BUSQUEDA DE LA INFORMACION DEL ETIQUETADO Y LA ANOTACION POR LEMA Y POR FORMA FLEXIVA; Y (VII) NO SOLO LOS ESTUDIOS LINGUISTICOS DEL INGLES ANTIGUO, SINO TAMBIEN LOS LITERARIOS Y CULTURALES PORQUE EL ANALISIS Y LA TRADUCCION DE LOS TEXTOS PUEDE SERVIR DE FUENTE O REFERENCIA PARA ESTUDIOS DE ESTOS AMBITOS. (Spanish)
    0 references
    THE AIM OF THIS PROJECT IS TO COMPILE, ANALISE AND OFFER A PARALLEL CORPUS OLD ENGLISH-CONTEMPORARY ENGLISH, ALIGNED AT WORD LEVEL, ON THE BASIS OF WHICH STUDIES IN OLD ENGILSH LINGUISTICS AND CORPUS LINGUISTICS CAN BE CONDUCTED. THE CORPUS SHALL BE GLOSSED, LEMMATISED, TAGGED AND ANNOTATED IN ITS ANGLO-SAXON SEGMENT, WHICH COMPRISES AROUND 50,000 WORDS FROM REPRESENTATIVE PROSE TEXTS. THE METHODOLOGY OF RESEARCH IS BASED ON THE GATHERING, STORAGE, ANALYSIS AND DISSEMINATION OF REAL LANGUAGE WITH DATABASE SOFTWARE; THE DESIGN AND IMPLEMENTATION GUIDED BY THE CONCLUSIONS REACHED AFTER THE CREATION OF A PILOT CORPUS; THE MAXIMISATION OF AUTOMATIC LEMMATISATION, TAGGING AND ANNOTATION; THE FEEDBACK OF THE DATABASES AND THE LEMMATISER WITH THE INFORMATION GATHERED WITH MANUAL ANALYSIS; AND THE DISSEMINATION OF RESULTS IN OPEN ACCESS. THUS DESCRIBED, THE PROJECT INTENDS TO CONTRIBUTE TO CORPUS LINGUISTICS, GIVEN THAT AN ALIGNMENT METHOD BASED ON THE DERIVED LEXICON IS PROPOSED; ENGLISH CORPUS LINGUISTICS, BECAUSE NO CORPUS OF THIS LANGUAGE IS AVAILABLE THAT CONTAINS LEMMAS, GLOSSES AND WORD BY WORD ALIGNMENT; ELECTRONIC LEXICOGRAPHY, SINCE A METHOD FOR FEEDING PARALLEL CORPORA WITH KNOWLEDGE BASES IS DEVELOPED; OLD ENGLISH LEXICOGRAPHY, BECAUSE QUESTIONS ARE ADDRESSED THAT HAVE TO DO WITH SPELLING AND MORPHOLOGICAL VARIATION ATTRIBUTABLE TO THE TIME SPAN, NORMALISATION AS WELL AS AUTOMATIC AND SEMI-AUTOMATIC LEMMATISATION; THIRD GENERATION INTERNET, GIVEN THAT THE RESULTS OF LINGUISTIC ANALYSIS WITH DATA BASES REPRESENT STRUCTURED DATA THAT, MOREOVER, CAN BE PRESENTED AS LINKED DATA; DIGITAL HUMANITIES, ONCE THE ONLINE USER INTERFACE OFFERS THE PARALLEL TEXT, THE WORD BY WORD GLOSS, THE TRANSLATION, THE ALIGNMENT AND THE HIGHLIGHTING, AND ALLOWS SEARCHES FOR TAGGING AND ANNOTATION BY LEMMA AND INFLECTIONAL FORM; AND OLD ENGLISH, INCLUDING NOT ONLY LINGUISTICS, BUT ALSO LITERATURE AND CULTURAL STUDIES, GIVEN THAT THE TEXTS AND THEIR TRANSLATIONS CAN BE USED FOR SOURCES FOR VARIOUS FIELDS AND APPROACHES. (English)
    0 references
    L’OBJECTIF GÉNÉRAL DU PROJET EST DE COLLECTER, D’ANALYSER ET DE DIFFUSER UN CORPUS PARALLÈLE D’ANGLAIS ANCIEN CONTEMPORAIN AVEC LEQUEL DES ÉTUDES LINGUISTIQUES ET LINGUISTIQUES DU CORPUS SONT MENÉES. LE CORPUS EST BRILLANT, LEMATISED, ANNOTÉ ET ÉTIQUETÉ DANS SA PARTIE ANGLO-SAXONNE, COMPRENANT ENVIRON 50 000 MOTS DE TEXTES DE PROSE REPRÉSENTATIFS. LA MÉTHODOLOGIE DU PROJET REPOSE SUR LA COLLECTE, LE STOCKAGE, L’ANALYSE ET LA DIFFUSION DE LA LANGUE RÉELLE AU MOYEN D’UN LOGICIEL DE BASE DE DONNÉES; LA CONCEPTION ET LA MISE EN ŒUVRE DU CORPUS SUR LA BASE DES CONCLUSIONS DE LA COMPILATION D’UN CORPUS PILOTE; MAXIMISATION DE LA LEMATISATION AUTOMATIQUE, DE L’ÉTIQUETAGE ET DE L’ANNOTATION; RETOUR D’INFORMATIONS PROVENANT DE L’ANALYSE MANUELLE DES CORPUS AUX BASES DE DONNÉES ET À LEMATISER; ET LA DIFFUSION DES RÉSULTATS EN LIBRE ACCÈS. LE PROJET VISE À CONTRIBUER À LA LINGUISTICA DE CORPUS, CAR IL N’EST PAS HABITUEL DE COLLECTER LES CORPORA ALIGNÉS DIACRONICOS ET, SURTOUT, UNE MÉTHODE D’ALIGNEMENT BASÉE SUR LE LEXIQUE DÉRIVÉ EST PROPOSÉE; II) LE CORPUS DE LANGUE ANGLAISE, PUISQU’IL N’EXISTE PAS DE CORPUS PARALLÈLE LEMATISED ET GLOSSED MOT POUR MOT; III) LA LEXICOGRAPHIE ÉLECTRONIQUE, PARCE QU’UNE MÉTHODE D’ALIMENTATION DU CORPUS EST PROPOSÉE À PARTIR DE BASES DE CONNAISSANCES; IV) LA LEXICOGRAPHIE DE L’ANCIEN ANGLAIS, DANS LA MESURE OÙ ELLE ABORDE DES QUESTIONS DE VARIATIONS ORTHOGRAPHIQUES ET FLEXIVES ATTRIBUABLES À LA DIVERSITÉ TEMPORELLE, GÉOGRAPHIQUE ET TEXTUELLE, AUX ASPECTS DE LA NORMALISATION ET À LA LEMATIZACION AUTOMATIQUE ET SEMI-AUTOMATIQUE; (V) L’INTERNET DE TROISIÈME GÉNÉRATION, CONSIDÉRANT QUE LES RÉSULTATS DE L’ANALYSE LINGUISTIQUE AVEC BASE DE DONNÉES CONSTITUENT DES DONNÉES STRUCTURÉES, AVEC LA POSSIBILITÉ D’ÊTRE PRÉSENTÉS COMME DES DONNÉES LIÉES; VI) LES SCIENCES HUMAINES NUMÉRIQUES, EN TENANT COMPTE DU FAIT QU’UNE INTERFACE UTILISATEUR EN LIGNE SERA MISE EN PLACE POUR OFFRIR LE TEXTE PARALLÈLE À LA TRADUCTION VERBALE ET FRAGMENTAIRE, AINSI QU’À LA CORRESPONDANCE ET À L’AMÉLIORATION, ET PERMETTRE LA RECHERCHE D’INFORMATIONS SUR L’ÉTIQUETAGE ET L’ANNOTATION PAR DEVISE ET AVEC SOUPLESSE; ET (VII) NON SEULEMENT LES ÉTUDES LINGUISTIQUES DE L’ANGLAIS ANCIEN, MAIS AUSSI LES ÉTUDES LITTÉRAIRES ET CULTURELLES PARCE QUE L’ANALYSE ET LA TRADUCTION DES TEXTES PEUVENT SERVIR DE SOURCE OU DE RÉFÉRENCE POUR L’ÉTUDE DE CES DOMAINES. (French)
    4 December 2021
    0 references
    DAS ALLGEMEINE ZIEL DES PROJEKTS IST ES, EINEN PARALLELEN KORPUS DES ZEITGENÖSSISCHEN ALTEN ENGLISCHEN ZU SAMMELN, ZU ANALYSIEREN UND ZU VERBREITEN, MIT DEM SPRACHLICHE UND SPRACHLICHE STUDIEN DES KORPUS DURCHGEFÜHRT WERDEN. DER KORPUS WIRD IN SEINEM ANGELSÄCHSISCHEN TEIL MIT RUND 50.000 WÖRTERN REPRÄSENTATIVER PROSATEXTE GEGLÄNZT, LEMATISED, KOMMENTIERT UND GEKENNZEICHNET. DIE METHODIK DES PROJEKTS BERUHT AUF DER SAMMLUNG, SPEICHERUNG, ANALYSE UND VERBREITUNG DER TATSÄCHLICHEN SPRACHE MIT DATENBANKSOFTWARE; DIE KONZIPIERUNG UND UMSETZUNG DES KORPUS, DAS VON DEN SCHLUSSFOLGERUNGEN DER ERSTELLUNG EINES PILOTKORPUS GELEITET WIRD; MAXIMIERUNG DER AUTOMATISCHEN LEMATISIERUNG, KENNZEICHNUNG UND ANNOTATION; RÜCKMELDUNGEN VON MANUELLER KORPUSANALYSE ZU DATENBANKEN UND LEMATISER; UND DIE VERBREITUNG DER ERGEBNISSE IM OFFENEN ZUGANG. DAS PROJEKT ZIELT DARAUF AB, ZUR LINGUISTICA DE CORPUS BEIZUTRAGEN, DA ES NICHT ÜBLICH IST, DIACRONICOS AUSGERICHTETE KORPORA ZU SAMMELN, UND VOR ALLEM EINE AUF DEM ABGELEITETEN LEXIKON BERUHENDE ANGLEICHUNGSMETHODE VORGESCHLAGEN WIRD; II) DAS ENGLISCHE KORPUS, DA ES KEIN PARALLELES KORPUS LEMATISED UND GLÄNZENDES WORT FÜR WORT GIBT; III) ELEKTRONISCHE LEXIKOGRAPHIE, DA EINE METHODE ZUR FÜTTERUNG DES KORPUS AUF DER GRUNDLAGE VON WISSENSGRUNDLAGEN VORGESCHLAGEN WIRD; IV) DIE LEXIKOGRAPHIE DES ALTEN ENGLISCHEN, DA SIE FRAGEN DER ORTHOGRAFISCHEN UND FLEXIVEN VARIATIONEN BEHANDELT, DIE AUF ZEITLICHE, GEOGRAFISCHE UND TEXTLICHE VIELFALT, ASPEKTE DER STANDARDISIERUNG UND AUTOMATISCHE UND HALBAUTOMATISCHE LEMATIZACION ZURÜCKZUFÜHREN SIND; V) DAS INTERNET DER DRITTEN GENERATION IN ANBETRACHT DER TATSACHE, DASS DIE ERGEBNISSE DER SPRACHLICHEN ANALYSE MIT DATENBANK STRUKTURIERTE DATEN DARSTELLEN, MIT DER MÖGLICHKEIT, ALS VERKNÜPFTE DATEN DARGESTELLT ZU WERDEN; VI) DIE DIGITALEN GEISTESWISSENSCHAFTEN, WOBEI ZU BERÜCKSICHTIGEN IST, DASS EINE ONLINE-BENUTZEROBERFLÄCHE ENTWICKELT WIRD, DIE DEN PARALLELTEXT SOWOHL MIT WORT-FÜR-WORT- ALS AUCH FRAGMENT-ÜBERSETZUNG SOWIE KORRESPONDENZ UND VERBESSERUNG BIETET UND DIE SUCHE NACH KENNZEICHNUNGSINFORMATIONEN UND ANMERKUNGEN NACH MOTTO UND FLEXIBILITÄT ERMÖGLICHT; UND (VII) NICHT NUR LINGUISTISCHE STUDIEN DES ALTEN ENGLISCHEN, SONDERN AUCH LITERARISCHE UND KULTURELLE STUDIEN, WEIL DIE ANALYSE UND ÜBERSETZUNG VON TEXTEN ALS QUELLE ODER REFERENZ FÜR STUDIEN DIESER BEREICHE DIENEN KANN. (German)
    9 December 2021
    0 references
    Logroño
    0 references

    Identifiers

    FFI2017-83360-P
    0 references