PARALLEL CORPUS OF ANCIENT ENGLISH PROSE. LABELLING, ANNOTATION AND RELATED LINGUISTIC STUDIES (Q3187875)
Jump to navigation
Jump to search
Project Q3187875 in Spain
Language | Label | Description | Also known as |
---|---|---|---|
English | PARALLEL CORPUS OF ANCIENT ENGLISH PROSE. LABELLING, ANNOTATION AND RELATED LINGUISTIC STUDIES |
Project Q3187875 in Spain |
Statements
27,225.0 Euro
0 references
54,450.0 Euro
0 references
50.0 percent
0 references
1 January 2018
0 references
31 December 2020
0 references
UNIVERSIDAD DE LA RIOJA
0 references
26089
0 references
EL OBJETIVO GENERAL DEL PROYECTO ES RECOPILAR, ANALIZAR Y DIFUNDIR UN CORPUS PARALELO Y ALINEADO INGLES ANTIGUO-INGLES CONTEMPORANEO CON EL QUE LLEVAR A CABO ESTUDIOS LINGUISTICOS Y DE LINGUISTICA DE CORPUS. EL CORPUS ESTA GLOSADO, LEMATIZADO, ANOTADO Y ETIQUETADO EN SU PARTE ANGLOSAJONA, QUE COMPRENDE UNAS 50.000 PALABRAS DE TEXTOS EN PROSA REPRESENTATIVOS. LA METODOLOGIA DEL PROYECTO ESTA BASADA EN LA RECOPILACION, ALMACENAMIENTO, ANALISIS Y DIFUSION DEL LENGUAJE REAL CON SOFTWARE DE BASE DE DATOS; EL DISEÑO Y LA IMPLEMENTACION DEL CORPUS GUIADOS POR LAS CONCLUSIONES DE LA RECOPILACION DE UN CORPUS PILOTO; LA MAXIMIZACION DE LA LEMATIZACION, EL ETIQUETADO Y LA ANOTACION AUTOMATICAS; LA RETROALIMENTACION DEL ANALISIS MANUAL DEL CORPUS A LAS BASES DE DATOS Y EL LEMATIZADOR; Y LA DIFUSION DE LOS RESULTADOS EN OPEN ACCESS. EL PROYECTO PRETENDE CONTRIBUIR A LA LINGUISTICA DE CORPUS, YA QUE NO ES HABITUAL RECOPILAR CORPORA DIACRONICOS ALINEADOS Y, SOBRE TODO, SE PROPONE UN METODO DE ALINEAMIENTO BASADO EN EL LEXICO DERIVADO; (II) LA LINGUISTICA DE CORPUS DEL INGLES, PUESTO QUE NO EXISTE UN CORPUS PARALELO LEMATIZADO Y GLOSADO PALABRA POR PALABRA; (III) LA LEXICOGRAFIA ELECTRONICA, PORQUE SE PROPONE UN METODO DE ALIMENTACION DEL CORPUS A PARTIR DE BASES DE CONOCIMIENTO; (IV) LA LEXICOGRAFIA DEL INGLES ANTIGUO, YA QUE SE ABORDAN CUESTIONES DE CUESTIONES DE VARIACION ORTOGRAFICA Y FLEXIVA ATRIBUIBLE A LA DIVERSIDAD TEMPORAL, GEOGRAFICA Y DE TRANSMISION TEXTUAL, ASPECTOS DE NORMALIZACION Y LEMATIZACION AUTOMATICA Y SEMIAUTOMATICA; (V) EL INTERNET DE TERCERA GENERACION, CONSIDERANDO QUE LOS RESULTADOS DEL ANALISIS LINGUISTICO CON BASE DE DATOS CONSTITUYEN DATOS ESTRUCTURADOS, CON POSIBILIDAD DE SER PRESENTADOS COMO DATOS ENLAZADOS; (VI) LAS HUMANIDADES DIGITALES, TENIENDO EN CUENTA QUE SE VA A ELABORAR UN INTERFAZ DE USUARIO ONLINE QUE OFREZCA EL TEXTO PARALELO TANTO CON GLOSA PALABRA POR PALABRA COMO CON TRADUCCION POR FRAGMENTO, ASI COMO LA CORRESPONDENCIA Y EL REALCE, Y PERMITA LA BUSQUEDA DE LA INFORMACION DEL ETIQUETADO Y LA ANOTACION POR LEMA Y POR FORMA FLEXIVA; Y (VII) NO SOLO LOS ESTUDIOS LINGUISTICOS DEL INGLES ANTIGUO, SINO TAMBIEN LOS LITERARIOS Y CULTURALES PORQUE EL ANALISIS Y LA TRADUCCION DE LOS TEXTOS PUEDE SERVIR DE FUENTE O REFERENCIA PARA ESTUDIOS DE ESTOS AMBITOS. (Spanish)
0 references
THE AIM OF THIS PROJECT IS TO COMPILE, ANALISE AND OFFER A PARALLEL CORPUS OLD ENGLISH-CONTEMPORARY ENGLISH, ALIGNED AT WORD LEVEL, ON THE BASIS OF WHICH STUDIES IN OLD ENGILSH LINGUISTICS AND CORPUS LINGUISTICS CAN BE CONDUCTED. THE CORPUS SHALL BE GLOSSED, LEMMATISED, TAGGED AND ANNOTATED IN ITS ANGLO-SAXON SEGMENT, WHICH COMPRISES AROUND 50,000 WORDS FROM REPRESENTATIVE PROSE TEXTS. THE METHODOLOGY OF RESEARCH IS BASED ON THE GATHERING, STORAGE, ANALYSIS AND DISSEMINATION OF REAL LANGUAGE WITH DATABASE SOFTWARE; THE DESIGN AND IMPLEMENTATION GUIDED BY THE CONCLUSIONS REACHED AFTER THE CREATION OF A PILOT CORPUS; THE MAXIMISATION OF AUTOMATIC LEMMATISATION, TAGGING AND ANNOTATION; THE FEEDBACK OF THE DATABASES AND THE LEMMATISER WITH THE INFORMATION GATHERED WITH MANUAL ANALYSIS; AND THE DISSEMINATION OF RESULTS IN OPEN ACCESS. THUS DESCRIBED, THE PROJECT INTENDS TO CONTRIBUTE TO CORPUS LINGUISTICS, GIVEN THAT AN ALIGNMENT METHOD BASED ON THE DERIVED LEXICON IS PROPOSED; ENGLISH CORPUS LINGUISTICS, BECAUSE NO CORPUS OF THIS LANGUAGE IS AVAILABLE THAT CONTAINS LEMMAS, GLOSSES AND WORD BY WORD ALIGNMENT; ELECTRONIC LEXICOGRAPHY, SINCE A METHOD FOR FEEDING PARALLEL CORPORA WITH KNOWLEDGE BASES IS DEVELOPED; OLD ENGLISH LEXICOGRAPHY, BECAUSE QUESTIONS ARE ADDRESSED THAT HAVE TO DO WITH SPELLING AND MORPHOLOGICAL VARIATION ATTRIBUTABLE TO THE TIME SPAN, NORMALISATION AS WELL AS AUTOMATIC AND SEMI-AUTOMATIC LEMMATISATION; THIRD GENERATION INTERNET, GIVEN THAT THE RESULTS OF LINGUISTIC ANALYSIS WITH DATA BASES REPRESENT STRUCTURED DATA THAT, MOREOVER, CAN BE PRESENTED AS LINKED DATA; DIGITAL HUMANITIES, ONCE THE ONLINE USER INTERFACE OFFERS THE PARALLEL TEXT, THE WORD BY WORD GLOSS, THE TRANSLATION, THE ALIGNMENT AND THE HIGHLIGHTING, AND ALLOWS SEARCHES FOR TAGGING AND ANNOTATION BY LEMMA AND INFLECTIONAL FORM; AND OLD ENGLISH, INCLUDING NOT ONLY LINGUISTICS, BUT ALSO LITERATURE AND CULTURAL STUDIES, GIVEN THAT THE TEXTS AND THEIR TRANSLATIONS CAN BE USED FOR SOURCES FOR VARIOUS FIELDS AND APPROACHES. (English)
0 references
Logroño
0 references
Identifiers
FFI2017-83360-P
0 references