PARALLEL CORPUS OF ANCIENT ENGLISH PROSE. LABELLING, ANNOTATION AND RELATED LINGUISTIC STUDIES (Q3187875)
Jump to navigation
Jump to search
Project Q3187875 in Spain
Language | Label | Description | Also known as |
---|---|---|---|
English | PARALLEL CORPUS OF ANCIENT ENGLISH PROSE. LABELLING, ANNOTATION AND RELATED LINGUISTIC STUDIES |
Project Q3187875 in Spain |
Statements
27,225.0 Euro
0 references
54,450.0 Euro
0 references
50.0 percent
0 references
1 January 2018
0 references
31 December 2020
0 references
UNIVERSIDAD DE LA RIOJA
0 references
26089
0 references
EL OBJETIVO GENERAL DEL PROYECTO ES RECOPILAR, ANALIZAR Y DIFUNDIR UN CORPUS PARALELO Y ALINEADO INGLES ANTIGUO-INGLES CONTEMPORANEO CON EL QUE LLEVAR A CABO ESTUDIOS LINGUISTICOS Y DE LINGUISTICA DE CORPUS. EL CORPUS ESTA GLOSADO, LEMATIZADO, ANOTADO Y ETIQUETADO EN SU PARTE ANGLOSAJONA, QUE COMPRENDE UNAS 50.000 PALABRAS DE TEXTOS EN PROSA REPRESENTATIVOS. LA METODOLOGIA DEL PROYECTO ESTA BASADA EN LA RECOPILACION, ALMACENAMIENTO, ANALISIS Y DIFUSION DEL LENGUAJE REAL CON SOFTWARE DE BASE DE DATOS; EL DISEÑO Y LA IMPLEMENTACION DEL CORPUS GUIADOS POR LAS CONCLUSIONES DE LA RECOPILACION DE UN CORPUS PILOTO; LA MAXIMIZACION DE LA LEMATIZACION, EL ETIQUETADO Y LA ANOTACION AUTOMATICAS; LA RETROALIMENTACION DEL ANALISIS MANUAL DEL CORPUS A LAS BASES DE DATOS Y EL LEMATIZADOR; Y LA DIFUSION DE LOS RESULTADOS EN OPEN ACCESS. EL PROYECTO PRETENDE CONTRIBUIR A LA LINGUISTICA DE CORPUS, YA QUE NO ES HABITUAL RECOPILAR CORPORA DIACRONICOS ALINEADOS Y, SOBRE TODO, SE PROPONE UN METODO DE ALINEAMIENTO BASADO EN EL LEXICO DERIVADO; (II) LA LINGUISTICA DE CORPUS DEL INGLES, PUESTO QUE NO EXISTE UN CORPUS PARALELO LEMATIZADO Y GLOSADO PALABRA POR PALABRA; (III) LA LEXICOGRAFIA ELECTRONICA, PORQUE SE PROPONE UN METODO DE ALIMENTACION DEL CORPUS A PARTIR DE BASES DE CONOCIMIENTO; (IV) LA LEXICOGRAFIA DEL INGLES ANTIGUO, YA QUE SE ABORDAN CUESTIONES DE CUESTIONES DE VARIACION ORTOGRAFICA Y FLEXIVA ATRIBUIBLE A LA DIVERSIDAD TEMPORAL, GEOGRAFICA Y DE TRANSMISION TEXTUAL, ASPECTOS DE NORMALIZACION Y LEMATIZACION AUTOMATICA Y SEMIAUTOMATICA; (V) EL INTERNET DE TERCERA GENERACION, CONSIDERANDO QUE LOS RESULTADOS DEL ANALISIS LINGUISTICO CON BASE DE DATOS CONSTITUYEN DATOS ESTRUCTURADOS, CON POSIBILIDAD DE SER PRESENTADOS COMO DATOS ENLAZADOS; (VI) LAS HUMANIDADES DIGITALES, TENIENDO EN CUENTA QUE SE VA A ELABORAR UN INTERFAZ DE USUARIO ONLINE QUE OFREZCA EL TEXTO PARALELO TANTO CON GLOSA PALABRA POR PALABRA COMO CON TRADUCCION POR FRAGMENTO, ASI COMO LA CORRESPONDENCIA Y EL REALCE, Y PERMITA LA BUSQUEDA DE LA INFORMACION DEL ETIQUETADO Y LA ANOTACION POR LEMA Y POR FORMA FLEXIVA; Y (VII) NO SOLO LOS ESTUDIOS LINGUISTICOS DEL INGLES ANTIGUO, SINO TAMBIEN LOS LITERARIOS Y CULTURALES PORQUE EL ANALISIS Y LA TRADUCCION DE LOS TEXTOS PUEDE SERVIR DE FUENTE O REFERENCIA PARA ESTUDIOS DE ESTOS AMBITOS. (Spanish)
0 references
THE AIM OF THIS PROJECT IS TO COMPILE, ANALISE AND OFFER A PARALLEL CORPUS OLD ENGLISH-CONTEMPORARY ENGLISH, ALIGNED AT WORD LEVEL, ON THE BASIS OF WHICH STUDIES IN OLD ENGILSH LINGUISTICS AND CORPUS LINGUISTICS CAN BE CONDUCTED. THE CORPUS SHALL BE GLOSSED, LEMMATISED, TAGGED AND ANNOTATED IN ITS ANGLO-SAXON SEGMENT, WHICH COMPRISES AROUND 50,000 WORDS FROM REPRESENTATIVE PROSE TEXTS. THE METHODOLOGY OF RESEARCH IS BASED ON THE GATHERING, STORAGE, ANALYSIS AND DISSEMINATION OF REAL LANGUAGE WITH DATABASE SOFTWARE; THE DESIGN AND IMPLEMENTATION GUIDED BY THE CONCLUSIONS REACHED AFTER THE CREATION OF A PILOT CORPUS; THE MAXIMISATION OF AUTOMATIC LEMMATISATION, TAGGING AND ANNOTATION; THE FEEDBACK OF THE DATABASES AND THE LEMMATISER WITH THE INFORMATION GATHERED WITH MANUAL ANALYSIS; AND THE DISSEMINATION OF RESULTS IN OPEN ACCESS. THUS DESCRIBED, THE PROJECT INTENDS TO CONTRIBUTE TO CORPUS LINGUISTICS, GIVEN THAT AN ALIGNMENT METHOD BASED ON THE DERIVED LEXICON IS PROPOSED; ENGLISH CORPUS LINGUISTICS, BECAUSE NO CORPUS OF THIS LANGUAGE IS AVAILABLE THAT CONTAINS LEMMAS, GLOSSES AND WORD BY WORD ALIGNMENT; ELECTRONIC LEXICOGRAPHY, SINCE A METHOD FOR FEEDING PARALLEL CORPORA WITH KNOWLEDGE BASES IS DEVELOPED; OLD ENGLISH LEXICOGRAPHY, BECAUSE QUESTIONS ARE ADDRESSED THAT HAVE TO DO WITH SPELLING AND MORPHOLOGICAL VARIATION ATTRIBUTABLE TO THE TIME SPAN, NORMALISATION AS WELL AS AUTOMATIC AND SEMI-AUTOMATIC LEMMATISATION; THIRD GENERATION INTERNET, GIVEN THAT THE RESULTS OF LINGUISTIC ANALYSIS WITH DATA BASES REPRESENT STRUCTURED DATA THAT, MOREOVER, CAN BE PRESENTED AS LINKED DATA; DIGITAL HUMANITIES, ONCE THE ONLINE USER INTERFACE OFFERS THE PARALLEL TEXT, THE WORD BY WORD GLOSS, THE TRANSLATION, THE ALIGNMENT AND THE HIGHLIGHTING, AND ALLOWS SEARCHES FOR TAGGING AND ANNOTATION BY LEMMA AND INFLECTIONAL FORM; AND OLD ENGLISH, INCLUDING NOT ONLY LINGUISTICS, BUT ALSO LITERATURE AND CULTURAL STUDIES, GIVEN THAT THE TEXTS AND THEIR TRANSLATIONS CAN BE USED FOR SOURCES FOR VARIOUS FIELDS AND APPROACHES. (English)
0 references
L’OBJECTIF GÉNÉRAL DU PROJET EST DE COLLECTER, D’ANALYSER ET DE DIFFUSER UN CORPUS PARALLÈLE D’ANGLAIS ANCIEN CONTEMPORAIN AVEC LEQUEL DES ÉTUDES LINGUISTIQUES ET LINGUISTIQUES DU CORPUS SONT MENÉES. LE CORPUS EST BRILLANT, LEMATISED, ANNOTÉ ET ÉTIQUETÉ DANS SA PARTIE ANGLO-SAXONNE, COMPRENANT ENVIRON 50 000 MOTS DE TEXTES DE PROSE REPRÉSENTATIFS. LA MÉTHODOLOGIE DU PROJET REPOSE SUR LA COLLECTE, LE STOCKAGE, L’ANALYSE ET LA DIFFUSION DE LA LANGUE RÉELLE AU MOYEN D’UN LOGICIEL DE BASE DE DONNÉES; LA CONCEPTION ET LA MISE EN ŒUVRE DU CORPUS SUR LA BASE DES CONCLUSIONS DE LA COMPILATION D’UN CORPUS PILOTE; MAXIMISATION DE LA LEMATISATION AUTOMATIQUE, DE L’ÉTIQUETAGE ET DE L’ANNOTATION; RETOUR D’INFORMATIONS PROVENANT DE L’ANALYSE MANUELLE DES CORPUS AUX BASES DE DONNÉES ET À LEMATISER; ET LA DIFFUSION DES RÉSULTATS EN LIBRE ACCÈS. LE PROJET VISE À CONTRIBUER À LA LINGUISTICA DE CORPUS, CAR IL N’EST PAS HABITUEL DE COLLECTER LES CORPORA ALIGNÉS DIACRONICOS ET, SURTOUT, UNE MÉTHODE D’ALIGNEMENT BASÉE SUR LE LEXIQUE DÉRIVÉ EST PROPOSÉE; II) LE CORPUS DE LANGUE ANGLAISE, PUISQU’IL N’EXISTE PAS DE CORPUS PARALLÈLE LEMATISED ET GLOSSED MOT POUR MOT; III) LA LEXICOGRAPHIE ÉLECTRONIQUE, PARCE QU’UNE MÉTHODE D’ALIMENTATION DU CORPUS EST PROPOSÉE À PARTIR DE BASES DE CONNAISSANCES; IV) LA LEXICOGRAPHIE DE L’ANCIEN ANGLAIS, DANS LA MESURE OÙ ELLE ABORDE DES QUESTIONS DE VARIATIONS ORTHOGRAPHIQUES ET FLEXIVES ATTRIBUABLES À LA DIVERSITÉ TEMPORELLE, GÉOGRAPHIQUE ET TEXTUELLE, AUX ASPECTS DE LA NORMALISATION ET À LA LEMATIZACION AUTOMATIQUE ET SEMI-AUTOMATIQUE; (V) L’INTERNET DE TROISIÈME GÉNÉRATION, CONSIDÉRANT QUE LES RÉSULTATS DE L’ANALYSE LINGUISTIQUE AVEC BASE DE DONNÉES CONSTITUENT DES DONNÉES STRUCTURÉES, AVEC LA POSSIBILITÉ D’ÊTRE PRÉSENTÉS COMME DES DONNÉES LIÉES; VI) LES SCIENCES HUMAINES NUMÉRIQUES, EN TENANT COMPTE DU FAIT QU’UNE INTERFACE UTILISATEUR EN LIGNE SERA MISE EN PLACE POUR OFFRIR LE TEXTE PARALLÈLE À LA TRADUCTION VERBALE ET FRAGMENTAIRE, AINSI QU’À LA CORRESPONDANCE ET À L’AMÉLIORATION, ET PERMETTRE LA RECHERCHE D’INFORMATIONS SUR L’ÉTIQUETAGE ET L’ANNOTATION PAR DEVISE ET AVEC SOUPLESSE; ET (VII) NON SEULEMENT LES ÉTUDES LINGUISTIQUES DE L’ANGLAIS ANCIEN, MAIS AUSSI LES ÉTUDES LITTÉRAIRES ET CULTURELLES PARCE QUE L’ANALYSE ET LA TRADUCTION DES TEXTES PEUVENT SERVIR DE SOURCE OU DE RÉFÉRENCE POUR L’ÉTUDE DE CES DOMAINES. (French)
4 December 2021
0 references
Logroño
0 references
Identifiers
FFI2017-83360-P
0 references