PARALLEL CORPUS OF ANCIENT ENGLISH PROSE. LABELLING, ANNOTATION AND RELATED LINGUISTIC STUDIES (Q3187875): Difference between revisions
Jump to navigation
Jump to search
(Changed label, description and/or aliases in nl, and other parts: Adding Dutch translations) |
(Changed label, description and/or aliases in it, and other parts: Adding Italian translations) |
||||||||||||||
label / it | label / it | ||||||||||||||
CORPUS PARALLELO DI ANTICA PROSA INGLESE. ETICHETTATURA, ANNOTAZIONE E STUDI LINGUISTICI CORRELATI | |||||||||||||||
Property / summary | |||||||||||||||
L'OBIETTIVO GENERALE DEL PROGETTO È QUELLO DI RACCOGLIERE, ANALIZZARE E DIFFONDERE UN CORPUS PARALLELO DI ANTICO INGLESE CONTEMPORANEO CON IL QUALE EFFETTUARE STUDI LINGUISTICI E LINGUISTICI DI CORPUS. IL CORPUS È LUCIDO, LEMATIZZATO, ANNOTATO ED ETICHETTATO NELLA SUA PARTE ANGLOSASSONE, CHE COMPRENDE CIRCA 50.000 PAROLE DI TESTI IN PROSA RAPPRESENTATIVI. LA METODOLOGIA DEL PROGETTO SI BASA SULLA RACCOLTA, L'ARCHIVIAZIONE, L'ANALISI E LA DIFFUSIONE DEL LINGUAGGIO REALE CON IL SOFTWARE DELLA BANCA DATI; LA PROGETTAZIONE E L'ATTUAZIONE DEL CORPUS GUIDATO DALLE CONCLUSIONI DELLA COMPILAZIONE DI UN CORPUS PILOTA; MASSIMIZZAZIONE DELLA LEMATIZZAZIONE AUTOMATICA, ETICHETTATURA E ANNOTAZIONE; FEEDBACK DALL'ANALISI MANUALE DEL CORPUS ALLE BANCHE DATI E AL LEMATISER; E LA DIFFUSIONE DEI RISULTATI IN UN ACCESSO APERTO. IL PROGETTO MIRA A CONTRIBUIRE ALLA LINGUISTICA DE CORPUS, IN QUANTO NON È CONSUETUDINE RACCOGLIERE CORPI ALLINEATI DIACRONICOS E, SOPRATTUTTO, SI PROPONE UN METODO DI ALLINEAMENTO BASATO SUL LESSICO DERIVATO; II) IL CORPUS IN LINGUA INGLESE, IN QUANTO NON ESISTE UN CORPUS PARALLELO LEMATISED E GLOSSED WORD FOR WORD; III) LA LESSICOGRAFIA ELETTRONICA, IN QUANTO VIENE PROPOSTO UN METODO DI ALIMENTAZIONE DEL CORPUS BASATO SU BASI DI CONOSCENZA; IV) LA LESSICOGRAFIA DEL VECCHIO INGLESE, TRATTANDOSI DI QUESTIONI DI VARIAZIONE ORTOGRAFICA E FLESSIVA ATTRIBUIBILI ALLA DIVERSITÀ TEMPORALE, GEOGRAFICA E TESTUALE, AGLI ASPETTI DELLA STANDARDIZZAZIONE E ALLA LEMATIZACION AUTOMATICA E SEMIAUTOMATICA; (V) INTERNET DI TERZA GENERAZIONE, CONSIDERANDO CHE I RISULTATI DELL'ANALISI LINGUISTICA CON BANCA DATI COSTITUISCONO DATI STRUTTURATI, CON LA POSSIBILITÀ DI ESSERE PRESENTATI COME DATI COLLEGATI; (VI) LE DISCIPLINE UMANISTICHE DIGITALI, TENENDO CONTO DEL FATTO CHE SARÀ SVILUPPATA UN'INTERFACCIA UTENTE ONLINE CHE OFFRA IL TESTO PARALLELO CON LA TRADUZIONE PAROLA PER PAROLA E FRAMMENTARIA, NONCHÉ LA CORRISPONDENZA E IL MIGLIORAMENTO, E CONSENTA LA RICERCA DI INFORMAZIONI SULL'ETICHETTATURA E L'ANNOTAZIONE PER MOTTO E IN MODO FLESSIBILE; E (VII) NON SOLO GLI STUDI LINGUISTICI DELL'INGLESE ANTICO, MA ANCHE GLI STUDI LETTERARI E CULTURALI PERCHÉ L'ANALISI E LA TRADUZIONE DEI TESTI POSSONO SERVIRE DA FONTE O RIFERIMENTO PER GLI STUDI DI QUESTI CAMPI. (Italian) | |||||||||||||||
Property / summary: L'OBIETTIVO GENERALE DEL PROGETTO È QUELLO DI RACCOGLIERE, ANALIZZARE E DIFFONDERE UN CORPUS PARALLELO DI ANTICO INGLESE CONTEMPORANEO CON IL QUALE EFFETTUARE STUDI LINGUISTICI E LINGUISTICI DI CORPUS. IL CORPUS È LUCIDO, LEMATIZZATO, ANNOTATO ED ETICHETTATO NELLA SUA PARTE ANGLOSASSONE, CHE COMPRENDE CIRCA 50.000 PAROLE DI TESTI IN PROSA RAPPRESENTATIVI. LA METODOLOGIA DEL PROGETTO SI BASA SULLA RACCOLTA, L'ARCHIVIAZIONE, L'ANALISI E LA DIFFUSIONE DEL LINGUAGGIO REALE CON IL SOFTWARE DELLA BANCA DATI; LA PROGETTAZIONE E L'ATTUAZIONE DEL CORPUS GUIDATO DALLE CONCLUSIONI DELLA COMPILAZIONE DI UN CORPUS PILOTA; MASSIMIZZAZIONE DELLA LEMATIZZAZIONE AUTOMATICA, ETICHETTATURA E ANNOTAZIONE; FEEDBACK DALL'ANALISI MANUALE DEL CORPUS ALLE BANCHE DATI E AL LEMATISER; E LA DIFFUSIONE DEI RISULTATI IN UN ACCESSO APERTO. IL PROGETTO MIRA A CONTRIBUIRE ALLA LINGUISTICA DE CORPUS, IN QUANTO NON È CONSUETUDINE RACCOGLIERE CORPI ALLINEATI DIACRONICOS E, SOPRATTUTTO, SI PROPONE UN METODO DI ALLINEAMENTO BASATO SUL LESSICO DERIVATO; II) IL CORPUS IN LINGUA INGLESE, IN QUANTO NON ESISTE UN CORPUS PARALLELO LEMATISED E GLOSSED WORD FOR WORD; III) LA LESSICOGRAFIA ELETTRONICA, IN QUANTO VIENE PROPOSTO UN METODO DI ALIMENTAZIONE DEL CORPUS BASATO SU BASI DI CONOSCENZA; IV) LA LESSICOGRAFIA DEL VECCHIO INGLESE, TRATTANDOSI DI QUESTIONI DI VARIAZIONE ORTOGRAFICA E FLESSIVA ATTRIBUIBILI ALLA DIVERSITÀ TEMPORALE, GEOGRAFICA E TESTUALE, AGLI ASPETTI DELLA STANDARDIZZAZIONE E ALLA LEMATIZACION AUTOMATICA E SEMIAUTOMATICA; (V) INTERNET DI TERZA GENERAZIONE, CONSIDERANDO CHE I RISULTATI DELL'ANALISI LINGUISTICA CON BANCA DATI COSTITUISCONO DATI STRUTTURATI, CON LA POSSIBILITÀ DI ESSERE PRESENTATI COME DATI COLLEGATI; (VI) LE DISCIPLINE UMANISTICHE DIGITALI, TENENDO CONTO DEL FATTO CHE SARÀ SVILUPPATA UN'INTERFACCIA UTENTE ONLINE CHE OFFRA IL TESTO PARALLELO CON LA TRADUZIONE PAROLA PER PAROLA E FRAMMENTARIA, NONCHÉ LA CORRISPONDENZA E IL MIGLIORAMENTO, E CONSENTA LA RICERCA DI INFORMAZIONI SULL'ETICHETTATURA E L'ANNOTAZIONE PER MOTTO E IN MODO FLESSIBILE; E (VII) NON SOLO GLI STUDI LINGUISTICI DELL'INGLESE ANTICO, MA ANCHE GLI STUDI LETTERARI E CULTURALI PERCHÉ L'ANALISI E LA TRADUZIONE DEI TESTI POSSONO SERVIRE DA FONTE O RIFERIMENTO PER GLI STUDI DI QUESTI CAMPI. (Italian) / rank | |||||||||||||||
Normal rank | |||||||||||||||
Property / summary: L'OBIETTIVO GENERALE DEL PROGETTO È QUELLO DI RACCOGLIERE, ANALIZZARE E DIFFONDERE UN CORPUS PARALLELO DI ANTICO INGLESE CONTEMPORANEO CON IL QUALE EFFETTUARE STUDI LINGUISTICI E LINGUISTICI DI CORPUS. IL CORPUS È LUCIDO, LEMATIZZATO, ANNOTATO ED ETICHETTATO NELLA SUA PARTE ANGLOSASSONE, CHE COMPRENDE CIRCA 50.000 PAROLE DI TESTI IN PROSA RAPPRESENTATIVI. LA METODOLOGIA DEL PROGETTO SI BASA SULLA RACCOLTA, L'ARCHIVIAZIONE, L'ANALISI E LA DIFFUSIONE DEL LINGUAGGIO REALE CON IL SOFTWARE DELLA BANCA DATI; LA PROGETTAZIONE E L'ATTUAZIONE DEL CORPUS GUIDATO DALLE CONCLUSIONI DELLA COMPILAZIONE DI UN CORPUS PILOTA; MASSIMIZZAZIONE DELLA LEMATIZZAZIONE AUTOMATICA, ETICHETTATURA E ANNOTAZIONE; FEEDBACK DALL'ANALISI MANUALE DEL CORPUS ALLE BANCHE DATI E AL LEMATISER; E LA DIFFUSIONE DEI RISULTATI IN UN ACCESSO APERTO. IL PROGETTO MIRA A CONTRIBUIRE ALLA LINGUISTICA DE CORPUS, IN QUANTO NON È CONSUETUDINE RACCOGLIERE CORPI ALLINEATI DIACRONICOS E, SOPRATTUTTO, SI PROPONE UN METODO DI ALLINEAMENTO BASATO SUL LESSICO DERIVATO; II) IL CORPUS IN LINGUA INGLESE, IN QUANTO NON ESISTE UN CORPUS PARALLELO LEMATISED E GLOSSED WORD FOR WORD; III) LA LESSICOGRAFIA ELETTRONICA, IN QUANTO VIENE PROPOSTO UN METODO DI ALIMENTAZIONE DEL CORPUS BASATO SU BASI DI CONOSCENZA; IV) LA LESSICOGRAFIA DEL VECCHIO INGLESE, TRATTANDOSI DI QUESTIONI DI VARIAZIONE ORTOGRAFICA E FLESSIVA ATTRIBUIBILI ALLA DIVERSITÀ TEMPORALE, GEOGRAFICA E TESTUALE, AGLI ASPETTI DELLA STANDARDIZZAZIONE E ALLA LEMATIZACION AUTOMATICA E SEMIAUTOMATICA; (V) INTERNET DI TERZA GENERAZIONE, CONSIDERANDO CHE I RISULTATI DELL'ANALISI LINGUISTICA CON BANCA DATI COSTITUISCONO DATI STRUTTURATI, CON LA POSSIBILITÀ DI ESSERE PRESENTATI COME DATI COLLEGATI; (VI) LE DISCIPLINE UMANISTICHE DIGITALI, TENENDO CONTO DEL FATTO CHE SARÀ SVILUPPATA UN'INTERFACCIA UTENTE ONLINE CHE OFFRA IL TESTO PARALLELO CON LA TRADUZIONE PAROLA PER PAROLA E FRAMMENTARIA, NONCHÉ LA CORRISPONDENZA E IL MIGLIORAMENTO, E CONSENTA LA RICERCA DI INFORMAZIONI SULL'ETICHETTATURA E L'ANNOTAZIONE PER MOTTO E IN MODO FLESSIBILE; E (VII) NON SOLO GLI STUDI LINGUISTICI DELL'INGLESE ANTICO, MA ANCHE GLI STUDI LETTERARI E CULTURALI PERCHÉ L'ANALISI E LA TRADUZIONE DEI TESTI POSSONO SERVIRE DA FONTE O RIFERIMENTO PER GLI STUDI DI QUESTI CAMPI. (Italian) / qualifier | |||||||||||||||
point in time: 16 January 2022
|
Revision as of 15:37, 16 January 2022
Project Q3187875 in Spain
Language | Label | Description | Also known as |
---|---|---|---|
English | PARALLEL CORPUS OF ANCIENT ENGLISH PROSE. LABELLING, ANNOTATION AND RELATED LINGUISTIC STUDIES |
Project Q3187875 in Spain |
Statements
27,225.0 Euro
0 references
54,450.0 Euro
0 references
50.0 percent
0 references
1 January 2018
0 references
31 December 2020
0 references
UNIVERSIDAD DE LA RIOJA
0 references
26089
0 references
EL OBJETIVO GENERAL DEL PROYECTO ES RECOPILAR, ANALIZAR Y DIFUNDIR UN CORPUS PARALELO Y ALINEADO INGLES ANTIGUO-INGLES CONTEMPORANEO CON EL QUE LLEVAR A CABO ESTUDIOS LINGUISTICOS Y DE LINGUISTICA DE CORPUS. EL CORPUS ESTA GLOSADO, LEMATIZADO, ANOTADO Y ETIQUETADO EN SU PARTE ANGLOSAJONA, QUE COMPRENDE UNAS 50.000 PALABRAS DE TEXTOS EN PROSA REPRESENTATIVOS. LA METODOLOGIA DEL PROYECTO ESTA BASADA EN LA RECOPILACION, ALMACENAMIENTO, ANALISIS Y DIFUSION DEL LENGUAJE REAL CON SOFTWARE DE BASE DE DATOS; EL DISEÑO Y LA IMPLEMENTACION DEL CORPUS GUIADOS POR LAS CONCLUSIONES DE LA RECOPILACION DE UN CORPUS PILOTO; LA MAXIMIZACION DE LA LEMATIZACION, EL ETIQUETADO Y LA ANOTACION AUTOMATICAS; LA RETROALIMENTACION DEL ANALISIS MANUAL DEL CORPUS A LAS BASES DE DATOS Y EL LEMATIZADOR; Y LA DIFUSION DE LOS RESULTADOS EN OPEN ACCESS. EL PROYECTO PRETENDE CONTRIBUIR A LA LINGUISTICA DE CORPUS, YA QUE NO ES HABITUAL RECOPILAR CORPORA DIACRONICOS ALINEADOS Y, SOBRE TODO, SE PROPONE UN METODO DE ALINEAMIENTO BASADO EN EL LEXICO DERIVADO; (II) LA LINGUISTICA DE CORPUS DEL INGLES, PUESTO QUE NO EXISTE UN CORPUS PARALELO LEMATIZADO Y GLOSADO PALABRA POR PALABRA; (III) LA LEXICOGRAFIA ELECTRONICA, PORQUE SE PROPONE UN METODO DE ALIMENTACION DEL CORPUS A PARTIR DE BASES DE CONOCIMIENTO; (IV) LA LEXICOGRAFIA DEL INGLES ANTIGUO, YA QUE SE ABORDAN CUESTIONES DE CUESTIONES DE VARIACION ORTOGRAFICA Y FLEXIVA ATRIBUIBLE A LA DIVERSIDAD TEMPORAL, GEOGRAFICA Y DE TRANSMISION TEXTUAL, ASPECTOS DE NORMALIZACION Y LEMATIZACION AUTOMATICA Y SEMIAUTOMATICA; (V) EL INTERNET DE TERCERA GENERACION, CONSIDERANDO QUE LOS RESULTADOS DEL ANALISIS LINGUISTICO CON BASE DE DATOS CONSTITUYEN DATOS ESTRUCTURADOS, CON POSIBILIDAD DE SER PRESENTADOS COMO DATOS ENLAZADOS; (VI) LAS HUMANIDADES DIGITALES, TENIENDO EN CUENTA QUE SE VA A ELABORAR UN INTERFAZ DE USUARIO ONLINE QUE OFREZCA EL TEXTO PARALELO TANTO CON GLOSA PALABRA POR PALABRA COMO CON TRADUCCION POR FRAGMENTO, ASI COMO LA CORRESPONDENCIA Y EL REALCE, Y PERMITA LA BUSQUEDA DE LA INFORMACION DEL ETIQUETADO Y LA ANOTACION POR LEMA Y POR FORMA FLEXIVA; Y (VII) NO SOLO LOS ESTUDIOS LINGUISTICOS DEL INGLES ANTIGUO, SINO TAMBIEN LOS LITERARIOS Y CULTURALES PORQUE EL ANALISIS Y LA TRADUCCION DE LOS TEXTOS PUEDE SERVIR DE FUENTE O REFERENCIA PARA ESTUDIOS DE ESTOS AMBITOS. (Spanish)
0 references
THE AIM OF THIS PROJECT IS TO COMPILE, ANALISE AND OFFER A PARALLEL CORPUS OLD ENGLISH-CONTEMPORARY ENGLISH, ALIGNED AT WORD LEVEL, ON THE BASIS OF WHICH STUDIES IN OLD ENGILSH LINGUISTICS AND CORPUS LINGUISTICS CAN BE CONDUCTED. THE CORPUS SHALL BE GLOSSED, LEMMATISED, TAGGED AND ANNOTATED IN ITS ANGLO-SAXON SEGMENT, WHICH COMPRISES AROUND 50,000 WORDS FROM REPRESENTATIVE PROSE TEXTS. THE METHODOLOGY OF RESEARCH IS BASED ON THE GATHERING, STORAGE, ANALYSIS AND DISSEMINATION OF REAL LANGUAGE WITH DATABASE SOFTWARE; THE DESIGN AND IMPLEMENTATION GUIDED BY THE CONCLUSIONS REACHED AFTER THE CREATION OF A PILOT CORPUS; THE MAXIMISATION OF AUTOMATIC LEMMATISATION, TAGGING AND ANNOTATION; THE FEEDBACK OF THE DATABASES AND THE LEMMATISER WITH THE INFORMATION GATHERED WITH MANUAL ANALYSIS; AND THE DISSEMINATION OF RESULTS IN OPEN ACCESS. THUS DESCRIBED, THE PROJECT INTENDS TO CONTRIBUTE TO CORPUS LINGUISTICS, GIVEN THAT AN ALIGNMENT METHOD BASED ON THE DERIVED LEXICON IS PROPOSED; ENGLISH CORPUS LINGUISTICS, BECAUSE NO CORPUS OF THIS LANGUAGE IS AVAILABLE THAT CONTAINS LEMMAS, GLOSSES AND WORD BY WORD ALIGNMENT; ELECTRONIC LEXICOGRAPHY, SINCE A METHOD FOR FEEDING PARALLEL CORPORA WITH KNOWLEDGE BASES IS DEVELOPED; OLD ENGLISH LEXICOGRAPHY, BECAUSE QUESTIONS ARE ADDRESSED THAT HAVE TO DO WITH SPELLING AND MORPHOLOGICAL VARIATION ATTRIBUTABLE TO THE TIME SPAN, NORMALISATION AS WELL AS AUTOMATIC AND SEMI-AUTOMATIC LEMMATISATION; THIRD GENERATION INTERNET, GIVEN THAT THE RESULTS OF LINGUISTIC ANALYSIS WITH DATA BASES REPRESENT STRUCTURED DATA THAT, MOREOVER, CAN BE PRESENTED AS LINKED DATA; DIGITAL HUMANITIES, ONCE THE ONLINE USER INTERFACE OFFERS THE PARALLEL TEXT, THE WORD BY WORD GLOSS, THE TRANSLATION, THE ALIGNMENT AND THE HIGHLIGHTING, AND ALLOWS SEARCHES FOR TAGGING AND ANNOTATION BY LEMMA AND INFLECTIONAL FORM; AND OLD ENGLISH, INCLUDING NOT ONLY LINGUISTICS, BUT ALSO LITERATURE AND CULTURAL STUDIES, GIVEN THAT THE TEXTS AND THEIR TRANSLATIONS CAN BE USED FOR SOURCES FOR VARIOUS FIELDS AND APPROACHES. (English)
0 references
L’OBJECTIF GÉNÉRAL DU PROJET EST DE COLLECTER, D’ANALYSER ET DE DIFFUSER UN CORPUS PARALLÈLE D’ANGLAIS ANCIEN CONTEMPORAIN AVEC LEQUEL DES ÉTUDES LINGUISTIQUES ET LINGUISTIQUES DU CORPUS SONT MENÉES. LE CORPUS EST BRILLANT, LEMATISED, ANNOTÉ ET ÉTIQUETÉ DANS SA PARTIE ANGLO-SAXONNE, COMPRENANT ENVIRON 50 000 MOTS DE TEXTES DE PROSE REPRÉSENTATIFS. LA MÉTHODOLOGIE DU PROJET REPOSE SUR LA COLLECTE, LE STOCKAGE, L’ANALYSE ET LA DIFFUSION DE LA LANGUE RÉELLE AU MOYEN D’UN LOGICIEL DE BASE DE DONNÉES; LA CONCEPTION ET LA MISE EN ŒUVRE DU CORPUS SUR LA BASE DES CONCLUSIONS DE LA COMPILATION D’UN CORPUS PILOTE; MAXIMISATION DE LA LEMATISATION AUTOMATIQUE, DE L’ÉTIQUETAGE ET DE L’ANNOTATION; RETOUR D’INFORMATIONS PROVENANT DE L’ANALYSE MANUELLE DES CORPUS AUX BASES DE DONNÉES ET À LEMATISER; ET LA DIFFUSION DES RÉSULTATS EN LIBRE ACCÈS. LE PROJET VISE À CONTRIBUER À LA LINGUISTICA DE CORPUS, CAR IL N’EST PAS HABITUEL DE COLLECTER LES CORPORA ALIGNÉS DIACRONICOS ET, SURTOUT, UNE MÉTHODE D’ALIGNEMENT BASÉE SUR LE LEXIQUE DÉRIVÉ EST PROPOSÉE; II) LE CORPUS DE LANGUE ANGLAISE, PUISQU’IL N’EXISTE PAS DE CORPUS PARALLÈLE LEMATISED ET GLOSSED MOT POUR MOT; III) LA LEXICOGRAPHIE ÉLECTRONIQUE, PARCE QU’UNE MÉTHODE D’ALIMENTATION DU CORPUS EST PROPOSÉE À PARTIR DE BASES DE CONNAISSANCES; IV) LA LEXICOGRAPHIE DE L’ANCIEN ANGLAIS, DANS LA MESURE OÙ ELLE ABORDE DES QUESTIONS DE VARIATIONS ORTHOGRAPHIQUES ET FLEXIVES ATTRIBUABLES À LA DIVERSITÉ TEMPORELLE, GÉOGRAPHIQUE ET TEXTUELLE, AUX ASPECTS DE LA NORMALISATION ET À LA LEMATIZACION AUTOMATIQUE ET SEMI-AUTOMATIQUE; (V) L’INTERNET DE TROISIÈME GÉNÉRATION, CONSIDÉRANT QUE LES RÉSULTATS DE L’ANALYSE LINGUISTIQUE AVEC BASE DE DONNÉES CONSTITUENT DES DONNÉES STRUCTURÉES, AVEC LA POSSIBILITÉ D’ÊTRE PRÉSENTÉS COMME DES DONNÉES LIÉES; VI) LES SCIENCES HUMAINES NUMÉRIQUES, EN TENANT COMPTE DU FAIT QU’UNE INTERFACE UTILISATEUR EN LIGNE SERA MISE EN PLACE POUR OFFRIR LE TEXTE PARALLÈLE À LA TRADUCTION VERBALE ET FRAGMENTAIRE, AINSI QU’À LA CORRESPONDANCE ET À L’AMÉLIORATION, ET PERMETTRE LA RECHERCHE D’INFORMATIONS SUR L’ÉTIQUETAGE ET L’ANNOTATION PAR DEVISE ET AVEC SOUPLESSE; ET (VII) NON SEULEMENT LES ÉTUDES LINGUISTIQUES DE L’ANGLAIS ANCIEN, MAIS AUSSI LES ÉTUDES LITTÉRAIRES ET CULTURELLES PARCE QUE L’ANALYSE ET LA TRADUCTION DES TEXTES PEUVENT SERVIR DE SOURCE OU DE RÉFÉRENCE POUR L’ÉTUDE DE CES DOMAINES. (French)
4 December 2021
0 references
DAS ALLGEMEINE ZIEL DES PROJEKTS IST ES, EINEN PARALLELEN KORPUS DES ZEITGENÖSSISCHEN ALTEN ENGLISCHEN ZU SAMMELN, ZU ANALYSIEREN UND ZU VERBREITEN, MIT DEM SPRACHLICHE UND SPRACHLICHE STUDIEN DES KORPUS DURCHGEFÜHRT WERDEN. DER KORPUS WIRD IN SEINEM ANGELSÄCHSISCHEN TEIL MIT RUND 50.000 WÖRTERN REPRÄSENTATIVER PROSATEXTE GEGLÄNZT, LEMATISED, KOMMENTIERT UND GEKENNZEICHNET. DIE METHODIK DES PROJEKTS BERUHT AUF DER SAMMLUNG, SPEICHERUNG, ANALYSE UND VERBREITUNG DER TATSÄCHLICHEN SPRACHE MIT DATENBANKSOFTWARE; DIE KONZIPIERUNG UND UMSETZUNG DES KORPUS, DAS VON DEN SCHLUSSFOLGERUNGEN DER ERSTELLUNG EINES PILOTKORPUS GELEITET WIRD; MAXIMIERUNG DER AUTOMATISCHEN LEMATISIERUNG, KENNZEICHNUNG UND ANNOTATION; RÜCKMELDUNGEN VON MANUELLER KORPUSANALYSE ZU DATENBANKEN UND LEMATISER; UND DIE VERBREITUNG DER ERGEBNISSE IM OFFENEN ZUGANG. DAS PROJEKT ZIELT DARAUF AB, ZUR LINGUISTICA DE CORPUS BEIZUTRAGEN, DA ES NICHT ÜBLICH IST, DIACRONICOS AUSGERICHTETE KORPORA ZU SAMMELN, UND VOR ALLEM EINE AUF DEM ABGELEITETEN LEXIKON BERUHENDE ANGLEICHUNGSMETHODE VORGESCHLAGEN WIRD; II) DAS ENGLISCHE KORPUS, DA ES KEIN PARALLELES KORPUS LEMATISED UND GLÄNZENDES WORT FÜR WORT GIBT; III) ELEKTRONISCHE LEXIKOGRAPHIE, DA EINE METHODE ZUR FÜTTERUNG DES KORPUS AUF DER GRUNDLAGE VON WISSENSGRUNDLAGEN VORGESCHLAGEN WIRD; IV) DIE LEXIKOGRAPHIE DES ALTEN ENGLISCHEN, DA SIE FRAGEN DER ORTHOGRAFISCHEN UND FLEXIVEN VARIATIONEN BEHANDELT, DIE AUF ZEITLICHE, GEOGRAFISCHE UND TEXTLICHE VIELFALT, ASPEKTE DER STANDARDISIERUNG UND AUTOMATISCHE UND HALBAUTOMATISCHE LEMATIZACION ZURÜCKZUFÜHREN SIND; V) DAS INTERNET DER DRITTEN GENERATION IN ANBETRACHT DER TATSACHE, DASS DIE ERGEBNISSE DER SPRACHLICHEN ANALYSE MIT DATENBANK STRUKTURIERTE DATEN DARSTELLEN, MIT DER MÖGLICHKEIT, ALS VERKNÜPFTE DATEN DARGESTELLT ZU WERDEN; VI) DIE DIGITALEN GEISTESWISSENSCHAFTEN, WOBEI ZU BERÜCKSICHTIGEN IST, DASS EINE ONLINE-BENUTZEROBERFLÄCHE ENTWICKELT WIRD, DIE DEN PARALLELTEXT SOWOHL MIT WORT-FÜR-WORT- ALS AUCH FRAGMENT-ÜBERSETZUNG SOWIE KORRESPONDENZ UND VERBESSERUNG BIETET UND DIE SUCHE NACH KENNZEICHNUNGSINFORMATIONEN UND ANMERKUNGEN NACH MOTTO UND FLEXIBILITÄT ERMÖGLICHT; UND (VII) NICHT NUR LINGUISTISCHE STUDIEN DES ALTEN ENGLISCHEN, SONDERN AUCH LITERARISCHE UND KULTURELLE STUDIEN, WEIL DIE ANALYSE UND ÜBERSETZUNG VON TEXTEN ALS QUELLE ODER REFERENZ FÜR STUDIEN DIESER BEREICHE DIENEN KANN. (German)
9 December 2021
0 references
HET ALGEMENE DOEL VAN HET PROJECT IS HET VERZAMELEN, ANALYSEREN EN VERSPREIDEN VAN EEN PARALLEL CORPUS VAN HET HEDENDAAGSE OUDE ENGELS WAARMEE HET TAAL- EN TAALONDERZOEK VAN HET CORPUS KAN WORDEN UITGEVOERD. HET CORPUS IS GLANZEND, LEMATISED, GEANNOTEERD EN GEËTIKETTEERD IN HET ANGELSAKSISCHE DEEL, MET ZO’N 50.000 WOORDEN REPRESENTATIEVE PROZATEKSTEN. DE METHODOLOGIE VAN HET PROJECT IS GEBASEERD OP HET VERZAMELEN, OPSLAAN, ANALYSEREN EN VERSPREIDEN VAN DE WERKELIJKE TAAL MET DATABASESOFTWARE; HET ONTWERP EN DE UITVOERING VAN HET CORPUS OP BASIS VAN DE CONCLUSIES VAN DE SAMENSTELLING VAN EEN PROEFCORPUS; MAXIMALISERING VAN AUTOMATISCHE LEMATISATIE, ETIKETTERING EN ANNOTATIE; FEEDBACK VAN HANDMATIGE CORPUS-ANALYSE NAAR DATABASES EN LEMATISER; EN DE VERSPREIDING VAN DE RESULTATEN OP HET GEBIED VAN OPEN TOEGANG. HET PROJECT IS BEDOELD OM BIJ TE DRAGEN AAN DE LINGUISTICA DE CORPUS, AANGEZIEN HET NIET GEBRUIKELIJK IS OM DIACRONICOS-GELIJNDE CORPORA TE VERZAMELEN EN VOORAL EEN OP HET AFGELEIDE LEXICON GEBASEERDE AFSTEMMINGSMETHODE WORDT VOORGESTELD; II) HET ENGELSE TAALCORPUS, AANGEZIEN ER GEEN PARALLEL CORPUS LEMATISED EN GLOSSED WOORD VOOR WOORD IS; III) ELEKTRONISCHE LEXICOGRAFIE, OMDAT EEN METHODE VOOR HET VOEDEN VAN HET CORPUS WORDT VOORGESTELD OP BASIS VAN KENNISBASIS; IV) DE LEXICOGRAFIE VAN DE OUDE ENGELSEN, AANGEZIEN DEZE BETREKKING HEEFT OP VRAGEN VAN ORTHOGRAFISCHE EN FLEXIEVE VARIATIE TOE TE SCHRIJVEN AAN TEMPORELE, GEOGRAFISCHE EN TEKSTUELE DIVERSITEIT, ASPECTEN VAN NORMALISATIE EN AUTOMATISCHE EN SEMI-AUTOMATISCHE LEMATIZACION; (V) HET INTERNET VAN DE DERDE GENERATIE, AANGEZIEN DE RESULTATEN VAN DE TAALKUNDIGE ANALYSE MET DATABANK GESTRUCTUREERDE GEGEVENS VORMEN, MET DE MOGELIJKHEID OM ALS GEKOPPELDE GEGEVENS TE WORDEN GEPRESENTEERD; (VI) DE DIGITALE GEESTESWETENSCHAPPEN, REKENING HOUDEND MET HET FEIT DAT ER EEN ONLINE GEBRUIKERSINTERFACE ZAL WORDEN ONTWIKKELD DIE DE PARALLELLE TEKST BIEDT MET ZOWEL WOORD-VOOR-WOORD- ALS FRAGMENTVERTALING, ALSOOK CORRESPONDENTIE EN VERBETERING, EN DIE HET MOGELIJK MAAKT INFORMATIE OVER ETIKETTERING EN ANNOTATIE TE ZOEKEN OP BASIS VAN MOTTO EN FLEXIBEL; EN (VII) NIET ALLEEN TAALSTUDIES VAN HET OUDE ENGELS, MAAR OOK LITERAIRE EN CULTURELE STUDIES, OMDAT DE ANALYSE EN VERTALING VAN TEKSTEN KAN DIENEN ALS BRON OF REFERENTIE VOOR STUDIES OP DEZE GEBIEDEN. (Dutch)
17 December 2021
0 references
L'OBIETTIVO GENERALE DEL PROGETTO È QUELLO DI RACCOGLIERE, ANALIZZARE E DIFFONDERE UN CORPUS PARALLELO DI ANTICO INGLESE CONTEMPORANEO CON IL QUALE EFFETTUARE STUDI LINGUISTICI E LINGUISTICI DI CORPUS. IL CORPUS È LUCIDO, LEMATIZZATO, ANNOTATO ED ETICHETTATO NELLA SUA PARTE ANGLOSASSONE, CHE COMPRENDE CIRCA 50.000 PAROLE DI TESTI IN PROSA RAPPRESENTATIVI. LA METODOLOGIA DEL PROGETTO SI BASA SULLA RACCOLTA, L'ARCHIVIAZIONE, L'ANALISI E LA DIFFUSIONE DEL LINGUAGGIO REALE CON IL SOFTWARE DELLA BANCA DATI; LA PROGETTAZIONE E L'ATTUAZIONE DEL CORPUS GUIDATO DALLE CONCLUSIONI DELLA COMPILAZIONE DI UN CORPUS PILOTA; MASSIMIZZAZIONE DELLA LEMATIZZAZIONE AUTOMATICA, ETICHETTATURA E ANNOTAZIONE; FEEDBACK DALL'ANALISI MANUALE DEL CORPUS ALLE BANCHE DATI E AL LEMATISER; E LA DIFFUSIONE DEI RISULTATI IN UN ACCESSO APERTO. IL PROGETTO MIRA A CONTRIBUIRE ALLA LINGUISTICA DE CORPUS, IN QUANTO NON È CONSUETUDINE RACCOGLIERE CORPI ALLINEATI DIACRONICOS E, SOPRATTUTTO, SI PROPONE UN METODO DI ALLINEAMENTO BASATO SUL LESSICO DERIVATO; II) IL CORPUS IN LINGUA INGLESE, IN QUANTO NON ESISTE UN CORPUS PARALLELO LEMATISED E GLOSSED WORD FOR WORD; III) LA LESSICOGRAFIA ELETTRONICA, IN QUANTO VIENE PROPOSTO UN METODO DI ALIMENTAZIONE DEL CORPUS BASATO SU BASI DI CONOSCENZA; IV) LA LESSICOGRAFIA DEL VECCHIO INGLESE, TRATTANDOSI DI QUESTIONI DI VARIAZIONE ORTOGRAFICA E FLESSIVA ATTRIBUIBILI ALLA DIVERSITÀ TEMPORALE, GEOGRAFICA E TESTUALE, AGLI ASPETTI DELLA STANDARDIZZAZIONE E ALLA LEMATIZACION AUTOMATICA E SEMIAUTOMATICA; (V) INTERNET DI TERZA GENERAZIONE, CONSIDERANDO CHE I RISULTATI DELL'ANALISI LINGUISTICA CON BANCA DATI COSTITUISCONO DATI STRUTTURATI, CON LA POSSIBILITÀ DI ESSERE PRESENTATI COME DATI COLLEGATI; (VI) LE DISCIPLINE UMANISTICHE DIGITALI, TENENDO CONTO DEL FATTO CHE SARÀ SVILUPPATA UN'INTERFACCIA UTENTE ONLINE CHE OFFRA IL TESTO PARALLELO CON LA TRADUZIONE PAROLA PER PAROLA E FRAMMENTARIA, NONCHÉ LA CORRISPONDENZA E IL MIGLIORAMENTO, E CONSENTA LA RICERCA DI INFORMAZIONI SULL'ETICHETTATURA E L'ANNOTAZIONE PER MOTTO E IN MODO FLESSIBILE; E (VII) NON SOLO GLI STUDI LINGUISTICI DELL'INGLESE ANTICO, MA ANCHE GLI STUDI LETTERARI E CULTURALI PERCHÉ L'ANALISI E LA TRADUZIONE DEI TESTI POSSONO SERVIRE DA FONTE O RIFERIMENTO PER GLI STUDI DI QUESTI CAMPI. (Italian)
16 January 2022
0 references
Logroño
0 references
Identifiers
FFI2017-83360-P
0 references