PARALLEL CORPUS OF ANCIENT ENGLISH PROSE. LABELLING, ANNOTATION AND RELATED LINGUISTIC STUDIES (Q3187875)

From EU Knowledge Graph
Jump to navigation Jump to search
Project Q3187875 in Spain
Language Label Description Also known as
English
PARALLEL CORPUS OF ANCIENT ENGLISH PROSE. LABELLING, ANNOTATION AND RELATED LINGUISTIC STUDIES
Project Q3187875 in Spain

    Statements

    0 references
    29,648.03 Euro
    0 references
    54,450.0 Euro
    0 references
    54.45 percent
    0 references
    1 January 2018
    0 references
    31 December 2020
    0 references
    UNIVERSIDAD DE LA RIOJA
    0 references

    42°27'56.16"N, 2°26'7.08"W
    0 references
    26004
    0 references
    EL OBJETIVO GENERAL DEL PROYECTO ES RECOPILAR, ANALIZAR Y DIFUNDIR UN CORPUS PARALELO Y ALINEADO INGLES ANTIGUO-INGLES CONTEMPORANEO CON EL QUE LLEVAR A CABO ESTUDIOS LINGUISTICOS Y DE LINGUISTICA DE CORPUS. EL CORPUS ESTA GLOSADO, LEMATIZADO, ANOTADO Y ETIQUETADO EN SU PARTE ANGLOSAJONA, QUE COMPRENDE UNAS 50.000 PALABRAS DE TEXTOS EN PROSA REPRESENTATIVOS. LA METODOLOGIA DEL PROYECTO ESTA BASADA EN LA RECOPILACION, ALMACENAMIENTO, ANALISIS Y DIFUSION DEL LENGUAJE REAL CON SOFTWARE DE BASE DE DATOS; EL DISEÑO Y LA IMPLEMENTACION DEL CORPUS GUIADOS POR LAS CONCLUSIONES DE LA RECOPILACION DE UN CORPUS PILOTO; LA MAXIMIZACION DE LA LEMATIZACION, EL ETIQUETADO Y LA ANOTACION AUTOMATICAS; LA RETROALIMENTACION DEL ANALISIS MANUAL DEL CORPUS A LAS BASES DE DATOS Y EL LEMATIZADOR; Y LA DIFUSION DE LOS RESULTADOS EN OPEN ACCESS. EL PROYECTO PRETENDE CONTRIBUIR A LA LINGUISTICA DE CORPUS, YA QUE NO ES HABITUAL RECOPILAR CORPORA DIACRONICOS ALINEADOS Y, SOBRE TODO, SE PROPONE UN METODO DE ALINEAMIENTO BASADO EN EL LEXICO DERIVADO; (II) LA LINGUISTICA DE CORPUS DEL INGLES, PUESTO QUE NO EXISTE UN CORPUS PARALELO LEMATIZADO Y GLOSADO PALABRA POR PALABRA; (III) LA LEXICOGRAFIA ELECTRONICA, PORQUE SE PROPONE UN METODO DE ALIMENTACION DEL CORPUS A PARTIR DE BASES DE CONOCIMIENTO; (IV) LA LEXICOGRAFIA DEL INGLES ANTIGUO, YA QUE SE ABORDAN CUESTIONES DE CUESTIONES DE VARIACION ORTOGRAFICA Y FLEXIVA ATRIBUIBLE A LA DIVERSIDAD TEMPORAL, GEOGRAFICA Y DE TRANSMISION TEXTUAL, ASPECTOS DE NORMALIZACION Y LEMATIZACION AUTOMATICA Y SEMIAUTOMATICA; (V) EL INTERNET DE TERCERA GENERACION, CONSIDERANDO QUE LOS RESULTADOS DEL ANALISIS LINGUISTICO CON BASE DE DATOS CONSTITUYEN DATOS ESTRUCTURADOS, CON POSIBILIDAD DE SER PRESENTADOS COMO DATOS ENLAZADOS; (VI) LAS HUMANIDADES DIGITALES, TENIENDO EN CUENTA QUE SE VA A ELABORAR UN INTERFAZ DE USUARIO ONLINE QUE OFREZCA EL TEXTO PARALELO TANTO CON GLOSA PALABRA POR PALABRA COMO CON TRADUCCION POR FRAGMENTO, ASI COMO LA CORRESPONDENCIA Y EL REALCE, Y PERMITA LA BUSQUEDA DE LA INFORMACION DEL ETIQUETADO Y LA ANOTACION POR LEMA Y POR FORMA FLEXIVA; Y (VII) NO SOLO LOS ESTUDIOS LINGUISTICOS DEL INGLES ANTIGUO, SINO TAMBIEN LOS LITERARIOS Y CULTURALES PORQUE EL ANALISIS Y LA TRADUCCION DE LOS TEXTOS PUEDE SERVIR DE FUENTE O REFERENCIA PARA ESTUDIOS DE ESTOS AMBITOS. (Spanish)
    0 references
    THE AIM OF THIS PROJECT IS TO COMPILE, ANALISE AND OFFER A PARALLEL CORPUS OLD ENGLISH-CONTEMPORARY ENGLISH, ALIGNED AT WORD LEVEL, ON THE BASIS OF WHICH STUDIES IN OLD ENGILSH LINGUISTICS AND CORPUS LINGUISTICS CAN BE CONDUCTED. THE CORPUS SHALL BE GLOSSED, LEMMATISED, TAGGED AND ANNOTATED IN ITS ANGLO-SAXON SEGMENT, WHICH COMPRISES AROUND 50,000 WORDS FROM REPRESENTATIVE PROSE TEXTS. THE METHODOLOGY OF RESEARCH IS BASED ON THE GATHERING, STORAGE, ANALYSIS AND DISSEMINATION OF REAL LANGUAGE WITH DATABASE SOFTWARE; THE DESIGN AND IMPLEMENTATION GUIDED BY THE CONCLUSIONS REACHED AFTER THE CREATION OF A PILOT CORPUS; THE MAXIMISATION OF AUTOMATIC LEMMATISATION, TAGGING AND ANNOTATION; THE FEEDBACK OF THE DATABASES AND THE LEMMATISER WITH THE INFORMATION GATHERED WITH MANUAL ANALYSIS; AND THE DISSEMINATION OF RESULTS IN OPEN ACCESS. THUS DESCRIBED, THE PROJECT INTENDS TO CONTRIBUTE TO CORPUS LINGUISTICS, GIVEN THAT AN ALIGNMENT METHOD BASED ON THE DERIVED LEXICON IS PROPOSED; ENGLISH CORPUS LINGUISTICS, BECAUSE NO CORPUS OF THIS LANGUAGE IS AVAILABLE THAT CONTAINS LEMMAS, GLOSSES AND WORD BY WORD ALIGNMENT; ELECTRONIC LEXICOGRAPHY, SINCE A METHOD FOR FEEDING PARALLEL CORPORA WITH KNOWLEDGE BASES IS DEVELOPED; OLD ENGLISH LEXICOGRAPHY, BECAUSE QUESTIONS ARE ADDRESSED THAT HAVE TO DO WITH SPELLING AND MORPHOLOGICAL VARIATION ATTRIBUTABLE TO THE TIME SPAN, NORMALISATION AS WELL AS AUTOMATIC AND SEMI-AUTOMATIC LEMMATISATION; THIRD GENERATION INTERNET, GIVEN THAT THE RESULTS OF LINGUISTIC ANALYSIS WITH DATA BASES REPRESENT STRUCTURED DATA THAT, MOREOVER, CAN BE PRESENTED AS LINKED DATA; DIGITAL HUMANITIES, ONCE THE ONLINE USER INTERFACE OFFERS THE PARALLEL TEXT, THE WORD BY WORD GLOSS, THE TRANSLATION, THE ALIGNMENT AND THE HIGHLIGHTING, AND ALLOWS SEARCHES FOR TAGGING AND ANNOTATION BY LEMMA AND INFLECTIONAL FORM; AND OLD ENGLISH, INCLUDING NOT ONLY LINGUISTICS, BUT ALSO LITERATURE AND CULTURAL STUDIES, GIVEN THAT THE TEXTS AND THEIR TRANSLATIONS CAN BE USED FOR SOURCES FOR VARIOUS FIELDS AND APPROACHES. (English)
    0.1242094024578272
    0 references
    L’OBJECTIF GÉNÉRAL DU PROJET EST DE COLLECTER, D’ANALYSER ET DE DIFFUSER UN CORPUS PARALLÈLE D’ANGLAIS ANCIEN CONTEMPORAIN AVEC LEQUEL DES ÉTUDES LINGUISTIQUES ET LINGUISTIQUES DU CORPUS SONT MENÉES. LE CORPUS EST BRILLANT, LEMATISED, ANNOTÉ ET ÉTIQUETÉ DANS SA PARTIE ANGLO-SAXONNE, COMPRENANT ENVIRON 50 000 MOTS DE TEXTES DE PROSE REPRÉSENTATIFS. LA MÉTHODOLOGIE DU PROJET REPOSE SUR LA COLLECTE, LE STOCKAGE, L’ANALYSE ET LA DIFFUSION DE LA LANGUE RÉELLE AU MOYEN D’UN LOGICIEL DE BASE DE DONNÉES; LA CONCEPTION ET LA MISE EN ŒUVRE DU CORPUS SUR LA BASE DES CONCLUSIONS DE LA COMPILATION D’UN CORPUS PILOTE; MAXIMISATION DE LA LEMATISATION AUTOMATIQUE, DE L’ÉTIQUETAGE ET DE L’ANNOTATION; RETOUR D’INFORMATIONS PROVENANT DE L’ANALYSE MANUELLE DES CORPUS AUX BASES DE DONNÉES ET À LEMATISER; ET LA DIFFUSION DES RÉSULTATS EN LIBRE ACCÈS. LE PROJET VISE À CONTRIBUER À LA LINGUISTICA DE CORPUS, CAR IL N’EST PAS HABITUEL DE COLLECTER LES CORPORA ALIGNÉS DIACRONICOS ET, SURTOUT, UNE MÉTHODE D’ALIGNEMENT BASÉE SUR LE LEXIQUE DÉRIVÉ EST PROPOSÉE; II) LE CORPUS DE LANGUE ANGLAISE, PUISQU’IL N’EXISTE PAS DE CORPUS PARALLÈLE LEMATISED ET GLOSSED MOT POUR MOT; III) LA LEXICOGRAPHIE ÉLECTRONIQUE, PARCE QU’UNE MÉTHODE D’ALIMENTATION DU CORPUS EST PROPOSÉE À PARTIR DE BASES DE CONNAISSANCES; IV) LA LEXICOGRAPHIE DE L’ANCIEN ANGLAIS, DANS LA MESURE OÙ ELLE ABORDE DES QUESTIONS DE VARIATIONS ORTHOGRAPHIQUES ET FLEXIVES ATTRIBUABLES À LA DIVERSITÉ TEMPORELLE, GÉOGRAPHIQUE ET TEXTUELLE, AUX ASPECTS DE LA NORMALISATION ET À LA LEMATIZACION AUTOMATIQUE ET SEMI-AUTOMATIQUE; (V) L’INTERNET DE TROISIÈME GÉNÉRATION, CONSIDÉRANT QUE LES RÉSULTATS DE L’ANALYSE LINGUISTIQUE AVEC BASE DE DONNÉES CONSTITUENT DES DONNÉES STRUCTURÉES, AVEC LA POSSIBILITÉ D’ÊTRE PRÉSENTÉS COMME DES DONNÉES LIÉES; VI) LES SCIENCES HUMAINES NUMÉRIQUES, EN TENANT COMPTE DU FAIT QU’UNE INTERFACE UTILISATEUR EN LIGNE SERA MISE EN PLACE POUR OFFRIR LE TEXTE PARALLÈLE À LA TRADUCTION VERBALE ET FRAGMENTAIRE, AINSI QU’À LA CORRESPONDANCE ET À L’AMÉLIORATION, ET PERMETTRE LA RECHERCHE D’INFORMATIONS SUR L’ÉTIQUETAGE ET L’ANNOTATION PAR DEVISE ET AVEC SOUPLESSE; ET (VII) NON SEULEMENT LES ÉTUDES LINGUISTIQUES DE L’ANGLAIS ANCIEN, MAIS AUSSI LES ÉTUDES LITTÉRAIRES ET CULTURELLES PARCE QUE L’ANALYSE ET LA TRADUCTION DES TEXTES PEUVENT SERVIR DE SOURCE OU DE RÉFÉRENCE POUR L’ÉTUDE DE CES DOMAINES. (French)
    4 December 2021
    0 references
    DAS ALLGEMEINE ZIEL DES PROJEKTS IST ES, EINEN PARALLELEN KORPUS DES ZEITGENÖSSISCHEN ALTEN ENGLISCHEN ZU SAMMELN, ZU ANALYSIEREN UND ZU VERBREITEN, MIT DEM SPRACHLICHE UND SPRACHLICHE STUDIEN DES KORPUS DURCHGEFÜHRT WERDEN. DER KORPUS WIRD IN SEINEM ANGELSÄCHSISCHEN TEIL MIT RUND 50.000 WÖRTERN REPRÄSENTATIVER PROSATEXTE GEGLÄNZT, LEMATISED, KOMMENTIERT UND GEKENNZEICHNET. DIE METHODIK DES PROJEKTS BERUHT AUF DER SAMMLUNG, SPEICHERUNG, ANALYSE UND VERBREITUNG DER TATSÄCHLICHEN SPRACHE MIT DATENBANKSOFTWARE; DIE KONZIPIERUNG UND UMSETZUNG DES KORPUS, DAS VON DEN SCHLUSSFOLGERUNGEN DER ERSTELLUNG EINES PILOTKORPUS GELEITET WIRD; MAXIMIERUNG DER AUTOMATISCHEN LEMATISIERUNG, KENNZEICHNUNG UND ANNOTATION; RÜCKMELDUNGEN VON MANUELLER KORPUSANALYSE ZU DATENBANKEN UND LEMATISER; UND DIE VERBREITUNG DER ERGEBNISSE IM OFFENEN ZUGANG. DAS PROJEKT ZIELT DARAUF AB, ZUR LINGUISTICA DE CORPUS BEIZUTRAGEN, DA ES NICHT ÜBLICH IST, DIACRONICOS AUSGERICHTETE KORPORA ZU SAMMELN, UND VOR ALLEM EINE AUF DEM ABGELEITETEN LEXIKON BERUHENDE ANGLEICHUNGSMETHODE VORGESCHLAGEN WIRD; II) DAS ENGLISCHE KORPUS, DA ES KEIN PARALLELES KORPUS LEMATISED UND GLÄNZENDES WORT FÜR WORT GIBT; III) ELEKTRONISCHE LEXIKOGRAPHIE, DA EINE METHODE ZUR FÜTTERUNG DES KORPUS AUF DER GRUNDLAGE VON WISSENSGRUNDLAGEN VORGESCHLAGEN WIRD; IV) DIE LEXIKOGRAPHIE DES ALTEN ENGLISCHEN, DA SIE FRAGEN DER ORTHOGRAFISCHEN UND FLEXIVEN VARIATIONEN BEHANDELT, DIE AUF ZEITLICHE, GEOGRAFISCHE UND TEXTLICHE VIELFALT, ASPEKTE DER STANDARDISIERUNG UND AUTOMATISCHE UND HALBAUTOMATISCHE LEMATIZACION ZURÜCKZUFÜHREN SIND; V) DAS INTERNET DER DRITTEN GENERATION IN ANBETRACHT DER TATSACHE, DASS DIE ERGEBNISSE DER SPRACHLICHEN ANALYSE MIT DATENBANK STRUKTURIERTE DATEN DARSTELLEN, MIT DER MÖGLICHKEIT, ALS VERKNÜPFTE DATEN DARGESTELLT ZU WERDEN; VI) DIE DIGITALEN GEISTESWISSENSCHAFTEN, WOBEI ZU BERÜCKSICHTIGEN IST, DASS EINE ONLINE-BENUTZEROBERFLÄCHE ENTWICKELT WIRD, DIE DEN PARALLELTEXT SOWOHL MIT WORT-FÜR-WORT- ALS AUCH FRAGMENT-ÜBERSETZUNG SOWIE KORRESPONDENZ UND VERBESSERUNG BIETET UND DIE SUCHE NACH KENNZEICHNUNGSINFORMATIONEN UND ANMERKUNGEN NACH MOTTO UND FLEXIBILITÄT ERMÖGLICHT; UND (VII) NICHT NUR LINGUISTISCHE STUDIEN DES ALTEN ENGLISCHEN, SONDERN AUCH LITERARISCHE UND KULTURELLE STUDIEN, WEIL DIE ANALYSE UND ÜBERSETZUNG VON TEXTEN ALS QUELLE ODER REFERENZ FÜR STUDIEN DIESER BEREICHE DIENEN KANN. (German)
    9 December 2021
    0 references
    HET ALGEMENE DOEL VAN HET PROJECT IS HET VERZAMELEN, ANALYSEREN EN VERSPREIDEN VAN EEN PARALLEL CORPUS VAN HET HEDENDAAGSE OUDE ENGELS WAARMEE HET TAAL- EN TAALONDERZOEK VAN HET CORPUS KAN WORDEN UITGEVOERD. HET CORPUS IS GLANZEND, LEMATISED, GEANNOTEERD EN GEËTIKETTEERD IN HET ANGELSAKSISCHE DEEL, MET ZO’N 50.000 WOORDEN REPRESENTATIEVE PROZATEKSTEN. DE METHODOLOGIE VAN HET PROJECT IS GEBASEERD OP HET VERZAMELEN, OPSLAAN, ANALYSEREN EN VERSPREIDEN VAN DE WERKELIJKE TAAL MET DATABASESOFTWARE; HET ONTWERP EN DE UITVOERING VAN HET CORPUS OP BASIS VAN DE CONCLUSIES VAN DE SAMENSTELLING VAN EEN PROEFCORPUS; MAXIMALISERING VAN AUTOMATISCHE LEMATISATIE, ETIKETTERING EN ANNOTATIE; FEEDBACK VAN HANDMATIGE CORPUS-ANALYSE NAAR DATABASES EN LEMATISER; EN DE VERSPREIDING VAN DE RESULTATEN OP HET GEBIED VAN OPEN TOEGANG. HET PROJECT IS BEDOELD OM BIJ TE DRAGEN AAN DE LINGUISTICA DE CORPUS, AANGEZIEN HET NIET GEBRUIKELIJK IS OM DIACRONICOS-GELIJNDE CORPORA TE VERZAMELEN EN VOORAL EEN OP HET AFGELEIDE LEXICON GEBASEERDE AFSTEMMINGSMETHODE WORDT VOORGESTELD; II) HET ENGELSE TAALCORPUS, AANGEZIEN ER GEEN PARALLEL CORPUS LEMATISED EN GLOSSED WOORD VOOR WOORD IS; III) ELEKTRONISCHE LEXICOGRAFIE, OMDAT EEN METHODE VOOR HET VOEDEN VAN HET CORPUS WORDT VOORGESTELD OP BASIS VAN KENNISBASIS; IV) DE LEXICOGRAFIE VAN DE OUDE ENGELSEN, AANGEZIEN DEZE BETREKKING HEEFT OP VRAGEN VAN ORTHOGRAFISCHE EN FLEXIEVE VARIATIE TOE TE SCHRIJVEN AAN TEMPORELE, GEOGRAFISCHE EN TEKSTUELE DIVERSITEIT, ASPECTEN VAN NORMALISATIE EN AUTOMATISCHE EN SEMI-AUTOMATISCHE LEMATIZACION; (V) HET INTERNET VAN DE DERDE GENERATIE, AANGEZIEN DE RESULTATEN VAN DE TAALKUNDIGE ANALYSE MET DATABANK GESTRUCTUREERDE GEGEVENS VORMEN, MET DE MOGELIJKHEID OM ALS GEKOPPELDE GEGEVENS TE WORDEN GEPRESENTEERD; (VI) DE DIGITALE GEESTESWETENSCHAPPEN, REKENING HOUDEND MET HET FEIT DAT ER EEN ONLINE GEBRUIKERSINTERFACE ZAL WORDEN ONTWIKKELD DIE DE PARALLELLE TEKST BIEDT MET ZOWEL WOORD-VOOR-WOORD- ALS FRAGMENTVERTALING, ALSOOK CORRESPONDENTIE EN VERBETERING, EN DIE HET MOGELIJK MAAKT INFORMATIE OVER ETIKETTERING EN ANNOTATIE TE ZOEKEN OP BASIS VAN MOTTO EN FLEXIBEL; EN (VII) NIET ALLEEN TAALSTUDIES VAN HET OUDE ENGELS, MAAR OOK LITERAIRE EN CULTURELE STUDIES, OMDAT DE ANALYSE EN VERTALING VAN TEKSTEN KAN DIENEN ALS BRON OF REFERENTIE VOOR STUDIES OP DEZE GEBIEDEN. (Dutch)
    17 December 2021
    0 references
    L'OBIETTIVO GENERALE DEL PROGETTO È QUELLO DI RACCOGLIERE, ANALIZZARE E DIFFONDERE UN CORPUS PARALLELO DI ANTICO INGLESE CONTEMPORANEO CON IL QUALE EFFETTUARE STUDI LINGUISTICI E LINGUISTICI DI CORPUS. IL CORPUS È LUCIDO, LEMATIZZATO, ANNOTATO ED ETICHETTATO NELLA SUA PARTE ANGLOSASSONE, CHE COMPRENDE CIRCA 50.000 PAROLE DI TESTI IN PROSA RAPPRESENTATIVI. LA METODOLOGIA DEL PROGETTO SI BASA SULLA RACCOLTA, L'ARCHIVIAZIONE, L'ANALISI E LA DIFFUSIONE DEL LINGUAGGIO REALE CON IL SOFTWARE DELLA BANCA DATI; LA PROGETTAZIONE E L'ATTUAZIONE DEL CORPUS GUIDATO DALLE CONCLUSIONI DELLA COMPILAZIONE DI UN CORPUS PILOTA; MASSIMIZZAZIONE DELLA LEMATIZZAZIONE AUTOMATICA, ETICHETTATURA E ANNOTAZIONE; FEEDBACK DALL'ANALISI MANUALE DEL CORPUS ALLE BANCHE DATI E AL LEMATISER; E LA DIFFUSIONE DEI RISULTATI IN UN ACCESSO APERTO. IL PROGETTO MIRA A CONTRIBUIRE ALLA LINGUISTICA DE CORPUS, IN QUANTO NON È CONSUETUDINE RACCOGLIERE CORPI ALLINEATI DIACRONICOS E, SOPRATTUTTO, SI PROPONE UN METODO DI ALLINEAMENTO BASATO SUL LESSICO DERIVATO; II) IL CORPUS IN LINGUA INGLESE, IN QUANTO NON ESISTE UN CORPUS PARALLELO LEMATISED E GLOSSED WORD FOR WORD; III) LA LESSICOGRAFIA ELETTRONICA, IN QUANTO VIENE PROPOSTO UN METODO DI ALIMENTAZIONE DEL CORPUS BASATO SU BASI DI CONOSCENZA; IV) LA LESSICOGRAFIA DEL VECCHIO INGLESE, TRATTANDOSI DI QUESTIONI DI VARIAZIONE ORTOGRAFICA E FLESSIVA ATTRIBUIBILI ALLA DIVERSITÀ TEMPORALE, GEOGRAFICA E TESTUALE, AGLI ASPETTI DELLA STANDARDIZZAZIONE E ALLA LEMATIZACION AUTOMATICA E SEMIAUTOMATICA; (V) INTERNET DI TERZA GENERAZIONE, CONSIDERANDO CHE I RISULTATI DELL'ANALISI LINGUISTICA CON BANCA DATI COSTITUISCONO DATI STRUTTURATI, CON LA POSSIBILITÀ DI ESSERE PRESENTATI COME DATI COLLEGATI; (VI) LE DISCIPLINE UMANISTICHE DIGITALI, TENENDO CONTO DEL FATTO CHE SARÀ SVILUPPATA UN'INTERFACCIA UTENTE ONLINE CHE OFFRA IL TESTO PARALLELO CON LA TRADUZIONE PAROLA PER PAROLA E FRAMMENTARIA, NONCHÉ LA CORRISPONDENZA E IL MIGLIORAMENTO, E CONSENTA LA RICERCA DI INFORMAZIONI SULL'ETICHETTATURA E L'ANNOTAZIONE PER MOTTO E IN MODO FLESSIBILE; E (VII) NON SOLO GLI STUDI LINGUISTICI DELL'INGLESE ANTICO, MA ANCHE GLI STUDI LETTERARI E CULTURALI PERCHÉ L'ANALISI E LA TRADUZIONE DEI TESTI POSSONO SERVIRE DA FONTE O RIFERIMENTO PER GLI STUDI DI QUESTI CAMPI. (Italian)
    16 January 2022
    0 references
    ΣΤΌΧΟΣ ΑΥΤΟΎ ΤΟΥ ΈΡΓΟΥ ΕΊΝΑΙ Η ΣΥΛΛΟΓΉ, Η ΑΝΆΛΥΣΗ ΚΑΙ Η ΠΡΟΣΦΟΡΆ ΕΝΌΣ ΠΑΡΆΛΛΗΛΟΥ ΑΓΓΛΙΚΟΎ-ΣΎΓΧΡΟΝΟΥ ΑΓΓΛΙΚΟΎ CORPUS, ΕΥΘΥΓΡΑΜΜΙΣΜΈΝΟΥ ΣΕ ΕΠΊΠΕΔΟ ΛΈΞΕΩΝ, ΒΆΣΕΙ ΤΩΝ ΟΠΟΊΩΝ ΜΠΟΡΟΎΝ ΝΑ ΔΙΕΞΑΧΘΟΎΝ ΜΕΛΈΤΕΣ ΣΤΗΝ ΠΑΛΙΆ ΓΛΏΣΣΑ ENGILSH ΚΑΙ ΣΤΗΝ CORPUS ΓΛΩΣΣΟΛΟΓΊΑ. ΤΟ ΣΏΜΑ ΠΡΈΠΕΙ ΝΑ ΕΊΝΑΙ ΣΤΙΛΠΝΌ, ΛΕΜΜΑΤΟΠΟΙΗΜΈΝΟ, ΜΕ ΕΤΙΚΈΤΑ ΚΑΙ ΣΧΟΛΙΑΣΜΌ ΣΤΟ ΑΓΓΛΟΣΑΞΟΝΙΚΌ ΤΜΉΜΑ ΤΟΥ, ΤΟ ΟΠΟΊΟ ΠΕΡΙΛΑΜΒΆΝΕΙ ΠΕΡΊΠΟΥ 50.000 ΛΈΞΕΙΣ ΑΠΌ ΑΝΤΙΠΡΟΣΩΠΕΥΤΙΚΆ ΚΕΊΜΕΝΑ ΠΕΖΏΝ. Η ΜΕΘΟΔΟΛΟΓΊΑ ΤΗΣ ΈΡΕΥΝΑΣ ΒΑΣΊΖΕΤΑΙ ΣΤΗ ΣΥΛΛΟΓΉ, ΑΠΟΘΉΚΕΥΣΗ, ΑΝΆΛΥΣΗ ΚΑΙ ΔΙΆΔΟΣΗ ΠΡΑΓΜΑΤΙΚΉΣ ΓΛΏΣΣΑΣ ΜΕ ΛΟΓΙΣΜΙΚΌ ΒΆΣΕΩΝ ΔΕΔΟΜΈΝΩΝ· ΤΟΝ ΣΧΕΔΙΑΣΜΌ ΚΑΙ ΤΗΝ ΕΦΑΡΜΟΓΉ ΜΕ ΓΝΏΜΟΝΑ ΤΑ ΣΥΜΠΕΡΆΣΜΑΤΑ ΠΟΥ ΣΥΝΉΧΘΗΣΑΝ ΜΕΤΆ ΤΗ ΔΗΜΙΟΥΡΓΊΑ ΕΝΌΣ ΠΙΛΟΤΙΚΟΎ ΣΏΜΑΤΟΣ· ΤΗ ΜΕΓΙΣΤΟΠΟΊΗΣΗ ΤΗΣ ΑΥΤΌΜΑΤΗΣ ΑΠΟΛΈΠΙΣΗΣ, ΣΉΜΑΝΣΗΣ ΚΑΙ ΣΧΟΛΙΑΣΜΟΎ· ΤΗΝ ΑΝΑΤΡΟΦΟΔΌΤΗΣΗ ΤΩΝ ΒΆΣΕΩΝ ΔΕΔΟΜΈΝΩΝ ΚΑΙ ΤΟΥ LEMMATIZER ΜΕ ΤΙΣ ΠΛΗΡΟΦΟΡΊΕΣ ΠΟΥ ΣΥΓΚΕΝΤΡΏΘΗΚΑΝ ΜΕ ΧΕΙΡΟΚΊΝΗΤΗ ΑΝΆΛΥΣΗ· ΚΑΙ ΤΗ ΔΙΆΔΟΣΗ ΤΩΝ ΑΠΟΤΕΛΕΣΜΆΤΩΝ ΌΣΟΝ ΑΦΟΡΆ ΤΗΝ ΑΝΟΙΚΤΉ ΠΡΌΣΒΑΣΗ. ΚΑΤ’ ΑΥΤΌΝ ΤΟΝ ΤΡΌΠΟ, ΤΟ ΈΡΓΟ ΠΡΟΤΊΘΕΤΑΙ ΝΑ ΣΥΜΒΆΛΕΙ ΣΤΗ ΓΛΩΣΣΟΛΟΓΊΑ ΤΟΥ ΣΏΜΑΤΟΣ, ΔΕΔΟΜΈΝΟΥ ΌΤΙ ΠΡΟΤΕΊΝΕΤΑΙ ΜΙΑ ΜΈΘΟΔΟΣ ΕΥΘΥΓΡΆΜΜΙΣΗΣ ΜΕ ΒΆΣΗ ΤΟ ΠΑΡΆΓΩΓΟ ΛΕΞΙΛΌΓΙΟ· ΑΓΓΛΙΚΆ CORPUS ΓΛΩΣΣΟΛΟΓΊΑ, ΕΠΕΙΔΉ ΚΑΝΈΝΑ ΣΏΜΑ ΑΥΤΉΣ ΤΗΣ ΓΛΏΣΣΑΣ ΕΊΝΑΙ ΔΙΑΘΈΣΙΜΟ ΠΟΥ ΠΕΡΙΈΧΕΙ ΛΕΜΜΆ, ΓΥΑΛΙΣΤΕΡΆ ΚΑΙ ΛΈΞΗ ΜΕ ΤΗ ΛΈΞΗ ΕΥΘΥΓΡΆΜΜΙΣΗ? ΗΛΕΚΤΡΟΝΙΚΉ ΛΕΞΙΚΟΓΡΑΦΊΑ, ΔΕΔΟΜΈΝΟΥ ΌΤΙ ΑΝΑΠΤΎΣΣΕΤΑΙ ΜΈΘΟΔΟΣ ΓΙΑ ΤΗ ΣΊΤΙΣΗ ΠΑΡΆΛΛΗΛΩΝ ΣΩΜΆΤΩΝ ΜΕ ΒΆΣΕΙΣ ΓΝΏΣΕΩΝ· Η ΠΑΛΑΙΆ ΑΓΓΛΙΚΉ ΛΕΞΙΚΟΓΡΑΦΊΑ, ΕΠΕΙΔΉ ΕΞΕΤΆΖΟΝΤΑΙ ΕΡΩΤΉΣΕΙΣ ΠΟΥ ΣΧΕΤΊΖΟΝΤΑΙ ΜΕ ΤΗΝ ΟΡΘΟΓΡΑΦΊΑ ΚΑΙ ΤΗ ΜΟΡΦΟΛΟΓΙΚΉ ΔΙΑΚΎΜΑΝΣΗ ΠΟΥ ΑΠΟΔΊΔΕΤΑΙ ΣΤΟ ΧΡΟΝΙΚΌ ΔΙΆΣΤΗΜΑ, ΤΗΝ ΟΜΑΛΟΠΟΊΗΣΗ, ΚΑΘΏΣ ΚΑΙ ΤΟΝ ΑΥΤΌΜΑΤΟ ΚΑΙ ΗΜΙΑΥΤΌΜΑΤΟ ΛΕΜΜΑΤΙΣΜΌ· ΤΟ ΔΙΑΔΊΚΤΥΟ ΤΡΊΤΗΣ ΓΕΝΙΆΣ, ΔΕΔΟΜΈΝΟΥ ΌΤΙ ΤΑ ΑΠΟΤΕΛΈΣΜΑΤΑ ΤΗΣ ΓΛΩΣΣΙΚΉΣ ΑΝΆΛΥΣΗΣ ΜΕ ΒΆΣΕΙΣ ΔΕΔΟΜΈΝΩΝ ΑΝΤΙΠΡΟΣΩΠΕΎΟΥΝ ΔΟΜΗΜΈΝΑ ΔΕΔΟΜΈΝΑ ΤΑ ΟΠΟΊΑ, ΕΠΙΠΛΈΟΝ, ΜΠΟΡΟΎΝ ΝΑ ΠΑΡΟΥΣΙΑΣΤΟΎΝ ΩΣ ΣΥΝΔΕΔΕΜΈΝΑ ΔΕΔΟΜΈΝΑ· ΨΗΦΙΑΚΈΣ ΑΝΘΡΩΠΙΣΤΙΚΈΣ ΕΠΙΣΤΉΜΕΣ, ΜΌΛΙΣ Η ΕΠΙΓΡΑΜΜΙΚΉ ΔΙΕΠΑΦΉ ΧΡΉΣΤΗ ΠΡΟΣΦΈΡΕΙ ΤΟ ΠΑΡΆΛΛΗΛΟ ΚΕΊΜΕΝΟ, ΤΗ ΛΈΞΗ ΜΕ ΛΈΞΗ GLOSS, ΤΗ ΜΕΤΆΦΡΑΣΗ, ΤΗΝ ΕΥΘΥΓΡΆΜΜΙΣΗ ΚΑΙ ΤΗΝ ΕΠΙΣΉΜΑΝΣΗ, ΚΑΙ ΕΠΙΤΡΈΠΕΙ ΤΗΝ ΑΝΑΖΉΤΗΣΗ ΕΤΙΚΕΤΏΝ ΚΑΙ ΣΧΟΛΙΑΣΜΟΎ ΜΕ ΛΉΜΜΑ ΚΑΙ INFLECTIONAL ΜΟΡΦΉ· ΚΑΙ ΤΑ ΠΑΛΑΙΆ ΑΓΓΛΙΚΆ, ΣΥΜΠΕΡΙΛΑΜΒΑΝΟΜΈΝΩΝ ΌΧΙ ΜΌΝΟ ΤΗΣ ΓΛΩΣΣΟΛΟΓΊΑΣ, ΑΛΛΆ ΚΑΙ ΤΗΣ ΛΟΓΟΤΕΧΝΊΑΣ ΚΑΙ ΤΩΝ ΠΟΛΙΤΙΣΤΙΚΏΝ ΣΠΟΥΔΏΝ, ΔΕΔΟΜΈΝΟΥ ΌΤΙ ΤΑ ΚΕΊΜΕΝΑ ΚΑΙ ΟΙ ΜΕΤΑΦΡΆΣΕΙΣ ΤΟΥΣ ΜΠΟΡΟΎΝ ΝΑ ΧΡΗΣΙΜΟΠΟΙΗΘΟΎΝ ΓΙΑ ΠΗΓΈΣ ΓΙΑ ΔΙΆΦΟΡΟΥΣ ΤΟΜΕΊΣ ΚΑΙ ΠΡΟΣΕΓΓΊΣΕΙΣ. (Greek)
    18 August 2022
    0 references
    FORMÅLET MED DETTE PROJEKT ER AT KOMPILERE, ANALYSERE OG TILBYDE EN PARALLEL KORPUS GAMMEL ENGELSK-MODERNE ENGELSK, TILPASSET PÅ ORDNIVEAU, PÅ GRUNDLAG AF HVILKET STUDIER I GAMMEL ENGILSH LINGVISTIK OG CORPUS LINGVISTIK KAN GENNEMFØRES. KORPUSET SKAL VÆRE BLANKT, LEMMATISERET, MÆRKET OG KOMMENTERET I DET ANGELSAKSISKE SEGMENT, SOM BESTÅR AF OMKRING 50.000 ORD FRA REPRÆSENTATIVE PROSATEKSTER. FORSKNINGSMETODOLOGIEN ER BASERET PÅ INDSAMLING, LAGRING, ANALYSE OG FORMIDLING AF RIGTIGE SPROG MED DATABASESOFTWARE. UDFORMNING OG GENNEMFØRELSE PÅ GRUNDLAG AF DE KONKLUSIONER, DER BLEV DRAGET EFTER OPRETTELSEN AF ET PILOTPROJEKT MAKSIMERING AF AUTOMATISK LEMMATISERING, MÆRKNING OG ANMÆRKNING FEEDBACK FRA DATABASERNE OG LEMMATIZER MED DE OPLYSNINGER, DER ER INDSAMLET VED MANUEL ANALYSE OG FORMIDLING AF RESULTATER I FORBINDELSE MED FRI ADGANG. PROJEKTET HAR SÅLEDES TIL FORMÅL AT BIDRAGE TIL CORPUS-LINGVISTIK, DA DER FORESLÅS EN TILPASNINGSMETODE BASERET PÅ DET AFLEDTE LEKSIKON. ENGELSK CORPUS LINGVISTIK, FORDI INGEN KORPUS AF DETTE SPROG ER TILGÆNGELIG, DER INDEHOLDER LEMMAS, GLANS OG ORD FOR ORD JUSTERING; ELEKTRONISK LEKSIKOGRAFI, DA DER ER UDVIKLET EN METODE TIL FODRING AF PARALLELLE KORPORA MED VIDENBASER GAMMEL ENGELSK LEKSIKOGRAFI, FORDI DER BEHANDLES SPØRGSMÅL, DER HAR AT GØRE MED STAVNING OG MORFOLOGISKE VARIATIONER, DER KAN TILSKRIVES TIDSHORISONTEN, NORMALISERING SAMT AUTOMATISK OG HALVAUTOMATISK LEMMATISERING; TREDJEGENERATIONSINTERNET, EFTERSOM RESULTATERNE AF SPROGLIGE ANALYSER MED DATABASER UDGØR STRUKTUREREDE DATA, DER DESUDEN KAN PRÆSENTERES SOM SAMMENKÆDEDE DATA; DIGITALE HUMANIORA, NÅR ONLINEBRUGERGRÆNSEFLADEN TILBYDER DEN PARALLELLE TEKST, ORD FOR ORD, OVERSÆTTELSE, TILPASNING OG FREMHÆVNING OG GØR DET MULIGT AT SØGE EFTER MÆRKNING OG ANNOTATION VED HJÆLP AF LEMMA OG INFLEKTERENDE FORM OG GAMMELT ENGELSK, HERUNDER IKKE KUN LINGVISTIK, MEN OGSÅ LITTERATUR OG KULTURELLE STUDIER, DA TEKSTERNE OG OVERSÆTTELSERNE HERAF KAN BRUGES TIL KILDER TIL FORSKELLIGE OMRÅDER OG TILGANGE. (Danish)
    18 August 2022
    0 references
    HANKKEEN TAVOITTEENA ON KOOTA, ANALYSOIDA JA TARJOTA RINNAKKAIN VANHAA ENGLANNINKIELISTÄ NYKY-ENGLANTIA, JOKA VASTAA SANATASOA JA JONKA PERUSTEELLA VOIDAAN SUORITTAA VANHAN ENGILSHIN KIELITIETEEN JA CORPUS-KIELEN OPINTOJA. CORPUS ON KIILTÄVÄ, LEMMATISOITU, MERKITTY JA SELITETTY SEN ANGLOSAKSISESSA SEGMENTISSÄ, JOKA KOOSTUU NOIN 50 000 SANASTA EDUSTAVISTA PROOSATEKSTEISTÄ. TUTKIMUSMENETELMÄT PERUSTUVAT TODELLISEN KIELEN KERÄÄMISEEN, TALLENTAMISEEN, ANALYSOINTIIN JA LEVITTÄMISEEN TIETOKANTAOHJELMISTOLLA; SUUNNITTELU JA TÄYTÄNTÖÖNPANO PILOTTIRYHMÄN PERUSTAMISEN JÄLKEEN TEHTYJEN PÄÄTELMIEN MUKAISESTI; AUTOMAATTISEN LEMMATOINNIN, MERKINTÖJEN JA MERKINTÖJEN MAKSIMOINTI; TIETOKANTOJEN JA LEMMATISERIN PALAUTE MANUAALISEN ANALYYSIN AVULLA KERÄTTYJEN TIETOJEN KANSSA; JA TULOSTEN LEVITTÄMINEN AVOIMEN SAATAVUUDEN PUITTEISSA. NÄIN KUVAILLULLA HANKKEELLA PYRITÄÄN EDISTÄMÄÄN CORPUS-KIELEN TUNTEMUSTA, KOSKA EHDOTETAAN JOHDETTUUN SANAKONIIN PERUSTUVAA YHDENMUKAISTAMISMENETELMÄÄ. ENGLANTI CORPUS KIELITIEDE, KOSKA EI OLE SAATAVILLA KORPUS TÄMÄN KIELEN, JOKA SISÄLTÄÄ LEMMAS, KIILTOA JA SANALLA LINJAUS; ELEKTRONINEN LEKSIKOGRAFIA, KOSKA ON KEHITETTY MENETELMÄ RINNAKKAISEN KORPORAN SYÖTTÄMISEKSI TIETOPOHJIEN AVULLA; VANHA ENGLANNINKIELINEN LEKSIKKYYS, KOSKA SIINÄ KÄSITELLÄÄN KYSYMYKSIÄ, JOTKA LIITTYVÄT AIKAVÄLISTÄ, NORMALISOINNISTA SEKÄ AUTOMAATTISESTA JA PUOLIAUTOMAATTISESTA LEMMATISAATIOSTA JOHTUVAAN OIKEINKIRJOITUKSEEN JA MORFOLOGISEEN VAIHTELUUN; KOLMANNEN SUKUPOLVEN INTERNET, KOSKA TIETOKANTOJEN KANSSA TEHDYN KIELIANALYYSIN TULOKSET OVAT JÄSENNELTYJÄ TIETOJA, JOTKA VOIDAAN LISÄKSI ESITTÄÄ LINKITETTYINÄ TIETOINA; DIGITAALISET HUMANISTISET TIETEET, KUN VERKKOKÄYTTÖLIITTYMÄ TARJOAA RINNAKKAISEN TEKSTIN, SANAKIILTOISEN SANAN, KÄÄNNÖKSEN, LINJAUKSEN JA KOROSTUKSEN SEKÄ MAHDOLLISTAA TUNNISTEIDEN JA MERKINTÖJEN ETSIMISEN LEMMAN JA TAIVUTUSMUODON AVULLA; JA VANHAA ENGLANTIA, MUKAAN LUKIEN KIELITIETEEN LISÄKSI MYÖS KIRJALLISUUS- JA KULTTUURIOPINNOT, KOSKA TEKSTEJÄ JA NIIDEN KÄÄNNÖKSIÄ VOIDAAN KÄYTTÄÄ ERI ALOJEN JA LÄHESTYMISTAPOJEN LÄHTEINÄ. (Finnish)
    18 August 2022
    0 references
    L-GĦAN TA’ DAN IL-PROĠETT HUWA L-KOMPILAZZJONI, L-ANALIZZA U L-OFFERTA TA’ INGLIŻ ANTIK INGLIŻ KONTEMPORANJU BL-INGLIŻ PARALLEL, ALLINJAT FIL-LIVELL TAL-KLIEM, LI FUQ IL-BAŻI TIEGĦU JISTGĦU JSIRU STUDJI FIL-LINGWISTIKA ENGILSH U L-CORPUS LINGUISTICS ANTIKI. IL-CORPUS GĦANDU JKUN TLEQQ, LEMMATIZZAT, ITTIKKETTAT U ANNOTAT FIS-SEGMENT ANGLO-SASSONI TIEGĦU, LI JINKLUDI MADWAR 50,000 KELMA MINN TESTI RAPPREŻENTATTIVI TAL-PROŻA. IL-METODOLOĠIJA TAR-RIĊERKA HIJA BBAŻATA FUQ IL-ĠBIR, IL-ĦAŻNA, L-ANALIŻI U T-TIXRID TA’ LINGWA REALI B’SOFTWER TAL-BAŻI TAD-DATA; IT-TFASSIL U L-IMPLIMENTAZZJONI GGWIDATI MILL-KONKLUŻJONIJIET MILĦUQA WARA L-ĦOLQIEN TA’ KORP PILOTA; IL-MASSIMIZZAZZJONI TAL-LUMMATIZZAZZJONI AWTOMATIKA, IT-TIKKETTAR U L-ANNOTAZZJONI; IL-FEEDBACK TAL-BAŻIJIET TAD-DATA U TAL-LEMMATIZER BL-INFORMAZZJONI MIĠBURA B’ANALIŻI MANWALI; U T-TIXRID TAR-RIŻULTATI F’AĊĊESS MIFTUĦ. DESKRITT B’DAN IL-MOD, IL-PROĠETT GĦANDU L-ĦSIEB LI JIKKONTRIBWIXXI GĦALL-CORPUS LINGUISTICS, PERESS LI QED JIĠI PROPOST METODU TA’ ALLINJAMENT IBBAŻAT FUQ IL-LEXICON DERIVAT; KORP LINGWISTIKU INGLIŻ, MINĦABBA LI L-EBDA KORP TA’ DIN IL-LINGWA MA HUWA DISPONIBBLI LI FIH LEMMI, GLOSSES U ALLINJAMENT KELMA B’KELMA; IL-LEXICOGRAPHY ELETTRONIKA, PERESS LI JIĠI ŻVILUPPAT METODU GĦALL-ALIMENTAZZJONI TA’ CORPORA PARALLELA MA’ BAŻIJIET TA’ GĦARFIEN; IL-LEXICOGRAPHY ANTIKA INGLIŻA, MINĦABBA LI JIĠU INDIRIZZATI MISTOQSIJIET LI GĦANDHOM X’JAQSMU MAL-ORTOGRAFIJA U L-VARJAZZJONI MORFOLOĠIKA ATTRIBWIBBLI GĦAT-TUL TA’ ŻMIEN, IN-NORMALIZZAZZJONI KIF UKOLL IL-LUMMATIZZAZZJONI AWTOMATIKA U SEMIAWTOMATIKA; INTERNET TAT-TIELET ĠENERAZZJONI, PERESS LI R-RIŻULTATI TAL-ANALIŻI LINGWISTIKA B’DATABASES JIRRAPPREŻENTAW DATA STRUTTURATA LI, BARRA MINN HEKK, TISTA’ TIĠI PPREŻENTATA BĦALA DATA LLINKJATA; L-ISTUDJI UMANISTIĊI DIĠITALI, LADARBA L-INTERFAĊĊA TAL-UTENT ONLINE TOFFRI T-TEST PARALLEL, IT-TLEQQIJA KELMA B’KELMA, IT-TRADUZZJONI, L-ALLINJAMENT U L-ENFASI, U TIPPERMETTI TFITTXIJIET GĦALL-IMMARKAR U L-ANNOTAZZJONI PERMEZZ TA’ LEMMA U FORMA INFLECTIONAL; U L-INGLIŻ ANTIK, INKLUŻI MHUX BISS IL-LINGWISTIKA, IŻDA WKOLL IL-LETTERATURA U L-ISTUDJI KULTURALI, PERESS LI T-TESTI U T-TRADUZZJONIJIET TAGĦHOM JISTGĦU JINTUŻAW GĦAL SORSI GĦAL DIVERSI OQSMA U APPROĊĊI. (Maltese)
    18 August 2022
    0 references
    ŠĀ PROJEKTA MĒRĶIS IR APKOPOT, ANALIZĒT UN PIEDĀVĀT PARALĒLU KORPUSU VECO ANGĻU-LAIKMETĪGO ANGĻU VALODU, KAS SASKAŅOTA VĀRDU LĪMENĪ, PAMATOJOTIES UZ KURU VAR VEIKT PĒTĪJUMUS VECĀ ENGILSH VALODNIECĪBĀ UN CORPUS VALODNIECĪBĀ. KORPUSAM JĀBŪT SPĪDĪGAM, LEMMATIZĒTAM, MARĶĒTAM UN ANOTĒTAM TĀ ANGLOSAKŠU SEGMENTĀ, KURĀ IR APTUVENI 50 000 VĀRDU NO REPREZENTATĪVIEM PROZAS TEKSTIEM. PĒTĪJUMU METODOLOĢIJAS PAMATĀ IR REĀLAS VALODAS VĀKŠANA, UZGLABĀŠANA, ANALĪZE UN IZPLATĪŠANA AR DATUBĀZES PROGRAMMATŪRU; IZSTRĀDI UN ĪSTENOŠANU, PAMATOJOTIES UZ SECINĀJUMIEM, KAS IZDARĪTI PĒC IZMĒĢINĀJUMA KORPUSA IZVEIDES; AUTOMĀTISKAS LEMMATIZĀCIJAS, IEZĪMĒŠANAS UN ANOTĀCIJAS MAKSIMIZĒŠANA; DATUBĀZU UN LEMMATIZATORA ATGRIEZENISKO SAITI AR MANUĀLU ANALĪZI SAVĀKTO INFORMĀCIJU; UN REZULTĀTU IZPLATĪŠANAI, NODROŠINOT ATKLĀTU PIEKĻUVI. TĀDĒJĀDI APRAKSTĪTS, KA PROJEKTA MĒRĶIS IR SNIEGT IEGULDĪJUMU KORPUSA VALODNIECĪBĀ, ŅEMOT VĒRĀ, KA IR IEROSINĀTA UZ ATVASINĀTU LEKSIKONU BALSTĪTA PIELĀGOŠANAS METODE; ANGĻU CORPUS VALODNIECĪBA, JO NAV PIEEJAMS NEVIENS ŠĪS VALODAS KORPUSS, KAS SATUR LEMMAS, SPĪDUMUS UN VĀRDU PĒC VĀRDA IZLĪDZINĀŠANAS; ELEKTRONISKĀ LEKSIKOGRĀFIJA, JO TIEK IZSTRĀDĀTA PARALĒLO KORPUSU BAROŠANAS METODE AR ZINĀŠANU BĀZĒM; VECĀ ANGĻU LEKSIKOGRĀFIJA, JO TIEK RISINĀTI JAUTĀJUMI, KAS SAISTĪTI AR PAREIZRAKSTĪBU UN MORFOLOĢISKĀM VARIĀCIJĀM, KAS SAISTĪTAS AR LAIKA POSMU, NORMALIZĒŠANU, KĀ ARĪ AUTOMĀTISKU UN PUSAUTOMĀTISKU LEMMATIZĀCIJU; TREŠĀS PAAUDZES INTERNETS, ŅEMOT VĒRĀ, KA LINGVISTISKĀS ANALĪZES REZULTĀTI AR DATU BĀZĒM IR STRUKTURĒTI DATI, KURUS TURKLĀT VAR UZRĀDĪT KĀ SAISTĪTUS DATUS; DIGITĀLĀS HUMANITĀRĀS ZINĀTNES, KAD TIEŠSAISTES LIETOTĀJA SASKARNE PIEDĀVĀ PARALĒLU TEKSTU, VĀRDU AR VĀRDU SPĪDUMU, TULKOJUMU, IZLĪDZINĀŠANU UN IZCELŠANU, KĀ ARĪ ĻAUJ MEKLĒT MARĶĒJUMUS UN ANOTĀCIJU PĒC LEMMAS UN GRAFISKĀ FORMĀ; UN VECĀ ANGĻU VALODA, TOSTARP NE TIKAI VALODNIECĪBA, BET ARĪ LITERATŪRA UN KULTŪRAS STUDIJAS, ŅEMOT VĒRĀ, KA TEKSTUS UN TO TULKOJUMUS VAR IZMANTOT DAŽĀDU JOMU UN PIEEJU AVOTIEM. (Latvian)
    18 August 2022
    0 references
    CIEĽOM TOHTO PROJEKTU JE ZOSTAVIŤ, ANALIZOVAŤ A PONÚKNUŤ PARALELNÚ KORPUS STARÚ ANGLICKY-SÚČASNÚ ANGLIČTINU, ZOSÚLADENÚ NA ÚROVNI SLOV, NA ZÁKLADE KTOREJ MOŽNO USKUTOČNIŤ ŠTÚDIUM STAREJ ENGILSHOVEJ LINGVISTIKY A KORPUSOVEJ LINGVISTIKY. KORPUS MUSÍ BYŤ LESKNUTÝ, LEMATIZOVANÝ, OZNAČENÝ A ANOTOVANÝ VO SVOJOM ANGLOSASKOM SEGMENTE, KTORÝ OBSAHUJE PRIBLIŽNE 50 000 SLOV Z REPREZENTATÍVNYCH TEXTOV PRÓZY. METODIKA VÝSKUMU JE ZALOŽENÁ NA ZHROMAŽĎOVANÍ, UCHOVÁVANÍ, ANALÝZE A ŠÍRENÍ REÁLNEHO JAZYKA POMOCOU DATABÁZOVÉHO SOFTVÉRU; NÁVRH A VYKONÁVANIE V SÚLADE SO ZÁVERMI, KU KTORÝM SA DOSPELO PO VYTVORENÍ PILOTNÉHO KORPUSU; MAXIMALIZÁCIA AUTOMATICKEJ LEMMATIZÁCIE, OZNAČOVANIA A ANOTÁCIE; SPÄTNÚ VÄZBU DATABÁZ A LEMATIZÁTORA S INFORMÁCIAMI ZÍSKANÝMI MANUÁLNOU ANALÝZOU; A ŠÍRENIE VÝSLEDKOV V RÁMCI OTVORENÉHO PRÍSTUPU. TAKTO OPÍSANÝ PROJEKT MÁ V ÚMYSLE PRISPIEŤ K LINGVISTIKE KORPUSU VZHĽADOM NA TO, ŽE SA NAVRHUJE METÓDA ZOSÚLADENIA ZALOŽENÁ NA ODVODENOM LEXIKÓNE; ANGLICKÝ KORPUS LINGVISTIKA, PRETOŽE NIE JE K DISPOZÍCII ŽIADNY KORPUS TOHTO JAZYKA, KTORÝ OBSAHUJE LEMMY, LESKY A SLOVO ZAROVNANÍM SLOVA; ELEKTRONICKÁ LEXIKOGRAFIA, PRETOŽE SA VYVÍJA METÓDA KŔMENIA PARALELNÝCH KORPUSOV VEDOMOSTNÝMI ZÁKLADŇAMI; STAREJ ANGLICKEJ LEXIKOGRAFIE, PRETOŽE SA RIEŠIA OTÁZKY, KTORÉ SÚVISIA S PRAVOPISOM A MORFOLOGICKÝMI VARIÁCIAMI PRIPÍSATEĽNÝMI ČASOVÉMU INTERVALU, NORMALIZÁCII, AKO AJ AUTOMATICKEJ A POLOAUTOMATICKEJ LEMMATIZÁCII; INTERNET TRETEJ GENERÁCIE VZHĽADOM NA TO, ŽE VÝSLEDKY JAZYKOVEJ ANALÝZY S DATABÁZAMI PREDSTAVUJÚ ŠTRUKTÚROVANÉ ÚDAJE, KTORÉ SA NAVYŠE MÔŽU PREZENTOVAŤ AKO PREPOJENÉ ÚDAJE; DIGITÁLNE HUMANITNÉ VEDY, AKONÁHLE ONLINE POUŽÍVATEĽSKÉ ROZHRANIE PONÚKA PARALELNÝ TEXT, SLOVO PODĽA SLOVNÉHO LESKU, PREKLAD, ZAROVNANIE A ZVÝRAZNENIE A UMOŽŇUJE VYHĽADÁVANIE ZNAČKOVANIA A ANOTÁCIE PODĽA LEMMY A INFLEKČNEJ FORMY; A STAREJ ANGLIČTINY VRÁTANE NIELEN LINGVISTIKY, ALE AJ LITERATÚRY A KULTÚRNYCH ŠTÚDIÍ, KEĎŽE TEXTY A ICH PREKLADY MOŽNO POUŽIŤ AKO ZDROJE PRE RÔZNE OBLASTI A PRÍSTUPY. (Slovak)
    18 August 2022
    0 references
    IS É AIDHM AN TIONSCADAIL SEO NÁ SEAN-BHÉARLA COMHAIMSEARTHA CORPAIS A CHUR LE CHÉILE, A AIBHSIÚ AGUS A THAIRISCINT, ATÁ AILÍNITHE AR LEIBHÉAL FOCAL, AGUS AR AN MBONN GUR FÉIDIR STAIDÉAR A DHÉANAMH AR AN SEAN-THEANGEOLAÍOCHT ENGILSH AGUS AR AN TEANGEOLAÍOCHT CHORPAIS. BEIDH AN CORPAS SNASTA, LMMATAITHE, CLIBEÁILTE AGUS ANÓTÁILTE INA DHEIGHLEOG ANGLA-SHACSANACH, INA BHFUIL THART AR 50,000 FOCAL Ó THÉACSANNA PRÓS IONADAÍOCHA. TÁ MODHEOLAÍOCHT AN TAIGHDE BUNAITHE AR BHAILIÚ, STÓRÁIL, ANAILÍSIÚ AGUS SCAIPEADH FÍORTHEANGA LE BOGEARRAÍ BUNACHAR SONRAÍ; AN DEARADH AGUS AN CUR CHUN FEIDHME FAOI THREOIR NA GCONCLÚIDÍ AR THÁNGTHAS ORTHU TAR ÉIS CORPAS PÍOLÓTACH A CHRUTHÚ; LEMMATÚ UATHOIBRÍOCH, CLIBEÁIL AGUS ANÓTÁIL A UASMHÉADÚ; AISEOLAS NA MBUNACHAR SONRAÍ AGUS AN LEMMATIZER LEIS AN BHFAISNÉIS A BAILÍODH LE HANAILÍS LÁIMHE; AGUS SCAIPEADH NA DTORTHAÍ MAIDIR LE ROCHTAIN OSCAILTE. AR AN GCAOI SIN, TÁ SÉ BEARTAITHE AG AN TIONSCADAL CUR LE TEANGEOLAÍOCHT CHORPAIS, ÓS RUD É GO BHFUIL MODH AILÍNITHE BUNAITHE AR AN LEXICON DÍORTHAITHE BEARTAITHE; TEANGEOLAÍOCHT CHORPAIS AN BHÉARLA, TOISC NACH BHFUIL AON CHORPAS DEN TEANGA SIN AR FÁIL INA BHFUIL LEMMAS, SNASTA AGUS FOCAIL TRÍ AILÍNIÚ FOCAL; FOCLÓIREACHT LEICTREONACH, ÓS RUD É GO BHFORBRAÍTEAR MODH CHUN CORPAIS CHOMHTHREOMHARA A BHEATHÚ LE BOINN EOLAIS; SEANFHOCLÓIREACHT BHÉARLA, TOISC GO DTUGTAR AGHAIDH AR CHEISTEANNA A BHAINEANN LE LITRIÚ AGUS ÉAGSÚLACHT MHOIRFEOLAÍOCH ATÁ INCHURTHA I LEITH AN TRÉIMHSE AMA, NORMALÚ CHOMH MAITH LE LEMMATÚ UATHOIBRÍOCH AGUS LEATH-UATHOIBRÍOCH; AN TRÍÚ GLÚIN DEN IDIRLÍON, ÓS RUD É GUR SONRAÍ STRUCHTÚRTHA IAD TORTHAÍ NA HANAILÍSE TEANGA LE BUNACHAIR SONRAÍ, AR SONRAÍ IAD IS FÉIDIR, THAIRIS SIN, A CHUR I LÁTHAIR MAR SHONRAÍ NASCTHA; NA DAONNACHTAÍ DIGITEACHA, A LUAITHE A BHEIDH AN TÉACS COMHTHREOMHAR, AN FOCAL DE RÉIR SNAS FOCAL, AN T-AISTRIÚCHÁN, AN T-AILÍNIÚ AGUS AN AIBHSIÚ AR FÁIL SA CHOMHÉADAN ÚSÁIDEORA AR LÍNE, AGUS GO MBEIFEAR IN ANN CUARDACH A DHÉANAMH CHUN CLIBEÁIL AGUS ANÓTÁIL A DHÉANAMH LE LEMMA AGUS LE FOIRM INFHILLTE; AGUS SEAN-BHÉARLA, NÍ HAMHÁIN AN TEANGEOLAÍOCHT, ACH LITRÍOCHT AGUS STAIDÉAR CULTÚRTHA FREISIN, ÓS RUD É GUR FÉIDIR NA TÉACSANNA AGUS NA HAISTRIÚCHÁIN A ÚSÁID LE HAGHAIDH FOINSÍ LE HAGHAIDH RÉIMSÍ AGUS CUIR CHUIGE ÉAGSÚLA. (Irish)
    18 August 2022
    0 references
    CÍLEM TOHOTO PROJEKTU JE SESTAVIT, ANALYZOVAT A NABÍDNOUT PARALELNÍ KORPUS STAROU ANGLIČTINU-SOUČASNOU ANGLIČTINU, SLADĚNOU NA ÚROVNI SLOV, NA JEJÍMŽ ZÁKLADĚ LZE PROVÁDĚT STUDIUM STARÉ ENGILSH LINGVISTIKY A KORPUSOVÉ LINGVISTIKY. KORPUS MUSÍ BÝT GLOSOVÁN, LEMMATIZOVÁN, OZNAČEN A KOMENTOVÁN V ANGLOSASKÉM SEGMENTU, KTERÝ OBSAHUJE PŘIBLIŽNĚ 50 000 SLOV Z REPREZENTATIVNÍCH PRÓZOVÝCH TEXTŮ. METODIKA VÝZKUMU JE ZALOŽENA NA SHROMAŽĎOVÁNÍ, UKLÁDÁNÍ, ANALÝZE A ŠÍŘENÍ SKUTEČNÉHO JAZYKA POMOCÍ DATABÁZOVÉHO SOFTWARU; NÁVRH A PROVÁDĚNÍ NA ZÁKLADĚ ZÁVĚRŮ DOSAŽENÝCH PO VYTVOŘENÍ PILOTNÍHO SOUBORU; MAXIMALIZACE AUTOMATICKÉ LEMMATIZACE, OZNAČOVÁNÍ A ANOTACE; ZPĚTNÉ VAZBY DATABÁZÍ A LEMMATIZÉRU S INFORMACEMI SHROMÁŽDĚNÝMI NA ZÁKLADĚ MANUÁLNÍ ANALÝZY; A ŠÍŘENÍ VÝSLEDKŮ V OBLASTI OTEVŘENÉHO PŘÍSTUPU. TAKTO POPSANÝ PROJEKT MÁ V ÚMYSLU PŘISPĚT K KORPUSOVÉ LINGVISTICE VZHLEDEM K TOMU, ŽE JE NAVRŽENA METODA SLADĚNÍ ZALOŽENÁ NA ODVOZENÉM LEXIKONU; ANGLIČTINA CORPUS LINGVISTIKA, PROTOŽE NENÍ K DISPOZICI ŽÁDNÝ KORPUS TOHOTO JAZYKA, KTERÝ OBSAHUJE LEMMAS, LESKY A SLOVO PODLE SLOV; ELEKTRONICKÁ LEXIKOGRAFIE, PROTOŽE JE VYVINUTA METODA KRMENÍ PARALELNÍCH KORPUSŮ ZNALOSTNÍMI ZÁKLADNAMI; STARÁ ANGLICKÁ LEXIKOGRAFIE, PROTOŽE JSOU ŘEŠENY OTÁZKY, KTERÉ MAJÍ CO DO ČINĚNÍ S PRAVOPISNOU A MORFOLOGICKOU VARIACÍ PŘIČITATELNOU ČASOVÉMU ROZPĚTÍ, NORMALIZACI, JAKOŽ I AUTOMATICKÉ A POLOAUTOMATICKÉ LEMMATIZACI; INTERNET TŘETÍ GENERACE, VZHLEDEM K TOMU, ŽE VÝSLEDKY JAZYKOVÉ ANALÝZY S DATABÁZEMI PŘEDSTAVUJÍ STRUKTUROVANÉ ÚDAJE, KTERÉ NAVÍC MOHOU BÝT PREZENTOVÁNY JAKO PROPOJENÉ ÚDAJE; DIGITÁLNÍ HUMANITNÍ VĚDY, JAKMILE ON-LINE UŽIVATELSKÉ ROZHRANÍ NABÍZÍ PARALELNÍ TEXT, SLOVO PO SLOVĚ LESK, PŘEKLAD, ZAROVNÁNÍ A ZVÝRAZNĚNÍ A UMOŽŇUJE VYHLEDÁVÁNÍ ZNAČEK A POZNÁMEK POMOCÍ LEMMA A INFLEXNÍ FORMY; A STAROU ANGLIČTINU, VČETNĚ NEJEN LINGVISTIKY, ALE TAKÉ LITERATURY A KULTURNÍCH STUDIÍ, VZHLEDEM K TOMU, ŽE TEXTY A JEJICH PŘEKLADY MOHOU BÝT POUŽITY PRO ZDROJE PRO RŮZNÉ OBORY A PŘÍSTUPY. (Czech)
    18 August 2022
    0 references
    Este projecto tem por objectivo a elaboração, a análise e a oferta de um paralelo entre o inglês antigo e o inglês contemporâneo, codificado a nível mundial, com base no qual possam ser realizados estudos sobre o inglês antigo e o inglês antigo. O corpo deve ser fechado, amolecido, etiquetado e anotado no seu segmento de ÂNGLO-Saxão, constituído por 50 000 palavras provenientes de textos representativos da acção. A METODOLOGIA DA INVESTIGAÇÃO É BASEADA NA COLHEITA, ARMAZENAMENTO, ANÁLISE E DIVULGAÇÃO DE LÍNGUAS REAIS COM SOFTWARE DE BASE DE DADOS; A CONCEPÇÃO E A EXECUÇÃO ORIENTADAS PELAS CONCLUSÕES REALIZADAS APÓS A CRIAÇÃO DE UMA CORPO PILOTO; A MAXIMIZAÇÃO DA LEMMATIZAÇÃO AUTOMÁTICA, EQUIPAMENTO E ANOTAÇÃO; A ALIMENTAÇÃO DAS BASES DE DADOS E O LEMMATISER COM AS INFORMAÇÕES ACONDICIONADAS COM ANÁLISE MANUAL; E A DIVULGAÇÃO DOS RESULTADOS NO ACESSO ABERTO. Assim descrito, o projecto destina-se a contribuir para a linguística da CORPUS, tendo em conta que é proposto um método de acondicionamento baseado no LEXÍCONO DERIVADO; ENGLISH CORPUS LINGUISTICS, PORQUE NÃO ESTÁ DISPONÍVEL CORPUS DA PRESENTE LÍNGUA QUE CONTENHA LEMÃS, FOLHAS E PALAVRAS POR ALIGNAÇÃO PALAVRA; LEXICOGRAFIA ELETRÓNICA, DESENVOLVIMENTO DE UM MÉTODO DE ALIMENTAÇÃO DE CORPORA PARALELO COM BASE DE CONHECIMENTO; LEXICOGRAFIA INGLÊS ANTIGA, POR CONSIDERAÇÃO DE QUESTÕES RELATIVAS À ESPANHA E À VARIAÇÃO MORFOLÓGICA ATRIBUÍVEIS AO TEMPO, À NORMALIAÇÃO E À LEMMATIZAÇÃO AUTOMÁTICA E SEMIAUTOMÁTICA; INTERNET DE TERCEIRA GERAÇÃO, TENDO EM CONTA QUE OS RESULTADOS DA ANÁLISE LINGUÍSTICA COM BASE EM DADOS REPRESENTAM DADOS ESTRUTURADOS QUE, MAIS DO QUE, PODEM SER APRESENTADOS COMO DADOS LIGADOS; HUMANIDADES DIGITAIS, APÓS A INTERFACE DO UTILIZADOR EM LINHA OFERECER O TEXTO PARALELO, A PALAVRA GLOSS, A TRADUÇÃO, O ALIGNAMENTO E O DESENVOLVIMENTO, E PERMITIR PESQUISAS DE ENSINO E ANOS POR LEMMA E FORMA INFLECCIONAL; E INGLÊS VELHOS, INCLUINDO NÃO APENAS LINGUÍSTICAS, MAS TAMBÉM LITERATURA E ESTUDOS CULTURAIS, TENDO EM CONTA QUE OS TEXTOS E SUAS TRADUÇÕES PODEM SER UTILIZADOS EM FONTES DE DIVERSOS DOMÍNIOS E MÉTODOS. (Portuguese)
    18 August 2022
    0 references
    PROJEKTI EESMÄRK ON KOOSTADA, ANALÜÜSIDA JA PAKKUDA PARALLEELSET VANA INGLISE-KAASAEGSET INGLISE KEELT, MIS ON JOONDATUD SÕNA TASANDILE, MILLE PÕHJAL SAAB LÄBI VIIA UURINGUID ENGILSHI KEELETEADUSES JA KORPUSLINGVISTIKAS. KORPUS PEAB OLEMA LÄIKIV, LEMMATISEERITUD, MÄRGISTATUD JA SELGITUSTEGA ANGLOSAKSI SEGMENDIS, MIS KOOSNEB UMBES 50 000 SÕNAST PROOSA TEKSTIDEST. TEADUSUURINGUTE METOODIKA PÕHINEB ANDMEBAASITARKVARA ABIL REAALSE KEELE KOGUMISEL, SÄILITAMISEL, ANALÜÜSIMISEL JA LEVITAMISEL; PROJEKTEERIMINE JA RAKENDAMINE, MIS JUHINDUB PÄRAST KATSEKOGU LOOMIST TEHTUD JÄRELDUSTEST; AUTOMAATSE LEMMATISEERIMISE, MÄRGISTAMISE JA ANNOTEERIMISE MAKSIMEERIMINE; ANDMEBAASIDE JA LEMMATISERI TAGASISIDE MANUAALSE ANALÜÜSI KÄIGUS KOGUTUD TEABEGA; NING TULEMUSTE LEVITAMINE AVATUD JUURDEPÄÄSU KAUDU. KIRJELDATUD PROJEKTI EESMÄRK ON AIDATA KAASA KORPUSLINGVISTIKALE, VÕTTES ARVESSE, ET TEHAKSE ETTEPANEK KASUTADA TULETATUD LEKSIKOONIL PÕHINEVAT KOOSKÕLASTUSMEETODIT; INGLISE KORPUSLINGVISTIKA, SEST ÜKSKI SELLE KEELE KORPUS EI OLE KÄTTESAADAV, MIS SISALDAB LEMMAS, LÄIGEID JA SÕNA SÕNA JÄRGI; ELEKTROONILINE LEKSIKOGRAAFIA, KUNA ON VÄLJA TÖÖTATUD TEADMISTEBAASIDEGA PARALLEELSETE KORPORAATIDE SÖÖTMISE MEETOD; VANA INGLISE LEKSIKOGRAAFIA, SEST KÄSITLETAKSE KÜSIMUSI, MIS ON SEOTUD ÕIGEKIRJA JA MORFOLOOGILISTE ERINEVUSTEGA, MIS ON TINGITUD AJAVAHEMIKUST, NORMALISEERIMISEST NING AUTOMAATSEST JA POOLAUTOMAATSEST LEMMATISEERIMISEST; KOLMANDA PÕLVKONNA INTERNET, ARVESTADES, ET ANDMEBAASIDE KEELELISE ANALÜÜSI TULEMUSED KUJUTAVAD ENDAST STRUKTUREERITUD ANDMEID, MIDA SAAB LISAKS ESITADA LINGITUD ANDMETENA; DIGITAALSED HUMANITAARTEADUSED, KUI VEEBIPÕHINE KASUTAJALIIDES PAKUB PARALLEELSET TEKSTI, SÕNA LÄIKIVAT SÕNA, TÕLGET, JOONDAMIST JA ESILETÕSTMIST NING VÕIMALDAB OTSIDA SILDISTAMIST JA ANNOTEERIMIST LEMMA JA KÄÄNULISE VORMI JÄRGI; VANA INGLISE KEEL, SEALHULGAS MITTE AINULT LINGVISTIKA, VAID KA KIRJANDUS- JA KULTUURIUURINGUD, ARVESTADES, ET TEKSTE JA NENDE TÕLKEID SAAB KASUTADA ERINEVATE VALDKONDADE JA LÄHENEMISVIISIDE ALLIKATENA. (Estonian)
    18 August 2022
    0 references
    ENNEK A PROJEKTNEK AZ A CÉLJA, HOGY ÖSSZEÁLLÍTSA, ANALIZÁLJA ÉS FELKÍNÁLJA A PÁRHUZAMOS, RÉGI ANGOL-KORTÁRS ANGOL NYELVTUDÁST, AMELY ALAPJÁN A RÉGI ENGILSH NYELVÉSZETBEN ÉS KORPUSZ NYELVÉSZETBEN TANULMÁNYOKAT LEHET VÉGEZNI. A KORPUSZT AZ ANGOLSZÁSZ SZEGMENSBEN KELL FÉNYESÍTENI, LEMMATIZÁLNI, CÍMKÉZNI ÉS JEGYZETEKKEL ELLÁTNI, AMELY KÖRÜLBELÜL 50 000 SZÓBÓL ÁLL A REPREZENTATÍV PRÓZASZÖVEGEKBŐL. A KUTATÁS MÓDSZERTANA A VALÓS NYELV ADATBÁZISSZOFTVERREL VALÓ ÖSSZEGYŰJTÉSÉN, TÁROLÁSÁN, ELEMZÉSÉN ÉS TERJESZTÉSÉN ALAPUL; A KÍSÉRLETI KORPUSZ LÉTREHOZÁSÁT KÖVETŐEN LEVONT KÖVETKEZTETÉSEK ÁLTAL VEZÉRELT TERVEZÉS ÉS VÉGREHAJTÁS; AZ AUTOMATIKUS LEMMATIZÁLÁS, CÍMKÉZÉS ÉS ANNOTÁCIÓ MAXIMALIZÁLÁSA; AZ ADATBÁZISOK ÉS A LEMMATIZER VISSZAJELZÉSEI A KÉZI ELEMZÉSSEL GYŰJTÖTT INFORMÁCIÓKKAL EGYÜTT; VALAMINT AZ EREDMÉNYEK TERJESZTÉSE A NYÍLT HOZZÁFÉRÉS TERÉN. ENNEK MEGFELELŐEN A PROJEKT HOZZÁ KÍVÁN JÁRULNI A KORPUSZ NYELVÉSZETHEZ, MIVEL A SZÁRMAZTATOTT LEXIKONON ALAPULÓ ÖSSZEHANGOLÁSI MÓDSZERT JAVASOLJÁK; ANGOL CORPUS NYELVÉSZET, MERT NEM ÁLL RENDELKEZÉSRE CORPUS E NYELV ÁLL RENDELKEZÉSRE, AMELY TARTALMAZZA A LEMMAS, FÉNYES ÉS SZÓRÓL SZÓRA IGAZÍTÁS; ELEKTRONIKUS LEXIKOGRÁFIA, MIVEL A PÁRHUZAMOS CORPORA TUDÁSBÁZISOKKAL TÖRTÉNŐ TÁPLÁLÁSÁRA SZOLGÁLÓ MÓDSZERT FEJLESZTETTEK KI; RÉGI ANGOL LEXIKOGRÁFIA, MIVEL OLYAN KÉRDÉSEKKEL FOGLALKOZNAK, AMELYEK AZ IDŐINTERVALLUMNAK, A NORMALIZÁLÁSNAK, VALAMINT AZ AUTOMATIKUS ÉS FÉLAUTOMATA LEMMATIZÁLÁSNAK TULAJDONÍTHATÓ HELYESÍRÁSSAL ÉS MORFOLÓGIAI VARIÁCIÓVAL KAPCSOLATOSAK; HARMADIK GENERÁCIÓS INTERNET, TEKINTETTEL ARRA, HOGY AZ ADATBÁZISOKKAL VÉGZETT NYELVI ELEMZÉS EREDMÉNYEI STRUKTURÁLT ADATOKAT KÉPVISELNEK, AMELYEK RÁADÁSUL ÖSSZEKAPCSOLT ADATKÉNT IS BEMUTATHATÓK; DIGITÁLIS HUMÁN TUDOMÁNYOK, AMINT AZ ONLINE FELHASZNÁLÓI FELÜLET A PÁRHUZAMOS SZÖVEGET, A SZÓRÓL SZÓRA FÉNYESSÉGET, A FORDÍTÁST, AZ ÖSSZEHANGOLÁST ÉS A KIEMELÉST KÍNÁLJA, ÉS LEHETŐVÉ TESZI A LEMMA ÉS AZ INFLEXIÓS FORMA JELÖLÉSÉRE ÉS ANNOTÁCIÓJÁRA VALÓ KERESÉST; ÉS RÉGI ANGOL, BELEÉRTVE NEMCSAK A NYELVÉSZETET, HANEM AZ IRODALMAT ÉS A KULTURÁLIS TANULMÁNYOKAT IS, TEKINTETTEL ARRA, HOGY A SZÖVEGEK ÉS FORDÍTÁSAIK FELHASZNÁLHATÓK A KÜLÖNBÖZŐ TERÜLETEK ÉS MEGKÖZELÍTÉSEK FORRÁSAIRA. (Hungarian)
    18 August 2022
    0 references
    ЦЕЛТА НА ТОЗИ ПРОЕКТ Е ДА СЪСТАВИ, АНАЛИЗИРА И ПРЕДЛОЖИ ПАРАЛЕЛЕН АНГЛИЙСКО-СЪВРЕМЕНЕН АНГЛИЙСКИ ЕЗИК, ПРИВЕДЕН В СЪОТВЕТСТВИЕ НА НИВО ДУМА, ВЪЗ ОСНОВА НА КОЙТО МОГАТ ДА СЕ ПРОВЕЖДАТ ИЗСЛЕДВАНИЯ ПО СТАРАТА ЛИНГВИСТИКА НА ENGILSH И ЛИНГВИСТИКАТА НА КОРПУСА. КОРПУСЪТ ТРЯБВА ДА БЪДЕ ГЛАНЦОВ, ЛЕММАТИЗИРАН, МАРКИРАН И АНОТИРАН В АНГЛОСАКСОНСКИЯ СЕГМЕНТ, КОЙТО СЕ СЪСТОИ ОТ ОКОЛО 50 000 ДУМИ ОТ ПРЕДСТАВИТЕЛНИ ПРОЗА ТЕКСТОВЕ. МЕТОДОЛОГИЯТА НА НАУЧНИТЕ ИЗСЛЕДВАНИЯ СЕ ОСНОВАВА НА СЪБИРАНЕТО, СЪХРАНЕНИЕТО, АНАЛИЗА И РАЗПРОСТРАНЕНИЕТО НА РЕАЛЕН ЕЗИК СЪС СОФТУЕР ЗА БАЗИ ДАННИ; РАЗРАБОТВАНЕТО И ИЗПЪЛНЕНИЕТО, РЪКОВОДЕНИ ОТ ЗАКЛЮЧЕНИЯТА, НАПРАВЕНИ СЛЕД СЪЗДАВАНЕТО НА ПИЛОТЕН КОРПУС; МАКСИМИЗИРАНЕ НА АВТОМАТИЧНАТА ЛЕММАТИЗАЦИЯ, МАРКИРАНЕ И АНОТАЦИЯ; ОБРАТНАТА ИНФОРМАЦИЯ ОТ БАЗИТЕ ДАННИ И LEMMATIZER С ИНФОРМАЦИЯТА, СЪБРАНА С РЪЧЕН АНАЛИЗ; И РАЗПРОСТРАНЕНИЕТО НА РЕЗУЛТАТИТЕ В СВОБОДНИЯ ДОСТЪП. ТАКА ОПИСАН, ПРОЕКТЪТ ИМА ЗА ЦЕЛ ДА ДОПРИНЕСЕ ЗА ЛИНГВИСТИКАТА НА КОРПУСА, КАТО СЕ ИМА ПРЕДВИД, ЧЕ Е ПРЕДЛОЖЕН МЕТОД ЗА ПРИВЕЖДАНЕ В СЪОТВЕТСТВИЕ, ОСНОВАН НА ПРОИЗВОДНИЯ ЛЕКСИКОН; АНГЛИЙСКИ КОРПУС ЛИНГВИСТИКА, ЗАЩОТО НЯМА КОРПУС НА ТОЗИ ЕЗИК, КОЙТО СЪДЪРЖА ЛЕМИ, ГЛАНЦОВЕ И ПОДРАВНЯВАНЕ ДУМА ПО ДУМА; ЕЛЕКТРОННА ЛЕКСИКОГРАФИЯ, ТЪЙ КАТО СЕ РАЗРАБОТВА МЕТОД ЗА ХРАНЕНЕ НА ПАРАЛЕЛНИ КОРПУСИ С БАЗА ОТ ЗНАНИЯ; СТАРА АНГЛИЙСКА ЛЕКСИКОГРАФИЯ, ТЪЙ КАТО СЕ РАЗГЛЕЖДАТ ВЪПРОСИ, СВЪРЗАНИ С ПРАВОПИСА И МОРФОЛОГИЧНИТЕ ВАРИАЦИИ, ДЪЛЖАЩИ СЕ НА ВРЕМЕВИЯ ИНТЕРВАЛ, НОРМАЛИЗИРАНЕТО, КАКТО И АВТОМАТИЧНАТА И ПОЛУАВТОМАТИЧНА ЛЕММАТИЗАЦИЯ; ИНТЕРНЕТ ОТ ТРЕТО ПОКОЛЕНИЕ, КАТО СЕ ИМА ПРЕДВИД, ЧЕ РЕЗУЛТАТИТЕ ОТ ЕЗИКОВИЯ АНАЛИЗ С БАЗИ ДАННИ ПРЕДСТАВЛЯВАТ СТРУКТУРИРАНИ ДАННИ, КОИТО ОСВЕН ТОВА МОГАТ ДА БЪДАТ ПРЕДСТАВЕНИ КАТО СВЪРЗАНИ ДАННИ; ЦИФРОВИ ХУМАНИТАРНИ НАУКИ, СЛЕД КАТО ОНЛАЙН ПОТРЕБИТЕЛСКИЯТ ИНТЕРФЕЙС ПРЕДЛАГА ПАРАЛЕЛНИЯ ТЕКСТ, ДУМАТА ПО ДУМА ГЛАНЦ, ПРЕВОДА, ПОДРАВНЯВАНЕТО И ПОДЧЕРТАВАНЕТО И ПОЗВОЛЯВА ТЪРСЕНЕ НА ЕТИКЕТИ И АНОТАЦИЯ ОТ ЛЕМА И ИНФЛЕКСНА ФОРМА; И СТАРИ АНГЛИЙСКИ, ВКЛЮЧИТЕЛНО НЕ САМО ЛИНГВИСТИКА, НО И ЛИТЕРАТУРА И КУЛТУРНИ ИЗСЛЕДВАНИЯ, КАТО СЕ ИМА ПРЕДВИД, ЧЕ ТЕКСТОВЕТЕ И ТЕХНИТЕ ПРЕВОДИ МОГАТ ДА СЕ ИЗПОЛЗВАТ ЗА ИЗТОЧНИЦИ ЗА РАЗЛИЧНИ ОБЛАСТИ И ПОДХОДИ. (Bulgarian)
    18 August 2022
    0 references
    ŠIO PROJEKTO TIKSLAS – SUDARYTI, ANALIZUOTI IR PASIŪLYTI LYGIAGREČIAI SENĄ ANGLŲ IR ŠIUOLAIKINĖS ANGLŲ KALBOS KORPUSĄ, SUDERINTĄ ŽODŽIO LYGIU, KURIUO REMIANTIS GALIMA ATLIKTI SENOSIOS ENGILSH LINGVISTIKOS IR KORPUSŲ LINGVISTIKOS STUDIJAS. KORPUSAS TURI BŪTI BLIZGINTAS, LEMMATIZUOTAS, PAŽYMĖTAS IR ANOTUOTAS ANGLOSAKSŲ SEGMENTE, KURĮ SUDARO APIE 50 000 ŽODŽIŲ IŠ REPREZENTACINIŲ PROZOS TEKSTŲ. MOKSLINIŲ TYRIMŲ METODIKA GRINDŽIAMA REALIOS KALBOS RINKIMU, SAUGOJIMU, ANALIZE IR SKLAIDA NAUDOJANT DUOMENŲ BAZIŲ PROGRAMINĘ ĮRANGĄ; PARENGTI IR ĮGYVENDINTI REMIANTIS IŠVADOMIS, PADARYTOMIS PO BANDOMOJO RINKINIO SUKŪRIMO; MAKSIMIZUOTI AUTOMATINĮ LEMMATIZAVIMĄ, ŽYMĖJIMĄ IR ANOTACIJĄ; DUOMENŲ BAZIŲ IR LEMMATIZATORIAUS GRĮŽTAMĄJĄ INFORMACIJĄ APIE INFORMACIJĄ, SURINKTĄ ATLIKUS RANKINĘ ANALIZĘ; IR REZULTATŲ SKLAIDA ATVIROS PRIEIGOS BŪDU. TAIP APIBŪDINTU PROJEKTU KETINAMA PRISIDĖTI PRIE TEKSTO LINGVISTIKOS, ATSIŽVELGIANT Į TAI, KAD SIŪLOMAS IŠVESTINIU ŽODYNU PAGRĮSTAS DERINIMO METODAS; ANGLŲ KALBOS TEKSTYNAS, NES NĖRA ŠIOS KALBOS TEKSTYNO, KURIAME YRA LEMMAS, BLIZGESYS IR ŽODIS PAGAL ŽODĮ; ELEKTRONINĖ LEKSIKOGRAFIJA, NES YRA SUKURTAS LYGIAGREČIŲ KORPORACIJŲ ŠĖRIMO SU ŽINIŲ BAZĖMIS METODAS; SENOJI ANGLŲ LEKSIKOGRAFIJA, NES SPRENDŽIAMI KLAUSIMAI, SUSIJĘ SU RAŠYBA IR MORFOLOGINIAIS POKYČIAIS, PRISKIRTINAIS LAIKO TARPSNIUI, NORMALIZAVIMUI, TAIP PAT AUTOMATINEI IR PUSIAU AUTOMATINEI LEMMATIZACIJAI; TREČIOSIOS KARTOS INTERNETAS, ATSIŽVELGIANT Į TAI, KAD LINGVISTINĖS ANALIZĖS SU DUOMENŲ BAZĖMIS REZULTATAI YRA STRUKTŪRIZUOTI DUOMENYS, KURIUOS, BE TO, GALIMA PATEIKTI KAIP SUSIETUS DUOMENIS; SKAITMENINIAI HUMANITARINIAI MOKSLAI, KAI INTERNETINĖJE NAUDOTOJO SĄSAJOJE PATEIKIAMAS PARALELINIS TEKSTAS, ŽODIS PO ŽODŽIŲ BLIZGESYS, VERTIMAS, SUDERINIMAS IR PARYŠKINIMAS, TAIP PAT SUDAROMOS SĄLYGOS IEŠKOTI ŽYMENŲ IR ANOTACIJŲ PAGAL LEMMĄ IR CHARAKTERISTINĘ FORMĄ; IR SENOJI ANGLŲ KALBA, ĮSKAITANT NE TIK LINGVISTIKĄ, BET IR LITERATŪRĄ BEI KULTŪRINIUS TYRIMUS, ATSIŽVELGIANT Į TAI, KAD TEKSTAI IR JŲ VERTIMAI GALI BŪTI NAUDOJAMI ĮVAIRIŲ SRIČIŲ IR POŽIŪRIŲ ŠALTINIAMS. (Lithuanian)
    18 August 2022
    0 references
    CILJ OVOG PROJEKTA JE SASTAVITI, ANALIZIRATI I PONUDITI PARALELNI KORPUS STARI ENGLESKI-SUVREMENI ENGLESKI JEZIK, USKLAĐEN NA RAZINI RIJEČI, NA TEMELJU KOJEG SE MOGU PROVODITI STUDIJE NA STAROJ ENGILSH LINGVISTICI I KORPUS LINGVISTICI. KORPUS ĆE BITI SJAJAN, LEMMATIZIRAN, OZNAČEN I OZNAČEN U ANGLOSAKSONSKOM SEGMENTU, KOJI SE SASTOJI OD OKO 50.000 RIJEČI IZ REPREZENTATIVNIH PROZNIH TEKSTOVA. METODOLOGIJA ISTRAŽIVANJA TEMELJI SE NA PRIKUPLJANJU, POHRANJIVANJU, ANALIZI I ŠIRENJU STVARNOG JEZIKA SOFTVEROM BAZE PODATAKA; OSMIŠLJAVANJE I PROVEDBU NA TEMELJU ZAKLJUČAKA DONESENIH NAKON STVARANJA PILOT-KORPUSA; MAKSIMIZIRANJE AUTOMATSKE LEMMATIZACIJE, OZNAČAVANJA I NAPOMENE; POVRATNE INFORMACIJE O BAZAMA PODATAKA I LEMMATIZERU S INFORMACIJAMA PRIKUPLJENIMA RUČNOM ANALIZOM; I ŠIRENJE REZULTATA U OTVORENOM PRISTUPU. TAKO JE OPISAN, PROJEKT NAMJERAVA DOPRINIJETI KORPUS LINGVISTICI, S OBZIROM NA TO DA SE PREDLAŽE METODA USKLAĐIVANJA KOJA SE TEMELJI NA IZVEDENOM LEKSIKONU; ENGLESKI KORPUS LINGVISTIKA, JER NEMA KORPUSA OVOG JEZIKA KOJI SADRŽI LEMME, SJAJI I RIJEČ USKLAĐIVANJEM RIJEČI; ELEKTRONIČKA LEKSIKOGRAFIJA, BUDUĆI DA JE RAZVIJENA METODA ZA HRANJENJE PARALELNIH KORPUSA S BAZAMA ZNANJA; STARA ENGLESKA LEKSIKOGRAFIJA, JER SE RJEŠAVAJU PITANJA KOJA SE ODNOSE NA PRAVOPIS I MORFOLOŠKE VARIJACIJE KOJE SE MOGU PRIPISATI VREMENSKOM RAZDOBLJU, NORMALIZACIJI TE AUTOMATSKOJ I POLUAUTOMATSKOJ LEMMATIZACIJI; INTERNET TREĆE GENERACIJE, S OBZIROM NA TO DA REZULTATI JEZIČNE ANALIZE S BAZAMA PODATAKA PREDSTAVLJAJU STRUKTURIRANE PODATKE KOJI SE, OSIM TOGA, MOGU PRIKAZATI KAO POVEZANI PODACI; DIGITALNE HUMANISTIČKE ZNANOSTI, NAKON ŠTO INTERNETSKO KORISNIČKO SUČELJE NUDI PARALELNI TEKST, RIJEČ PO RIJEČ SJAJ, PRIJEVOD, PORAVNANJE I ISTICANJE, TE OMOGUĆUJE PRETRAŽIVANJA ZA OZNAČAVANJE I NAPOMENU PO LEMMI I INFLEKSIBILNOM OBLIKU; I STARI ENGLESKI, UKLJUČUJUĆI NE SAMO LINGVISTIKU, VEĆ I KNJIŽEVNOST I KULTURNE STUDIJE, S OBZIROM NA TO DA SE TEKSTOVI I NJIHOVI PRIJEVODI MOGU KORISTITI ZA IZVORE ZA RAZLIČITA PODRUČJA I PRISTUPE. (Croatian)
    18 August 2022
    0 references
    SYFTET MED DETTA PROJEKT ÄR ATT SAMMANSTÄLLA, ANALISERA OCH ERBJUDA EN PARALLELL CORPUS GAMMAL ENGELSK-MODERN ENGELSKA, ANPASSAD PÅ ORDNIVÅ, PÅ GRUNDVAL AV VILKA STUDIER I GAMMAL ENGILSH LINGVISTIK OCH CORPUS LINGVISTIK KAN GENOMFÖRAS. KORPUSEN SKA VARA BLANKAD, LEMMATISERAD, TAGGAD OCH KOMMENTERAD I SITT ANGLOSAXISKA SEGMENT, SOM BESTÅR AV CIRKA 50 000 ORD FRÅN REPRESENTATIVA PROSATEXTER. FORSKNINGSMETODEN BYGGER PÅ INSAMLING, LAGRING, ANALYS OCH SPRIDNING AV VERKLIGA SPRÅK MED DATABASPROGRAMVARA. UTFORMNING OCH GENOMFÖRANDE SOM STYRS AV DE SLUTSATSER SOM DRAGITS EFTER INRÄTTANDET AV ETT PILOTPROJEKT. MAXIMERING AV AUTOMATISK LEMMATISERING, MÄRKNING OCH ANNOTERING. ÅTERKOPPLING FRÅN DATABASERNA OCH LEMMATIZERN MED DEN INFORMATION SOM SAMLATS IN MED MANUELL ANALYS. SAMT SPRIDNING AV RESULTAT I FORM AV ÖPPEN TILLGÅNG. PROJEKTET AVSER SÅLEDES ATT BIDRA TILL LINGVISTIKEN I CORPUS, MED TANKE PÅ ATT EN ANPASSNINGSMETOD BASERAD PÅ DET HÄRLEDDA LEXIKONET FÖRESLÅS. ENGELSKA CORPUS LINGVISTIK, EFTERSOM DET INTE FINNS NÅGON CORPUS AV DETTA SPRÅK SOM INNEHÅLLER LEMMAS, GLANSER OCH ORD FÖR ORD JUSTERING; ELEKTRONISK LEXIKOGRAFI, EFTERSOM DET UTVECKLAS EN METOD FÖR ATT MATA PARALLELLKORPORA MED KUNSKAPSBASER. GAMMAL ENGELSK LEXICOGRAFI, EFTERSOM FRÅGOR HAR ATT GÖRA MED STAVNING OCH MORFOLOGISK VARIATION SOM KAN HÄNFÖRAS TILL TIDSINTERVALLET, NORMALISERING SAMT AUTOMATISK OCH HALVAUTOMATISK LEMMATISERING. TREDJE GENERATIONENS INTERNET, MED TANKE PÅ ATT RESULTATEN AV SPRÅKLIGA ANALYSER MED DATABASER UTGÖR STRUKTURERADE DATA SOM DESSUTOM KAN PRESENTERAS SOM LÄNKADE DATA. DIGITAL HUMANIORA, SÅ SNART ONLINEANVÄNDARGRÄNSSNITTET ERBJUDER PARALLELL TEXT, ORD FÖR ORD GLANS, ÖVERSÄTTNING, JUSTERING OCH MARKERING, OCH GÖR DET MÖJLIGT ATT SÖKA EFTER TAGGNING OCH ANNOTERING AV LEMMA OCH BÖJNINGSFORM. OCH GAMMAL ENGELSKA, SOM INTE BARA OMFATTAR LINGVISTIK, UTAN ÄVEN LITTERATUR- OCH KULTURSTUDIER, EFTERSOM TEXTERNA OCH DERAS ÖVERSÄTTNINGAR KAN ANVÄNDAS FÖR KÄLLOR FÖR OLIKA OMRÅDEN OCH TILLVÄGAGÅNGSSÄTT. (Swedish)
    18 August 2022
    0 references
    SCOPUL ACESTUI PROIECT ESTE DE A COMPILA, DE A ANALIZA ȘI DE A OFERI UN CORPUS VECHI ENGLEZO-CONTEMPORAN PARALEL, ALINIAT LA NIVEL DE CUVÂNT, PE BAZA CĂRUIA SE POT EFECTUA STUDII ÎN LIMBA VECHE ENGILSH ȘI ÎN LIMBAJUL CORPUS LINGVISTIC. CORPUL ESTE LUSTRUIT, LEMMATIZAT, MARCAT ȘI ADNOTAT ÎN SEGMENTUL ANGLO-SAXON, CARE CUPRINDE APROXIMATIV 50 000 DE CUVINTE DIN TEXTE REPREZENTATIVE ÎN PROZĂ. METODOLOGIA DE CERCETARE SE BAZEAZĂ PE COLECTAREA, STOCAREA, ANALIZA ȘI DISEMINAREA LIMBAJULUI REAL CU SOFTWARE-UL BAZEI DE DATE; PROIECTAREA ȘI PUNEREA ÎN APLICARE GHIDATE DE CONCLUZIILE LA CARE S-A AJUNS DUPĂ CREAREA UNUI CORPUS-PILOT; MAXIMIZAREA LEMMATIZĂRII, ETICHETĂRII ȘI ADNOTĂRII AUTOMATE; FEEDBACKUL BAZELOR DE DATE ȘI AL LEMMATIZORULUI CU INFORMAȚIILE COLECTATE CU AJUTORUL ANALIZEI MANUALE; ȘI DISEMINAREA REZULTATELOR ÎN CEEA CE PRIVEȘTE ACCESUL LIBER. ASTFEL DESCRIS, PROIECTUL INTENȚIONEAZĂ SĂ CONTRIBUIE LA CORPUSUL LINGVISTIC, AVÂND ÎN VEDERE CĂ SE PROPUNE O METODĂ DE ALINIERE BAZATĂ PE LEXICONUL DERIVAT; CORPUS LINGVISTICA ENGLEZĂ, DEOARECE NU ESTE DISPONIBIL NICI UN CORPUS AL ACESTEI LIMBI CARE SĂ CONȚINĂ LEMME, LUCURI ȘI ALINIEREA CUVÂNT CU CUVÂNT; LEXICOGRAFIE ELECTRONICĂ, DEOARECE SE DEZVOLTĂ O METODĂ DE HRĂNIRE A CORPURILOR PARALELE CU BAZE DE CUNOȘTINȚE; LEXICOGRAFIA VECHE ÎN LIMBA ENGLEZĂ, DEOARECE SUNT ADRESATE ÎNTREBĂRI CARE AU LEGĂTURĂ CU ORTOGRAFIA ȘI VARIAȚIA MORFOLOGICĂ CARE POT FI ATRIBUITE INTERVALULUI DE TIMP, NORMALIZĂRII, PRECUM ȘI LEMMATIZĂRII AUTOMATE ȘI SEMIAUTOMATE; INTERNETUL DE A TREIA GENERAȚIE, AVÂND ÎN VEDERE CĂ REZULTATELE ANALIZEI LINGVISTICE CU BAZE DE DATE REPREZINTĂ DATE STRUCTURATE CARE, ÎN PLUS, POT FI PREZENTATE CA DATE INTERCONECTATE; UMANISTE DIGITALE, ODATĂ CE INTERFAȚA CU UTILIZATORUL ONLINE OFERĂ TEXTUL PARALEL, CUVÂNTUL CU CUVÂNT, TRADUCEREA, ALINIEREA ȘI EVIDENȚIEREA ȘI PERMITE CĂUTAREA MARCĂRII ȘI ADNOTĂRII PRIN LEMMA ȘI FORMA INFLECTIONALĂ; ȘI ENGLEZA VECHE, INCLUZÂND NU NUMAI LINGVISTICA, CI ȘI LITERATURA ȘI STUDIILE CULTURALE, AVÂND ÎN VEDERE CĂ TEXTELE ȘI TRADUCERILE LOR POT FI FOLOSITE PENTRU SURSE PENTRU DIFERITE DOMENII ȘI ABORDĂRI. (Romanian)
    18 August 2022
    0 references
    CILJ TEGA PROJEKTA JE ZBRATI, ANALIZIRATI IN PONUDITI VZPOREDNI KORPUS STARO ANGLEŠKO-SODOBNO ANGLEŠČINO, USKLAJENO NA RAVNI BESED, NA PODLAGI KATERE SE LAHKO IZVAJAJO ŠTUDIJE V STAREM ANGILSH JEZIKOSLOVJU IN KORPUSU JEZIKOSLOVJU. KORPUS SE BLEŠČI, LEMMATIZIRA, OZNAČI IN OZNAČI V ANGLOSAKSONSKEM SEGMENTU, KI OBSEGA PRIBLIŽNO 50.000 BESED IZ REPREZENTATIVNIH BESEDIL PROZE. METODOLOGIJA RAZISKAV TEMELJI NA ZBIRANJU, SHRANJEVANJU, ANALIZI IN RAZŠIRJANJU PRAVEGA JEZIKA S PROGRAMSKO OPREMO PODATKOVNIH BAZ; ZASNOVO IN IZVAJANJE NA PODLAGI SKLEPOV, SPREJETIH PO USTANOVITVI PILOTNEGA KORPUSA; MAKSIMIZACIJA AVTOMATSKE LEMMATIZACIJE, OZNAČEVANJA IN OZNAČITVE; POVRATNE INFORMACIJE BAZ PODATKOV IN LEMMATIZERJA Z INFORMACIJAMI, ZBRANIMI Z ROČNO ANALIZO; TER RAZŠIRJANJE REZULTATOV PRI ODPRTEM DOSTOPU. TAKO OPISANI PROJEKT NAMERAVA PRISPEVATI K KORPUSU JEZIKOSLOVJU, GLEDE NA TO, DA SE PREDLAGA METODA USKLAJEVANJA, KI TEMELJI NA IZPELJANEM LEKSIKONU; ANGLEŠKI KORPUS JEZIKOSLOVJE, KER NI NA VOLJO KORPUS TEGA JEZIKA, KI VSEBUJE LEMME, GLOSOVE IN BESEDNO PORAVNAVO; ELEKTRONSKA LEKSIKOGRAFIJA, SAJ JE RAZVITA METODA ZA HRANJENJE VZPOREDNIH KORPUSOV Z BAZAMI ZNANJA; STARA ANGLEŠKA LEKSIKOGRAFIJA, KER SE OBRAVNAVAJO VPRAŠANJA, KI SE NANAŠAJO NA ČRKOVANJE IN MORFOLOŠKE VARIACIJE, KI JIH JE MOGOČE PRIPISATI ČASOVNEMU OBDOBJU, NORMALIZACIJI TER AVTOMATIČNI IN POLAVTOMATSKI LEMMATIZACIJI; INTERNET TRETJE GENERACIJE, GLEDE NA TO, DA SO REZULTATI JEZIKOVNE ANALIZE S PODATKOVNIMI ZBIRKAMI STRUKTURIRANI PODATKI, KI JIH JE POLEG TEGA MOGOČE PREDSTAVITI KOT POVEZANE PODATKE; DIGITALNE HUMANISTIKE, KO SPLETNI UPORABNIŠKI VMESNIK PONUJA VZPOREDNO BESEDILO, BESEDO PO BESEDNEM SIJAJU, PREVOD, PORAVNAVO IN POUDARJANJE TER OMOGOČA ISKANJE OZNAK IN ZAZNAVNOSTI PO LEMMI IN INFLEKTIVNI OBLIKI; IN STARO ANGLEŠČINO, VKLJUČNO Z JEZIKOSLOVJEM, PA TUDI LITERATURO IN KULTURNIMI ŠTUDIJAMI, SAJ SE BESEDILA IN NJIHOVI PREVODI LAHKO UPORABLJAJO ZA VIRE ZA RAZLIČNA PODROČJA IN PRISTOPE. (Slovenian)
    18 August 2022
    0 references
    CELEM TEGO PROJEKTU JEST KOMPILACJA, ANALIZA I ZAOFEROWANIE RÓWNOLEGŁEGO KORPUSU STAREJ ANGIELSKO-WSPÓŁCZESNEJ ANGIELSKIEJ, DOSTOSOWANEJ NA POZIOMIE SŁOWA, NA PODSTAWIE KTÓREJ MOŻNA PROWADZIĆ STUDIA Z ZAKRESU LINGWISTYKI STAREJ ENGILSH I LINGWISTYKI KORPUSU. KORPUS JEST POŁYSKOWANY, LEMMATYZOWANY, OZNACZONY I OPATRZONY ADNOTACJĄ W SEGMENCIE ANGLOSASKIM, KTÓRY SKŁADA SIĘ Z OKOŁO 50 000 SŁÓW Z REPREZENTATYWNYCH TEKSTÓW PROZY. METODOLOGIA BADAŃ OPIERA SIĘ NA GROMADZENIU, PRZECHOWYWANIU, ANALIZIE I ROZPOWSZECHNIANIU PRAWDZIWEGO JĘZYKA ZA POMOCĄ OPROGRAMOWANIA BAZ DANYCH; PROJEKT I WDROŻENIE OPARTE NA WNIOSKACH WYCIĄGNIĘTYCH PO UTWORZENIU KORPUSU PILOTAŻOWEGO; MAKSYMALIZACJI AUTOMATYCZNEGO LEMMATYZACJI, ZNAKOWANIA I ADNOTACJI; INFORMACJE ZWROTNE POCHODZĄCE Z BAZ DANYCH I LEMMATIZERA WRAZ Z INFORMACJAMI ZGROMADZONYMI W RAMACH ANALIZY RĘCZNEJ; ORAZ UPOWSZECHNIANIE WYNIKÓW W OTWARTYM DOSTĘPIE. W TEN SPOSÓB PROJEKT MA PRZYCZYNIĆ SIĘ DO LINGWISTYKI KORPUSU, BIORĄC POD UWAGĘ, ŻE PROPONUJE SIĘ METODĘ DOSTOSOWANIA OPARTĄ NA POCHODNEJ LEKSYKONIE; ANGIELSKIE LINGWISTYKI KORPUSU, PONIEWAŻ NIE JEST DOSTĘPNY ŻADEN KORPUS TEGO JĘZYKA, KTÓRY ZAWIERA LEMMY, POŁYSKI I WYRAZY WEDŁUG WYRÓWNANIA SŁÓW; LEKSYKOGRAFIA ELEKTRONICZNA, PONIEWAŻ OPRACOWANO METODĘ KARMIENIA KORPUSU RÓWNOLEGŁEGO Z BAZAMI WIEDZY; STAREJ LEKSYKOGRAFII ANGIELSKIEJ, PONIEWAŻ ROZWIĄZYWANE SĄ PYTANIA, KTÓRE MAJĄ ZWIĄZEK Z PISOWNIĄ I ZMIENNOŚCIĄ MORFOLOGICZNĄ ZWIĄZANĄ Z CZASEM, NORMALIZACJĄ ORAZ AUTOMATYCZNYM I PÓŁAUTOMATYCZNYM LEMMATYZACJĄ; INTERNET TRZECIEJ GENERACJI, BIORĄC POD UWAGĘ, ŻE WYNIKI ANALIZY JĘZYKOWEJ WRAZ Z BAZAMI DANYCH STANOWIĄ DANE USTRUKTURYZOWANE, KTÓRE MOŻNA PONADTO PRZEDSTAWIAĆ JAKO POWIĄZANE DANE; HUMANISTYKA CYFROWA, GDY INTERFEJS UŻYTKOWNIKA ONLINE OFERUJE TEKST RÓWNOLEGŁY, WYRAZ PO WYRAZIE POŁYSK, TŁUMACZENIE, WYRÓWNANIE I PODŚWIETLANIE, A TAKŻE UMOŻLIWIA WYSZUKIWANIE ZNACZNIKÓW I ADNOTACJI ZA POMOCĄ LEMMY I FORMY PRZELOTOWEJ; ORAZ STARY ANGIELSKI, OBEJMUJĄCY NIE TYLKO JĘZYK, ALE TAKŻE LITERATURĘ I KULTURĘ, BIORĄC POD UWAGĘ, ŻE TEKSTY I ICH TŁUMACZENIA MOGĄ BYĆ WYKORZYSTYWANE JAKO ŹRÓDŁA DLA RÓŻNYCH DZIEDZIN I PODEJŚĆ. (Polish)
    18 August 2022
    0 references
    Logroño
    0 references
    20 December 2023
    0 references

    Identifiers

    FFI2017-83360-P
    0 references