THE CORPUS LENGTH OF ORAL SPANISH: ENRICHMENT, LINGUISTIC ANALYSIS AND RESOURCE EXTRACTION (Q3151786)
Jump to navigation
Jump to search
Project Q3151786 in Spain
Language | Label | Description | Also known as |
---|---|---|---|
English | THE CORPUS LENGTH OF ORAL SPANISH: ENRICHMENT, LINGUISTIC ANALYSIS AND RESOURCE EXTRACTION |
Project Q3151786 in Spain |
Statements
32,942.25 Euro
0 references
60,500.0 Euro
0 references
54.45 percent
0 references
1 January 2018
0 references
31 December 2020
0 references
UNIVERSIDAD DE SANTIAGO DE COMPOSTELA
0 references
15705
0 references
EL PROYECTO PARTE DE LA FASE PREVIA DE DESARROLLO DEL CORPUS ESLORA Y PROPONE NUEVAS VIAS DE ENRIQUECIMIENTO Y EXPLOTACION QUE PERMITAN SEGUIR AVANZANDO TANTO EN EL TRATAMIENTO COMPUTACIONAL DE CORPUS ORALES COMO EN EL CONOCIMIENTO DE LA COMUNICACION ORAL Y EN LA ELABORACION DE MATERIALES Y HERRAMIENTAS DE INTERES PUBLICO._x000D_ 1. ENRIQUECIMIENTO DEL CORPUS. PARA MEJORAR LA TASA DE ACIERTO DEL ETIQUETADOR Y LA ANOTACION MORFOSINTACTICA EXISTENTE SE IMPLEMENTAN NUEVAS FUNCIONALIDADES DE RECONOCIMIENTO DE FORMAS (NUMERALES, UNIDADES MULTIPALABRA, SUFIJOS APRECIATIVOS), SE AMPLIAN EL CORPUS DE ENTRENAMIENTO Y EL LEXICON, Y SE INTRODUCEN RESTRICCIONES LINGUISTICAS QUE COMPLEMENTAN EL METODO ESTADISTICO A PARTIR DE UN ANALISIS CUALITATIVO DE LOS ERRORES SUBSISTENTES. LA ANOTACION MORFOSINTACTICA MEJORADA SIRVE TANTO PARA INCREMENTAR LA CALIDAD DEL CORPUS YA EXISTENTE COMO PARA SER UTILIZADA COMO BASE EN LA CREACION DE UN BANCO DE ARBOLES (TREEBANK) DISPONIBLE EN DOS FORMATOS Y NIVELES DE PROFUNDIDAD DISTINTOS: UNO CONSTITUTIVO MAS DETALLADO Y OTRO DEPENDENCIAL MENOS PORMENORIZADO, ESTE ULTIMO ENMARCADO EN EL PROYECTO COLABORATIVO INTERNACIONAL UNIVERSAL DEPENDENCIES, QUE TIENE COMO OBJETIVO DESARROLLAR SISTEMAS DE ANOTACION Y HERRAMIENTAS DE ANALISIS SINTACTICO MULTILINGUES. POR OTRA PARTE, EN RELACION CON LA EXTRACCION DE RECURSOS PREVISTA, SE REALIZA UNA APROXIMACION INICIAL A LA ANOTACION DE UNA PARTE DE LOS MATERIALES CON INDICACIONES RELEVANTES PARA SU EXPLOTACION EN ELE, COMO SON EL TEMA Y LA FUNCION COMUNICATIVA DE LAS SECUENCIAS DEL CORPUS. _x000D_ 2. ANALISIS LINGUISTICO DEL HABLA. CON LA ANOTACION Y METADATOS DE ESLORA Y LA APLICACION DE CONSULTA QUE FACILITA YA SU RECUPERACION MEDIANTE BUSQUEDAS COMBINADAS SE ABORDAN NUEVOS ANALISIS DE FENOMENOS RELEVANTES DE LA LENGUA ORAL. EN EL NIVEL LEXICO-GRAMATICAL, EL ADECUADO PROCESAMIENTO DE LOS MATERIALES PERMITE EXTRAER Y ANALIZAR LA DISTRIBUCION Y FRECUENCIA DE LEMAS Y CATEGORIAS GRAMATICALES PARA ELABORAR UN DICCIONARIO DE FRECUENCIAS BASADO ESPECIFICAMENTE EN DATOS DE LENGUA ORAL. POR OTRA PARTE, ADEMAS DE LOS ESTUDIOS SOBRE CONSTRUCCIONES Y FORMAS VERBALES YA EMPRENDIDOS, SE ANALIZA EL FENOMENO DE LA ALTERNANCIA O CAMBIO DE CODIGO ESPAÑOL-GALLEGO. LA PERSPECTIVA SOCIOLINGUISTICA Y PRAGMATICO-DISCURSIVA ESTA PRESENTE EN LOS ANALISIS LINGUISTICOS Y SE CONECTA CON EL ESTUDIO DE LAS REPRESENTACIONES, ACTITUDES E IDEOLOGIAS QUE SE DESARROLLA CONTRASTANDO EL HABLA REGISTRADA CON LOS DATOS RECOGIDOS A TRAVES DE CUESTIONARIOS EN EL PROCESO DE ELABORACION DEL CORPUS._x000D_ 3. EXTRACCION DE RECURSOS. CON EL OBJETIVO DE DESARROLLAR RECURSOS REUTILIZABLES DE INTERES PUBLICO GENERAL, SE ABORDA LA CREACION DE INSTRUMENTOS LINGUISTICOS UTILES EN DIFERENTES AMBITOS RELACIONADOS CON LA LENGUA ORAL. ADEMAS DE LAS HERRAMIENTAS COMPUTACIONALES YA CITADAS, DESTACA EL APROVECHAMIENTO DEL CORPUS PARA LA ENSEÑANZA DEL ESPAÑOL COMO LENGUA EXTRANJERA, TANTO EN LA ELABORACION DE MATERIALES PARA TRATAR EN EL AULA LOS FENOMENOS DE ESPECIAL DIFICULTAD EN LA INTERACCION ORAL, COMO EN EL DISEÑO DE ACTIVIDADES DE ¿APRENDIZAJE DE LENGUAS ASISTIDO POR ORDENADOR¿ QUE EJERCITEN EL CONJUNTO DE LAS DESTREZAS ORALES MEDIANTE LA PROPIA APLICACION DE CONSULTA. ASIMISMO, APROVECHANDO EL ALINEAMIENTO DE TEXTO Y AUDIO DEL CORPUS, EL DICCIONARIO DE FRECUENCIAS EN VERSION ELECTRONICA INCORPORA EL ACCESO INMEDIATO A LOS FRAGMENTOS TEXTUALES Y SONOROS CORRESPONDIENTES A LAS ENTRADAS LEXICAS. (Spanish)
0 references
TAKING THE WORK CARRIED OUT UNDER THE PREVIOUS ESLORA PROJECTS AS ITS BASIS, THE CURRENT PROPOSAL AIMS AT DEVELOPING NEW WAYS OF ENRICHMENT AND EXPLOITATION THAT ALLOW PROGRESS TO BE MADE TOWARDS THE COMPUTATIONAL TREATMENT OF ORAL CORPORA, THE UNDERSTANDING OF SPOKEN COMMUNICATION, AND THE ELABORATION OF MATERIALS AND TOOLS OF PUBLIC INTEREST. _x000D_ 1. ENRICHMENT OF THE CORPUS. IN ORDER TO IMPROVE THE TAGGER'S SUCCESS RATE AND THE EXISTING MORPHOSYNTACTIC ANNOTATION, NEW FORM RECOGNITION FUNCTIONALITIES (WRITTEN CARDINAL NUMBERS, MULTI-WORD UNITS, APPRECIATIVE SUFFIXES) ARE IMPLEMENTED, THE TRAINING CORPUS AND THE LEXICON ARE EXPANDED, AND LINGUISTIC RESTRICTIONS ARE INTRODUCED THAT COMPLEMENT THE STATISTICAL METHOD BASED ON QUALITATIVE ANALYSIS OF THE REMAINING ERRORS. THE IMPROVED MORPHOSYNTACTIC ANNOTATION SERVES AS A BASIS BOTH TO INCREASE THE QUALITY OF THE EXISTING CORPUS AND TO GENERATE A TREEBANK AVAILABLE IN TWO DIFFERENT FORMATS AND DEPTH LEVELS: A MORE DETAILED CONSTITUTIVE ONE AND ANOTHER LESS DETAILED ONE BASED ON DEPENDENCIES, THIS LATTER BEING FRAMED IN THE INTERNATIONAL COLLABORATIVE PROJECT UNIVERSAL DEPENDENCIES THAT AIMS AT DEVELOPING MULTILINGUAL ANNOTATION SYSTEMS AND MULTILINGUAL PARSING TOOLS. ON THE OTHER HAND, IN RELATION TO THE EXPECTED EXTRACTION OF RESOURCES, AN INITIAL APPROXIMATION IS MADE TO THE ANNOTATION OF A PART OF THE MATERIALS WITH INFORMATION RELEVANT TO ITS EXPLOITATION IN THE TEACHING OF SPANISH AS A FOREIGN LANGUAGE, SUCH AS THEME IDENTIFICATION AND COMMUNICATIVE FUNCTION OF THE CORPUS SEQUENCES._x000D_ 2. LINGUISTIC ANALYSIS OF SPEECH. WITH THE ANNOTATION AND METADATA OF ESLORA AND THE SEARCH INTERFACE THAT ALREADY FACILITATES ITS INTERROGATION BY MEANS OF COMBINED SEARCHES, NEW ANALYSES OF RELEVANT PHENOMENA OF SPOKEN LANGUAGE ARE ADDRESSED. AT THE LEXICAL-GRAMMATICAL LEVEL, THE PROPER PROCESSING OF THE MATERIALS ALLOWS THE EXTRACTION AND ANALYSIS OF THE DISTRIBUTION AND FREQUENCY OF LEMMAS AND GRAMMATICAL CATEGORIES TO DEVELOP A FREQUENCY DICTIONARY BASED SPECIFICALLY ON SPOKEN LANGUAGE DATA. ON THE OTHER HAND, APART FROM THE STUDIES ON CONSTRUCTIONS AND VERBAL FORMS ALREADY UNDERTAKEN, THE PHENOMENON OF THE SPANISH-GALICIAN CODE-SWITCHING IS ANALYZED. THE SOCIOLINGUISTIC AND PRAGMATIC-DISCURSIVE PERSPECTIVE IS PRESENT IN THE LINGUISTIC ANALYSES AND IS CONNECTED WITH THE STUDY OF REPRESENTATIONS, ATTITUDES AND IDEOLOGIES THAT IS DEVELOPED BY CONTRASTING THE RECORDED SPEECH WITH THE DATA COLLECTED THROUGH QUESTIONNAIRES IN THE PROCESS OF ELICITATION OF THE CORPUS._x000D_ 3. EXTRACTION OF RESOURCES. WITH THE OBJECTIVE OF DEVELOPING REUSABLE RESOURCES OF GENERAL PUBLIC INTEREST, THE CREATION OF USEFUL LINGUISTIC INSTRUMENTS IN DIFFERENT AREAS RELATED TO SPOKEN LANGUAGE IS ADDRESSED. IN ADDITION TO THE COMPUTATIONAL TOOLS ALREADY MENTIONED, THE USE OF THE CORPUS FOR TEACHING SPANISH AS A FOREIGN LANGUAGE STANDS OUT, BOTH IN THE ELABORATION OF MATERIALS TO TREAT THE PHENOMENA OF SPECIAL DIFFICULTY IN SPOKEN INTERACTION IN THE CLASSROOM, AS WELL AS IN THE DESIGN OF ACTIVITIES OF 'COMPUTER-ASSISTED LANGUAGE LEARNING' THAT HELP IN THE TRAINING OF ALL THE ORAL SKILLS THROUGH WEB-BASED CORPUS SEARCH INTERFACES. ALSO, TAKING ADVANTAGE OF THE TEXT AND AUDIO ALIGNMENT OF THE CORPUS, THE DICTIONARY OF FREQUENCIES IN ELECTRONIC VERSION INCORPORATES THE IMMEDIATE ACCESS TO THE TEXTUAL AND SOUND FRAGMENTS CORRESPONDING TO THE LEXICAL ENTRIES. (English)
0.0678675455307957
0 references
Le PROJET PARTIE DU PROJET DE DÉVELOPPEMENT DE LA PRÉVELOPPEMENT DU CORPUS SOLEUR ET PROPOSE DE NOUVELLES VIAS D’ENRIQUECIENCE ET D’EXPLOTACTION Qu’il permet d’être adopté dans le cadre du traitement COMPUTATIONAL DU CORPUS ORAL comme dans la connaissance de la COMMUNICATION ORALE ET DANS L’ÉLABORATION DES MATÉRIELS ET DES OUTILS D’INTÉRÊTS DE PUBLICO._x000D_ 1. ENRICHISSEMENT DU CORPUS. AFIN D’AMÉLIORER LE TAUX DE RÉUSSITE DE L’ÉTIQUETEUR ET L’ANNOTATION MORFOSINTACTICA EXISTANTE, DE NOUVELLES FONCTIONNALITÉS DE RECONNAISSANCE DES FORMES (NUMÉRAIRES, UNITÉS MULTIMOTS, SUFFIXES APPRÉCIATIFS), LE CORPUS DE FORMATION ET DE LEXIQUE SONT ÉLARGIS, ET DES RESTRICTIONS LINGUISTIQUES SONT INTRODUITES QUI COMPLÈTENT LA MÉTHODE STATISTIQUE BASÉE SUR UNE ANALYSE QUALITATIVE DES ERREURS RESTANTES. L’ANNOTACION MORFOSINTACTICA AMÉLIORÉE SERT À LA FOIS À AMÉLIORER LA QUALITÉ DU CORPUS EXISTANT ET À SERVIR DE BASE À LA CRÉATION D’UNE BANQUE D’ARBRES (TREEBANK) DISPONIBLE EN DEUX FORMATS ET NIVEAUX DE PROFONDEUR DIFFÉRENTS: UN CONSTITUTIF PLUS DÉTAILLÉ ET UN AUTRE DEPENDENTIAL MOINS DÉTAILLÉ, CE DERNIER S’INSCRIT DANS LE PROJET INTERNATIONAL COLLABORATIF DE DÉPENDANCES UNIVERSELLES, QUI VISE À DÉVELOPPER DES SYSTÈMES D’ANNOTATION ET DES OUTILS D’ANALYSE SYNTACTIQUE MULTILINGUES. D’AUTRE PART, EN CE QUI CONCERNE L’EXTRACTION ANTICIPÉE DES RESSOURCES, ON PROCÈDE À UNE PREMIÈRE APPROXIMATION DE L’ANNOTATION D’UNE PARTIE DES MATÉRIAUX AVEC DES INDICATIONS PERTINENTES POUR LEUR EXPLOITATION EN ELE, TELLES QUE LE SUJET ET LA FONCTION COMMUNICATIVE DES SÉQUENCES DE CORPUS. _x000D_ 2. ANALYSE LINGUISTIQUE DE LA PAROLE. AVEC L’ANNOTATION ET LES MÉTADONNÉES DE LONGUEUR ET L’APPLICATION DE CONSULTATION QUI FACILITE DÉJÀ LEUR RÉCUPÉRATION PAR DES RECHERCHES COMBINÉES, DE NOUVELLES ANALYSES DES PHENOMENES PERTINENTS DU LANGAGE ORAL SONT ABORDÉES. AU NIVEAU LEXICO-GRAMTICAL, LE TRAITEMENT APPROPRIÉ DES MATÉRIAUX PERMET D’EXTRAIRE ET D’ANALYSER LA DISTRIBUTION ET LA FRÉQUENCE DES SLOGANS ET DES CATÉGORIES GRAMMATICAUX POUR PRODUIRE UN DICTIONNAIRE DE FRÉQUENCE BASÉ SPÉCIFIQUEMENT SUR DES DONNÉES LINGUISTIQUES ORALES. D’AUTRE PART, OUTRE LES ÉTUDES SUR LES CONSTRUCTIONS ET LES FORMES VERBALES DÉJÀ ENTREPRISES, LE PHÉNOMÈNE D’ALTERNANCE OU DE MODIFICATION DU CODE ESPAGNOL-GALLEGO EST ANALYSÉ. Le PERSPECTIVE social et pragmatique-discursif est présent dans les analyses linguistiques et est lié à l’état des reconstitutions, des actions et des idées qui sont développées en contrastant le discours enregistré avec les données recueillies dans le processus de CORPUS ELABORATION._x000D_ 3. EXTRACTION DE RESSOURCES. DANS LE BUT DE DÉVELOPPER DES RESSOURCES RÉUTILISABLES D’INTÉRÊT GÉNÉRAL, LA CRÉATION D’INSTRUMENTS LINGUISTIQUES UTILES DANS DIFFÉRENTS DOMAINES LIÉS À LA LANGUE ORALE EST ABORDÉE. OUTRE LES OUTILS DE CALCUL DÉJÀ CITÉS, L’UTILISATION DU CORPUS POUR L’ENSEIGNEMENT DE L’ESPAGNOL COMME LANGUE ÉTRANGÈRE EST MISE EN ÉVIDENCE, À LA FOIS DANS LA PRÉPARATION DE MATÉRIEL POUR TRAITER EN CLASSE LES PHÉNOMÈNES DE DIFFICULTÉ PARTICULIÈRE DANS L’INTERACTION ORALE, ET DANS LA CONCEPTION D’ACTIVITÉS D’APPRENTISSAGE DES LANGUES ASSISTÉE PAR ORDINATEUR QUI EXERCENT TOUTES LES COMPÉTENCES ORALES PAR LE BIAIS DE LA PROPRE APPLICATION DE CONSULTATION. EN OUTRE, PROFITANT DE L’ALIGNEMENT DU TEXTE ET DE L’AUDIO DU CORPUS, LE DICTIONNAIRE DE FRÉQUENCE EN VERSION ELECTRONICA INTÈGRE UN ACCÈS IMMÉDIAT AUX FRAGMENTS TEXTUELS ET SONORES CORRESPONDANT AUX ENTRÉES LEXICALES. (French)
2 December 2021
0 references
Die PROJEKTE DER PREVIEW-ENTWICKLUNG DER SLOOR KORPUS UND PROPOSEN NEUEN VIAS DER ENRIQUECIENCE und EXPLOTACTION, die es erlauben, im Rahmen der konkurrenziellen TREATMENT DER ORAL CORPUS als IN DER WISSEN DER ORALISCHEN KOMMUNIKATION und in der ELABORATION VON MATERIAL UND TOLS DER INTERESTEN PUBLICO._x000D_ 1. BEREICHERUNG DES KORPUS. UM DIE ERFOLGSQUOTE DES ETIKETTERS UND DER BESTEHENDEN MORFOSINTACTICA-ANNOTATION, NEUE FORMENERKENNUNGSFUNKTIONALITÄTEN (ZAHLEN, MULTIWORD-EINHEITEN, WERTSCHÄTZENDE SUFFIXE) ZU VERBESSERN, WERDEN DIE KORPUS DER AUSBILDUNG UND DES LEXIKONS ERWEITERT UND SPRACHLICHE EINSCHRÄNKUNGEN EINGEFÜHRT, DIE DIE STATISTISCHE METHODE ERGÄNZEN, DIE AUF EINER QUALITATIVEN ANALYSE DER VERBLEIBENDEN FEHLER BERUHT. DIE VERBESSERTE MORFOSINTACTICA ANNOTACION DIENT SOWOHL DER VERBESSERUNG DER QUALITÄT DES BESTEHENDEN KORPUS ALS AUCH ALS GRUNDLAGE FÜR DIE SCHAFFUNG EINER BAUMBANK (TREEBANK) IN ZWEI VERSCHIEDENEN FORMATEN UND TIEFENSTUFEN: EIN KONSTITUTIVER DETAILLIERTER UND EIN ANDERES DEPENDENTIAL WENIGER DETAILLIERT, DIESES LETZTE IM INTERNATIONALEN KOLLABORATIVEN PROJEKT UNIVERSELLE ABHÄNGIGKEITEN, DAS DARAUF ABZIELT, SYSTEME VON ANNOTATIONS- UND MEHRSPRACHIGEN SYNTAKTISCHEN ANALYSEWERKZEUGEN ZU ENTWICKELN. AUF DER ANDEREN SEITE WIRD IN BEZUG AUF DIE ERWARTETE GEWINNUNG VON RESSOURCEN EINE ERSTE ANNÄHERUNG AN DIE ANNOTATION EINES TEILS DES MATERIALS VORGENOMMEN, DER HINWEISE ENTHÄLT, DIE FÜR IHRE NUTZUNG IN ELE RELEVANT SIND, WIE DAS THEMA UND DIE KOMMUNIKATIVE FUNKTION DER KORPUSSEQUENZEN. _x000D_ 2. SPRACHLICHE ANALYSE DER REDE. MIT DER ANMERKUNG UND DEN METADATEN DER LÄNGE UND DER KONSULTATIONSANWENDUNG, DIE IHRE WIEDERHERSTELLUNG DURCH KOMBINIERTE RECHERCHEN BEREITS ERLEICHTERT, WERDEN NEUE ANALYSEN RELEVANTER PHENOMENES DER MÜNDLICHEN SPRACHE BEHANDELT. AUF DER LEXICO-GRAMTICAL-EBENE ERMÖGLICHT DIE ORDNUNGSGEMÄSSE VERARBEITUNG VON MATERIALIEN DIE VERTEILUNG UND HÄUFIGKEIT GRAMMATIKALISCHER SLOGANS UND KATEGORIEN ZU EXTRAHIEREN UND ZU ANALYSIEREN, UM EIN FREQUENZWÖRTERBUCH ZU ERSTELLEN, DAS SICH SPEZIELL AUF MÜNDLICHE SPRACHDATEN STÜTZT. ANDERERSEITS WIRD NEBEN DEN BEREITS DURCHGEFÜHRTEN STUDIEN ZU KONSTRUKTIONEN UND VERBALEN FORMEN DAS PHÄNOMEN DER ABWECHSLUNG ODER ÄNDERUNG DES SPANISCH-GALLEGO-CODES ANALYSIERT. Die sozial und pragmatisch-diskursive PERSPECTIVE ist in sprachlichen Analysen präsent und ist mit dem Status von Auffüllungen, Aktionen und Ideen verbunden, die im Gegensatz zum registrierten Gespräch mit Daten entwickelt werden, die im Prozess von CORPUS ELABORATION gesammelt wurden._x000D_ 3. GEWINNUNG VON RESSOURCEN. MIT DEM ZIEL, WIEDERVERWENDBARE RESSOURCEN VON ALLGEMEINEM ÖFFENTLICHEM INTERESSE ZU ENTWICKELN, WIRD AUF DIE SCHAFFUNG NÜTZLICHER SPRACHLICHER INSTRUMENTE IN VERSCHIEDENEN BEREICHEN IM ZUSAMMENHANG MIT DER MÜNDLICHEN SPRACHE EINGEGANGEN. NEBEN DEN BEREITS ZITIERTEN BERECHNUNGSWERKZEUGEN WIRD DIE VERWENDUNG DES KORPUS FÜR DEN SPANISCHUNTERRICHT ALS FREMDSPRACHE HERVORGEHOBEN, SOWOHL BEI DER VORBEREITUNG VON MATERIALIEN ZUR BEHANDLUNG DER PHÄNOMENE DER BESONDEREN SCHWIERIGKEIT IN DER MÜNDLICHEN INTERAKTION IM UNTERRICHT ALS AUCH BEI DER GESTALTUNG VON AKTIVITÄTEN DES COMPUTERGESTÜTZTEN SPRACHLERNENS, DIE ALLE MÜNDLICHEN FÄHIGKEITEN DURCH DIE EIGENE KONSULTATIONSANWENDUNG AUSÜBEN. UNTER AUSNUTZUNG DER AUSRICHTUNG VON TEXT UND AUDIO DES KORPUS ENTHÄLT DAS FREQUENZWÖRTERBUCH IN ELECTRONICA AUCH SOFORTIGEN ZUGRIFF AUF DIE TEXT- UND KLANGFRAGMENTE, DIE DEN LEXIKALISCHEN EINTRÄGEN ENTSPRECHEN. (German)
9 December 2021
0 references
Het PROJECT PART VAN DE VOLGENDE ONTWIKKELINGsfose van de helling van de CORPUS EN PROPOSES NIEUW VIAS VAN ENRIQUECIENTIE EN EXPLOTACTIE die het mogelijk maakt om te worden uitgebreid in de COMPUTATIONAL TREATMENT VAN ORAL CORPUS ALS IN HET WETEN VAN ORAL COMMUNICATIE EN IN DE ELABORATIE VAN MATERIËLE EN TOOLS VAN INTERESTEN VAN PUBLICO._x000D_ 1. VERRIJKING VAN HET CORPUS. OM HET SUCCESPERCENTAGE VAN DE LABELER EN DE BESTAANDE MORFOSINTACTICA-ANNOTATIE TE VERBETEREN, WORDEN NIEUWE FORMULIERENHERKENNINGSFUNCTIES (NUMERALS, MULTIWORD-EENHEDEN, APPRECIATIEVE ACHTERVOEGSELS), HET CORPUS VAN OPLEIDING EN LEXICON UITGEBREID EN WORDEN TAALBEPERKINGEN INGEVOERD DIE EEN AANVULLING VORMEN OP DE STATISTISCHE METHODE OP BASIS VAN EEN KWALITATIEVE ANALYSE VAN DE RESTERENDE FOUTEN. DE VERBETERDE MORFOSINTACTICA ANNOTACION DIENT ZOWEL OM DE KWALITEIT VAN HET BESTAANDE CORPUS TE VERBETEREN ALS OM TE WORDEN GEBRUIKT ALS BASIS VOOR DE OPRICHTING VAN EEN BOOMBANK (TREEBANK) BESCHIKBAAR IN TWEE VERSCHILLENDE FORMATEN EN DIEPTENIVEAUS: EEN CONSTITUTIEF MEER GEDETAILLEERD EN EEN ANDER MINDER GEDETAILLEERD, DIT LAATSTE IS INGEBED IN HET INTERNATIONALE SAMENWERKINGSPROJECT VOOR UNIVERSELE AFHANKELIJKHEDEN, DAT TOT DOEL HEEFT SYSTEMEN VAN ANNOTATIE EN MEERTALIGE SYNTACTISCHE ANALYSE-INSTRUMENTEN TE ONTWIKKELEN. ANDERZIJDS WORDT MET BETREKKING TOT DE VERWACHTE WINNING VAN HULPBRONNEN EEN EERSTE BENADERING GEMAAKT VAN DE ANNOTATIE VAN EEN DEEL VAN DE MATERIALEN MET AANWIJZINGEN DIE RELEVANT ZIJN VOOR DE EXPLOITATIE ERVAN IN ELE, ZOALS HET ONDERWERP EN DE COMMUNICATIEVE FUNCTIE VAN DE CORPUSSEQUENTIES. _x000D_ 2. TAALKUNDIGE ANALYSE VAN DE SPRAAK. MET DE ANNOTATIE EN METAGEGEVENS VAN LENGTE EN DE RAADPLEGINGSAPPLICATIE DIE HUN HERSTEL AL VERGEMAKKELIJKT DOOR MIDDEL VAN GECOMBINEERDE ZOEKOPDRACHTEN, WORDEN NIEUWE ANALYSES VAN RELEVANTE PHENOMENES VAN DE MONDELINGE TAAL BEHANDELD. OP HET NIVEAU VAN LEXICO-GRAMTICAL MAAKT DE JUISTE VERWERKING VAN MATERIALEN HET MOGELIJK DE VERSPREIDING EN FREQUENTIE VAN GRAMMATICALE SLOGANS EN CATEGORIEËN TE EXTRAHEREN EN TE ANALYSEREN OM EEN FREQUENTIEWOORDENBOEK TE PRODUCEREN DAT SPECIFIEK IS GEBASEERD OP MONDELINGE TAALGEGEVENS. AAN DE ANDERE KANT WORDT, NAAST DE REEDS UITGEVOERDE STUDIES OVER CONSTRUCTIES EN VERBALE VORMEN, HET FENOMEEN VAN HET WISSELEN OF WIJZIGEN VAN DE SPAANS-GALLEGO-CODE GEANALYSEERD. De sociale en pragmatisch-discursieve PERSPECTIVE is aanwezig in taalanalyses en houdt verband met de status van aanvullingen, acties en ideeën die worden ontwikkeld door het geregistreerde gesprek te contrasteren met gegevens die zijn verzameld in het proces van CORPUS ELABORATION._x000D_ 3. WINNING VAN HULPBRONNEN. MET HET OOG OP DE ONTWIKKELING VAN HERBRUIKBARE MIDDELEN VAN ALGEMEEN OPENBAAR BELANG WORDT AANDACHT BESTEED AAN DE INVOERING VAN NUTTIGE TAALINSTRUMENTEN OP VERSCHILLENDE GEBIEDEN DIE VERBAND HOUDEN MET DE MONDELINGE TAAL. NAAST DE REEDS AANGEHAALDE REKENINSTRUMENTEN WORDT HET GEBRUIK VAN HET CORPUS VOOR HET ONDERWIJZEN VAN SPAANS ALS VREEMDE TAAL BENADRUKT, ZOWEL BIJ DE VOORBEREIDING VAN MATERIALEN OM IN DE KLAS DE FENOMENEN VAN BIJZONDERE MOEILIJKHEDEN BIJ MONDELINGE INTERACTIE TE BEHANDELEN, ALS BIJ HET ONTWERPEN VAN ACTIVITEITEN VAN COMPUTERONDERSTEUND TAALONDERWIJS DIE ALLE MONDELINGE VAARDIGHEDEN UITOEFENEN VIA DE EIGEN RAADPLEGINGSAPPLICATIE. OOK, PROFITEREND VAN DE UITLIJNING VAN TEKST EN AUDIO VAN HET CORPUS, HET FREQUENTIE WOORDENBOEK IN ELECTRONICA VERSIE BEVAT ONMIDDELLIJKE TOEGANG TOT DE TEKST EN GELUID FRAGMENTEN DIE OVEREENKOMEN MET DE LEXICALE INGANGEN. (Dutch)
17 December 2021
0 references
La PARTE DEL PROGETTO DELLO SVILUPPO PREVIDENTE FOSTO DEL CORPO SLOOR E PROPOSE NUOVI VIA DI INIQUECIENZA E ESPLOTAZIONE che consentono di essere soggetti al trattamento COMPUTATIONALE di CORPUS ORALE NELLA CONNOZIONE DELLA COMUNICAZIONE ORALE E NELL'ELABORAZIONE DELLE MATERIALI E DEGLI INTERESSI DI PUBLICO._x000D_ 1. ARRICCHIMENTO DEL CORPUS. AL FINE DI MIGLIORARE IL TASSO DI SUCCESSO DELL'ETICHETTATORE E DELL'ANNOTAZIONE MORFOSINTACTICA ESISTENTE, VENGONO AMPLIATE LE FUNZIONALITÀ DI RICONOSCIMENTO DI NUOVE FORME (NUMERALI, UNITÀ MULTIWORD, SUFFISSI APPREZZATIVI), IL CORPUS DI FORMAZIONE E LESSICO VIENE AMPLIATO E VENGONO INTRODOTTE RESTRIZIONI LINGUISTICHE CHE INTEGRANO IL METODO STATISTICO BASATO SU UN'ANALISI QUALITATIVA DEGLI ERRORI RIMANENTI. IL MIGLIORAMENTO DELLA MORFOSINTACTICA ANNOTACION SERVE SIA AD AUMENTARE LA QUALITÀ DEL CORPUS ESISTENTE SIA AD ESSERE UTILIZZATA COME BASE PER LA CREAZIONE DI UNA BANCA AD ALBERO (TREEBANK) DISPONIBILE IN DUE DIVERSI FORMATI E LIVELLI DI PROFONDITÀ: UNA COSTITUTIVA PIÙ DETTAGLIATA E UN'ALTRA DEPENDENTIAL MENO DETTAGLIATA, QUEST'ULTIMA INQUADRATA NEL PROGETTO INTERNAZIONALE DI DIPENDENZE UNIVERSALI COLLABORATIVE, CHE MIRA A SVILUPPARE SISTEMI DI ANNOTAZIONE E STRUMENTI DI ANALISI SINTATTICA MULTILINGUA. D'ALTRA PARTE, PER QUANTO RIGUARDA L'ESTRAZIONE PREVISTA DELLE RISORSE, VIENE FATTA UNA PRIMA APPROSSIMAZIONE ALL'ANNOTAZIONE DI UNA PARTE DEI MATERIALI CON INDICAZIONI RILEVANTI PER IL LORO SFRUTTAMENTO IN ELE, COME IL SOGGETTO E LA FUNZIONE COMUNICATIVA DELLE SEQUENZE DEL CORPUS. _x000D_ 2. ANALISI LINGUISTICA DEL DISCORSO. CON L'ANNOTAZIONE E I METADATI DI LUNGHEZZA E L'APPLICAZIONE DI CONSULTAZIONE CHE GIÀ NE FACILITA IL RECUPERO ATTRAVERSO RICERCHE COMBINATE, VENGONO AFFRONTATE NUOVE ANALISI DEI PERTINENTI PHENOMENES DELLA LINGUA ORALE. A LIVELLO LESSICO-GRAMTICALE, LA CORRETTA ELABORAZIONE DEI MATERIALI CONSENTE DI ESTRARRE E ANALIZZARE LA DISTRIBUZIONE E LA FREQUENZA DI SLOGAN E CATEGORIE GRAMMATICALI PER PRODURRE UN DIZIONARIO DI FREQUENZA BASATO SPECIFICAMENTE SUI DATI DELLA LINGUA ORALE. D'ALTRO CANTO, OLTRE AGLI STUDI SULLE COSTRUZIONI E SULLE FORME VERBALI GIÀ INTRAPRESI, VIENE ANALIZZATO IL FENOMENO DELL'ALTERNANZA O DELLA MODIFICA DEL CODICE SPAGNOLO-GALLEGO. La PERSPECTIVE sociale e pragmatica-discursiva è presente nelle analisi linguistiche ed è connessa allo stato di reintegrazioni, azioni e idee che si sviluppano contrastando la conversazione registrata con i dati raccolti nel processo di CORPUS ELABORATION._x000D_ 3. ESTRAZIONE DI RISORSE. ALLO SCOPO DI SVILUPPARE RISORSE RIUTILIZZABILI DI INTERESSE PUBBLICO GENERALE, SI AFFRONTA LA CREAZIONE DI STRUMENTI LINGUISTICI UTILI IN DIVERSI SETTORI LEGATI ALLA LINGUA ORALE. OLTRE AGLI STRUMENTI COMPUTAZIONALI GIÀ CITATI, SI EVIDENZIA L'USO DEL CORPUS PER L'INSEGNAMENTO DELLO SPAGNOLO COME LINGUA STRANIERA, SIA NELLA PREPARAZIONE DI MATERIALI DA TRATTARE IN CLASSE I FENOMENI DI PARTICOLARE DIFFICOLTÀ NELL'INTERAZIONE ORALE, SIA NELLA PROGETTAZIONE DI ATTIVITÀ DI APPRENDIMENTO LINGUISTICO ASSISTITA DA COMPUTER CHE ESERCITANO TUTTE LE COMPETENZE ORALI ATTRAVERSO LA PROPRIA APPLICAZIONE DI CONSULTAZIONE. INOLTRE, SFRUTTANDO L'ALLINEAMENTO DEL TESTO E DELL'AUDIO DEL CORPUS, IL DIZIONARIO DELLE FREQUENZE IN VERSIONE ELECTRONICA INCORPORA L'ACCESSO IMMEDIATO AI FRAMMENTI TESTUALI E SONORI CORRISPONDENTI ALLE VOCI LESSICALI. (Italian)
16 January 2022
0 references
ΛΑΜΒΆΝΟΝΤΑΣ ΩΣ ΒΆΣΗ ΤΟ ΈΡΓΟ ΠΟΥ ΕΠΙΤΕΛΈΣΤΗΚΕ ΣΤΟ ΠΛΑΊΣΙΟ ΤΩΝ ΠΡΟΗΓΟΎΜΕΝΩΝ ΣΧΕΔΊΩΝ ESLORA, Η ΠΑΡΟΎΣΑ ΠΡΌΤΑΣΗ ΑΠΟΣΚΟΠΕΊ ΣΤΗΝ ΑΝΆΠΤΥΞΗ ΝΈΩΝ ΤΡΌΠΩΝ ΕΜΠΛΟΥΤΙΣΜΟΎ ΚΑΙ ΕΚΜΕΤΆΛΛΕΥΣΗΣ ΠΟΥ ΕΠΙΤΡΈΠΟΥΝ ΤΗΝ ΕΠΊΤΕΥΞΗ ΠΡΟΌΔΟΥ ΠΡΟΣ ΤΗΝ ΥΠΟΛΟΓΙΣΤΙΚΉ ΑΝΤΙΜΕΤΏΠΙΣΗ ΤΩΝ ΣΤΟΜΑΤΙΚΏΝ ΣΩΜΆΤΩΝ, ΤΗΝ ΚΑΤΑΝΌΗΣΗ ΤΗΣ ΠΡΟΦΟΡΙΚΉΣ ΕΠΙΚΟΙΝΩΝΊΑΣ ΚΑΙ ΤΗΝ ΑΝΆΠΤΥΞΗ ΥΛΙΚΏΝ ΚΑΙ ΕΡΓΑΛΕΊΩΝ ΔΗΜΌΣΙΟΥ ΣΥΜΦΈΡΟΝΤΟΣ. _x000D_ 1. ΕΜΠΛΟΥΤΙΣΜΌΣ ΤΟΥ ΣΏΜΑΤΟΣ. ΓΙΑ ΤΗ ΒΕΛΤΊΩΣΗ ΤΟΥ ΠΟΣΟΣΤΟΎ ΕΠΙΤΥΧΊΑΣ ΤΟΥ TAGGER ΚΑΙ ΤΗΣ ΥΠΆΡΧΟΥΣΑΣ ΜΟΡΦΟΣΥΝΤΑΚΤΙΚΉΣ ΣΗΜΕΊΩΣΗΣ, ΕΦΑΡΜΌΖΟΝΤΑΙ ΛΕΙΤΟΥΡΓΊΕΣ ΑΝΑΓΝΏΡΙΣΗΣ ΝΈΩΝ ΜΟΡΦΏΝ (ΓΡΑΠΤΟΊ ΑΡΙΘΜΟΊ ΚΑΡΔΙΝΑΛΊΟΥ, ΜΟΝΆΔΕΣ ΠΟΛΛΑΠΛΏΝ ΛΈΞΕΩΝ, ΕΚΤΙΜΏΜΕΝΕΣ ΕΠΙΘΉΜΑΤΑ), ΕΠΕΚΤΕΊΝΟΝΤΑΙ ΤΑ ΕΚΠΑΙΔΕΥΤΙΚΆ ΣΏΜΑΤΑ ΚΑΙ ΤΟ ΛΕΞΙΛΌΓΙΟ ΚΑΙ ΕΙΣΆΓΟΝΤΑΙ ΓΛΩΣΣΙΚΟΊ ΠΕΡΙΟΡΙΣΜΟΊ ΠΟΥ ΣΥΜΠΛΗΡΏΝΟΥΝ ΤΗ ΣΤΑΤΙΣΤΙΚΉ ΜΈΘΟΔΟ ΜΕ ΒΆΣΗ ΤΗΝ ΠΟΙΟΤΙΚΉ ΑΝΆΛΥΣΗ ΤΩΝ ΕΝΑΠΟΜΕΙΝΆΝΤΩΝ ΣΦΑΛΜΆΤΩΝ. Η ΒΕΛΤΙΩΜΈΝΗ ΜΟΡΦΟΣΥΝΤΑΚΤΙΚΉ ΣΗΜΕΊΩΣΗ ΧΡΗΣΙΜΕΎΕΙ ΩΣ ΒΆΣΗ ΤΌΣΟ ΓΙΑ ΤΗΝ ΑΎΞΗΣΗ ΤΗΣ ΠΟΙΌΤΗΤΑΣ ΤΟΥ ΥΠΆΡΧΟΝΤΟΣ ΣΏΜΑΤΟΣ ΌΣΟ ΚΑΙ ΓΙΑ ΤΗ ΔΗΜΙΟΥΡΓΊΑ ΕΝΌΣ TREEBANK ΔΙΑΘΈΣΙΜΟΥ ΣΕ ΔΎΟ ΔΙΑΦΟΡΕΤΙΚΈΣ ΜΟΡΦΈΣ ΚΑΙ ΕΠΊΠΕΔΑ ΒΆΘΟΥΣ: ΜΙΑ ΛΕΠΤΟΜΕΡΈΣΤΕΡΗ ΣΥΣΤΑΤΙΚΉ ΚΑΙ ΆΛΛΗ ΛΙΓΌΤΕΡΟ ΛΕΠΤΟΜΕΡΉ ΜΕ ΒΆΣΗ ΤΙΣ ΕΞΑΡΤΉΣΕΙΣ, Η ΟΠΟΊΑ ΕΝΤΆΣΣΕΤΑΙ ΣΤΟ ΔΙΕΘΝΈΣ ΣΥΝΕΡΓΑΤΙΚΌ ΈΡΓΟ ΚΑΘΟΛΙΚΈΣ ΕΞΑΡΤΉΣΕΙΣ ΠΟΥ ΑΠΟΣΚΟΠΟΎΝ ΣΤΗΝ ΑΝΆΠΤΥΞΗ ΠΟΛΎΓΛΩΣΣΩΝ ΣΥΣΤΗΜΆΤΩΝ ΣΧΟΛΙΑΣΜΟΎ ΚΑΙ ΠΟΛΎΓΛΩΣΣΩΝ ΕΡΓΑΛΕΊΩΝ ΑΝΆΛΥΣΗΣ. ΣΧΕΤΙΚΑ ΜΕ ΤΟ ΑΛΛΟ ΧΕΙΡΟ, ΣΧΕΤΙΚΑ ΜΕ ΤΗΝ ΕΚΤΕΛΕΣΗ ΤΩΝ ΥΛΙΚΩΝ ΜΕ ΤΩΝ ΠΛΗΡΟΦΟΡΙΩΝ, ΠΟΥ ΠΡΕΠΕΙ ΝΑ ΕΦΑΡΜΟΖΟΝΤΑΙ ΣΤΗ ΔΗΜΟΣΙΕΥΣΗ ΤΗΣ ΙΣΠΑΝΙΑΣ ΩΣ ΕΝΟΣ ΜΕΡΟΥΣ ΤΩΝ ΥΛΙΚΩΝ ΜΕ ΠΛΗΡΟΦΟΡΙΕΣ ΠΟΥ ΠΡΕΠΕΙ ΝΑ ΠΕΡΙΛΑΜΒΑΝΟΝΤΑΙ ΣΤΗ ΔΗΜΟΣΙΕΥΣΗ ΤΗΣ ΙΣΠΑΝΙΑΣ ΩΣ ΕΝΔΙΑΦΕΡΟΝΤΑΙ ΜΕ ΤΗ ΔΙΟΙΚΗΤΙΚΗ ΝΟΜΟΘΕΣΙΑ, ΠΡΕΠΕΙ ΝΑ ΑΝΑΓΝΩΡΙΖΟΝΤΑΙ ΚΑΙ ΚΟΙΝΟΤΙΚΗ ΛΕΙΤΟΥΡΓΙΑ ΤΟΥ CORPUS SEQUENCES._x000D_ 2. ΓΛΩΣΣΙΚΉ ΑΝΆΛΥΣΗ ΤΗΣ ΟΜΙΛΊΑΣ. ΜΕ ΤΟ ΣΧΌΛΙΟ ΚΑΙ ΤΑ ΜΕΤΑΔΕΔΟΜΈΝΑ ΤΗΣ ESLORA ΚΑΙ ΤΗ ΔΙΕΠΑΦΉ ΑΝΑΖΉΤΗΣΗΣ ΠΟΥ ΉΔΗ ΔΙΕΥΚΟΛΎΝΕΙ ΤΗΝ ΑΝΆΚΡΙΣΉ ΤΗΣ ΜΈΣΩ ΣΥΝΔΥΑΣΜΈΝΩΝ ΑΝΑΖΗΤΉΣΕΩΝ, ΕΞΕΤΆΖΟΝΤΑΙ ΝΈΕΣ ΑΝΑΛΎΣΕΙΣ ΣΧΕΤΙΚΏΝ ΦΑΙΝΟΜΈΝΩΝ ΤΗΣ ΠΡΟΦΟΡΙΚΉΣ ΓΛΏΣΣΑΣ. ΣΤΟ ΛΕΞΙΛΟΓΙΚΌ-ΓΡΑΜΜΑΤΙΚΌ ΕΠΊΠΕΔΟ, Η ΣΩΣΤΉ ΕΠΕΞΕΡΓΑΣΊΑ ΤΩΝ ΥΛΙΚΏΝ ΕΠΙΤΡΈΠΕΙ ΤΗΝ ΕΞΑΓΩΓΉ ΚΑΙ ΑΝΆΛΥΣΗ ΤΗΣ ΚΑΤΑΝΟΜΉΣ ΚΑΙ ΤΗΣ ΣΥΧΝΌΤΗΤΑΣ ΤΩΝ ΛΕΜΜΆΤΩΝ ΚΑΙ ΤΩΝ ΓΡΑΜΜΑΤΙΚΏΝ ΚΑΤΗΓΟΡΙΏΝ ΓΙΑ ΤΗΝ ΑΝΆΠΤΥΞΗ ΕΝΌΣ ΛΕΞΙΚΟΎ ΣΥΧΝΌΤΗΤΑΣ ΠΟΥ ΒΑΣΊΖΕΤΑΙ ΕΙΔΙΚΆ ΣΕ ΔΕΔΟΜΈΝΑ ΟΜΙΛΟΎΜΕΝΗΣ ΓΛΏΣΣΑΣ. ΑΠΌ ΤΗΝ ΆΛΛΗ ΠΛΕΥΡΆ, ΕΚΤΌΣ ΑΠΌ ΤΙΣ ΜΕΛΈΤΕΣ ΓΙΑ ΤΙΣ ΚΑΤΑΣΚΕΥΈΣ ΚΑΙ ΤΙΣ ΠΡΟΦΟΡΙΚΈΣ ΜΟΡΦΈΣ ΠΟΥ ΈΧΟΥΝ ΉΔΗ ΑΝΑΛΗΦΘΕΊ, ΑΝΑΛΎΕΤΑΙ ΤΟ ΦΑΙΝΌΜΕΝΟ ΤΗΣ ΙΣΠΑΝΟΓΑΛΙΚΙΑΝΉΣ ΜΕΤΑΤΡΟΠΉΣ ΚΏΔΙΚΑ. Η κοινωνιογλωσσική και η PRAGMATIC-discursive PERSPECTIVE ΠΡΟΣΩΠΙΚΟΣ ΠΡΟΕΔΡΙΑΣ ΣΤΗΝ LINGUISTIC ANALYSES ΚΑΙ ΣΥΜΦΩΝΑ ΜΕ ΤΗ ΜΕΛΕΤΗ ΑΝΤΙΠΡΟΣΩΠΩΝ, ΟΡΓΑΝΙΣΜΩΝ και ΙΔΙΟΓΡΑΦΙΩΝ που ΑΝΑΠΤΥΞΙΖΟΝΤΑΙ ΑΠΟ ΤΗΝ ΑΝΑΓΝΩΡΙΖΟΜΕΝΗ ΕΙΔΙΚΗ ΕΙΔΙΚΗ ΜΕ ΤΙΣ ΣΥΓΚΕΝΤΡΩΜΕΝΕΣ ΕΡΩΤΗΣΕΙΣ των ΔΕΔΟΜΕΝΩΝ ΣΤΙΣ ΔΙΑΔΙΚΑΣΙΕΣ ΠΑΡΑΚΟΛΟΥΘΗΣΗΣ ΤΟΥ CORPUS._x000D_ 3. ΕΞΌΡΥΞΗ ΠΌΡΩΝ. ΜΕ ΣΤΌΧΟ ΤΗΝ ΑΝΆΠΤΥΞΗ ΕΠΑΝΑΧΡΗΣΙΜΟΠΟΙΉΣΙΜΩΝ ΠΌΡΩΝ ΓΕΝΙΚΟΎ ΔΗΜΌΣΙΟΥ ΣΥΜΦΈΡΟΝΤΟΣ, ΕΞΕΤΆΖΕΤΑΙ Η ΔΗΜΙΟΥΡΓΊΑ ΧΡΉΣΙΜΩΝ ΓΛΩΣΣΙΚΏΝ ΜΈΣΩΝ ΣΕ ΔΙΆΦΟΡΟΥΣ ΤΟΜΕΊΣ ΠΟΥ ΣΧΕΤΊΖΟΝΤΑΙ ΜΕ ΤΗΝ ΠΡΟΦΟΡΙΚΉ ΓΛΏΣΣΑ. ΕΚΤΌΣ ΑΠΌ ΤΑ ΥΠΟΛΟΓΙΣΤΙΚΆ ΕΡΓΑΛΕΊΑ ΠΟΥ ΈΧΟΥΝ ΉΔΗ ΑΝΑΦΕΡΘΕΊ, ΞΕΧΩΡΊΖΕΙ Η ΧΡΉΣΗ ΤΟΥ ΣΏΜΑΤΟΣ ΓΙΑ ΤΗ ΔΙΔΑΣΚΑΛΊΑ ΤΩΝ ΙΣΠΑΝΙΚΏΝ ΩΣ ΞΈΝΗΣ ΓΛΏΣΣΑΣ, ΤΌΣΟ ΣΤΗΝ ΕΚΠΌΝΗΣΗ ΥΛΙΚΟΎ ΓΙΑ ΤΗΝ ΑΝΤΙΜΕΤΏΠΙΣΗ ΤΩΝ ΦΑΙΝΟΜΈΝΩΝ ΙΔΙΑΊΤΕΡΗΣ ΔΥΣΚΟΛΊΑΣ ΣΤΗΝ ΠΡΟΦΟΡΙΚΉ ΑΛΛΗΛΕΠΊΔΡΑΣΗ ΣΤΗΝ ΤΆΞΗ, ΌΣΟ ΚΑΙ ΣΤΟΝ ΣΧΕΔΙΑΣΜΌ ΤΩΝ ΔΡΑΣΤΗΡΙΟΤΉΤΩΝ ΤΗΣ «ΕΚΜΆΘΗΣΗΣ ΓΛΩΣΣΏΝ ΥΠΟΒΟΗΘΟΎΜΕΝΗΣ ΑΠΌ ΥΠΟΛΟΓΙΣΤΈΣ» ΠΟΥ ΒΟΗΘΟΎΝ ΣΤΗΝ ΚΑΤΆΡΤΙΣΗ ΌΛΩΝ ΤΩΝ ΠΡΟΦΟΡΙΚΏΝ ΔΕΞΙΟΤΉΤΩΝ ΜΈΣΩ ΔΙΕΠΑΦΏΝ ΑΝΑΖΉΤΗΣΗΣ ΜΕ ΒΆΣΗ ΤΟ ΔΙΑΔΊΚΤΥΟ. ΕΠΊΣΗΣ, ΑΞΙΟΠΟΙΏΝΤΑΣ ΤΟ ΚΕΊΜΕΝΟ ΚΑΙ ΤΗΝ ΗΧΗΤΙΚΉ ΕΥΘΥΓΡΆΜΜΙΣΗ ΤΟΥ ΣΏΜΑΤΟΣ, ΤΟ ΛΕΞΙΚΌ ΣΥΧΝΟΤΉΤΩΝ ΣΕ ΗΛΕΚΤΡΟΝΙΚΉ ΈΚΔΟΣΗ ΕΝΣΩΜΑΤΏΝΕΙ ΤΗΝ ΆΜΕΣΗ ΠΡΌΣΒΑΣΗ ΣΤΑ ΘΡΑΎΣΜΑΤΑ ΚΕΙΜΈΝΟΥ ΚΑΙ ΉΧΟΥ ΠΟΥ ΑΝΤΙΣΤΟΙΧΟΎΝ ΣΤΙΣ ΛΕΞΙΚΈΣ ΚΑΤΑΧΩΡΉΣΕΙΣ. (Greek)
17 August 2022
0 references
MED UDGANGSPUNKT I DET ARBEJDE, DER ER UDFØRT UNDER DE TIDLIGERE ESLORA-PROJEKTER, HAR DET NUVÆRENDE FORSLAG TIL FORMÅL AT UDVIKLE NYE METODER TIL BERIGELSE OG UDNYTTELSE, DER GØR DET MULIGT AT GØRE FREMSKRIDT HEN IMOD BEREGNING AF ORAL KORPORA, FORSTÅELSE AF TALEKOMMUNIKATION OG UDARBEJDELSE AF MATERIALER OG VÆRKTØJER AF OFFENTLIG INTERESSE. _x000D_ 1. BERIGELSE AF CORPUS. FOR AT FORBEDRE TAGGERENS SUCCESRATE OG DEN EKSISTERENDE MORFOSYNTAKTISK ANMÆRKNING, ER DER IMPLEMENTERET NYE FORMGENKENDELSESFUNKTIONER (SKRIFTLIGE KARDINALNUMRE, FLERORDSENHEDER, APPRECIATIVE SUFFIKSER), TRÆNINGSKORPUS OG LEXICON UDVIDES, OG DER INDFØRES SPROGLIGE BEGRÆNSNINGER, DER SUPPLERER DEN STATISTISKE METODE BASERET PÅ KVALITATIV ANALYSE AF DE RESTERENDE FEJL. DEN FORBEDREDE MORFOSYNTAKTISKE ANMÆRKNING TJENER SOM GRUNDLAG BÅDE FOR AT ØGE KVALITETEN AF DET EKSISTERENDE CORPUS OG FOR AT GENERERE EN TREEBANK, DER ER TILGÆNGELIG I TO FORSKELLIGE FORMATER OG DYBDENIVEAUER: EN MERE DETALJERET SAMMENSÆTNING, DER ER MINDRE DETALJERET BASERET PÅ AFHÆNGIGHEDER, IDET SIDSTNÆVNTE INDGÅR I DET INTERNATIONALE SAMARBEJDSPROJEKTS UNIVERSELLE AFHÆNGIGHEDER, DER HAR TIL FORMÅL AT UDVIKLE FLERSPROGEDE ANNOTATIONSSYSTEMER OG FLERSPROGEDE PARSINGVÆRKTØJER. På den anden side er der i forbindelse med den EXPECTED EXTRACTION of RESOURCES, en INITIAL APPROXIMATION, foretaget af en afdeling af MATERIALE med oplysninger, der er fremkommet med oplysninger i forbindelse med opførelsen af SPANISH som en FOREIGN LANGUAGE, SUCHENS DENNE IDENTIFIKATION og KOMMUNIKTIVELSE AF CORPUSSEQUENCES._x000D_ 2. SPROGLIG ANALYSE AF TALE. MED ANMÆRKNINGEN OG METADATA FRA ESLORA OG SØGEGRÆNSEFLADEN, DER ALLEREDE LETTER DETS AFHØRING VED HJÆLP AF KOMBINEREDE SØGNINGER, BEHANDLES NYE ANALYSER AF RELEVANTE FÆNOMENER AF TALT SPROG. PÅ DET LEKSIKALSKE-GRAMMATISKE NIVEAU GØR KORREKT BEHANDLING AF MATERIALERNE DET MULIGT AT UDTRÆKKE OG ANALYSERE FORDELINGEN OG HYPPIGHEDEN AF LEMMAS OG GRAMMATISKE KATEGORIER FOR AT UDVIKLE EN FREKVENSORDBOG BASERET SPECIFIKT PÅ TALTE SPROGDATA. PÅ DEN ANDEN SIDE ANALYSERES UD OVER DE UNDERSØGELSER AF KONSTRUKTIONER OG VERBALE FORMER, DER ALLEREDE ER GENNEMFØRT, FÆNOMENET SPANSK-GALICISK KODESKIFT. Det sociolingvist- og PRAGMATIC-discursive PERSPECTIVE er fremtrædende i de LINGUISTISKE ANALYSER og er blevet forbundet med hensyn til REPRÆSENTATIONER, ATTITUDER og IDEOLOGIER, som er blevet udskilt af de personer, der er tilknyttet den kompetente myndighed, med de kompetente myndigheder, der er i besiddelse af QUESTIONNAIRES i forbindelse med elicitationen af CORPUS._x000D_ 3. UDVINDING AF RESSOURCER. MED DET FORMÅL AT UDVIKLE GENANVENDELIGE RESSOURCER AF ALMEN OFFENTLIG INTERESSE TAGES DER FAT PÅ AT SKABE NYTTIGE SPROGLIGE INSTRUMENTER PÅ FORSKELLIGE OMRÅDER I FORBINDELSE MED TALESPROG. UD OVER DE COMPUTERVÆRKTØJER, DER ALLEREDE ER NÆVNT, SKILLER BRUGEN AF CORPUS TIL AT UNDERVISE I SPANSK SOM FREMMEDSPROG SIG UD, BÅDE I UDARBEJDELSEN AF MATERIALER TIL BEHANDLING AF FÆNOMENER MED SÆRLIGE VANSKELIGHEDER I TALTE INTERAKTIONER I KLASSEVÆRELSET SAMT I UDFORMNINGEN AF "COMPUTERSTØTTET SPROGINDLÆRING", DER HJÆLPER MED AT UDDANNE ALLE DE MUNDTLIGE FÆRDIGHEDER GENNEM WEBBASEREDE CORPUS-SØGEGRÆNSEFLADER. OGSÅ, VED AT DRAGE FORDEL AF TEKST OG LYDJUSTERING AF CORPUS, ORDBOGEN AF FREKVENSER I ELEKTRONISK VERSION INKORPORERER DEN UMIDDELBARE ADGANG TIL TEKST- OG LYDFRAGMENTER SVARENDE TIL DE LEKSIKALE POSTER. (Danish)
17 August 2022
0 references
EDELLISTEN ESLORA-HANKKEIDEN YHTEYDESSÄ TEHDYN TYÖN POHJALTA TÄMÄN EHDOTUKSEN TAVOITTEENA ON KEHITTÄÄ UUSIA RIKASTAMIS- JA HYÖDYNTÄMISTAPOJA, JOIDEN AVULLA VOIDAAN EDISTYÄ SUULLISEN KORPORAN LASKENNALLISESSA HOIDOSSA, SUULLISEN VIESTINNÄN YMMÄRTÄMISESSÄ SEKÄ YLEISTÄ ETUA KOSKEVIEN MATERIAALIEN JA VÄLINEIDEN KEHITTÄMISESSÄ. _x000D_ 1. RIKASTUS CORPUS. TAGGERIN ONNISTUMISASTEEN JA NYKYISEN MORFOSYNTAKTISEN HUOMAUTUKSEN PARANTAMISEKSI TOTEUTETAAN UUSIA LOMAKKEEN TUNNISTUSTOIMINTOJA (KIRJALLISET KARDINAALINUMEROT, MONISANAISET YKSIKÖT, ARVOSTAVAT LOPPULIITTEET), KOULUTUSKORPUS JA SANASTOA LAAJENNETAAN JA OTETAAN KÄYTTÖÖN KIELELLISIÄ RAJOITUKSIA, JOTKA TÄYDENTÄVÄT JÄLJELLÄ OLEVIEN VIRHEIDEN LAADULLISEEN ANALYYSIIN PERUSTUVAA TILASTOLLISTA MENETELMÄÄ. PARANNETUN MORFOSYNTAKTISEN HUOMAUTUKSEN AVULLA VOIDAAN SEKÄ PARANTAA OLEMASSA OLEVAN KORPUKSEN LAATUA ETTÄ LUODA TREEBANK, JOKA ON SAATAVILLA KAHDESSA ERI MUODOSSA JA SYVYYSTASOLLA: YKSITYISKOHTAISEMPI JA VÄHEMMÄN YKSITYISKOHTAINEN JÄRJESTELMÄ, JOKA PERUSTUU RIIPPUVUUKSIIN. JÄLKIMMÄISET ON MÄÄRITELTY KANSAINVÄLISESSÄ YHTEISTYÖHANKKEESSA, JONKA TAVOITTEENA ON KEHITTÄÄ MONIKIELISIÄ MERKINTÄJÄRJESTELMIÄ JA MONIKIELISIÄ JÄSENNYSVÄLINEITÄ. LISÄTTÄVÄT TUOMIOISTUIMEN TUOTTEIDEN ARVIOITUKSEN TIEDONANTO ON ALUEELLINEN SOPIMUKSEN TIEDONANTO TIETOJEN TIEDONANTO TIETOJEN TIEDONANTO TIETOJEN TIETOJEN TUOTTEIDEN TUOMIOISTUIMEN TUOTTEIDEN TIEDONANTOISTA TEHTÄVÄN TIEDONANTO TIETOJEN TIEDONANTOON TIEDONTÄMÄÄN TIEDONNÖN NÄKÖKSEN TEHTÄNTÖN TIETTÄVÄT TIETTYVÄNNÖÖNNÖÖN TIEDONTÄVÄNNÖN TIEDONANTA ON TIEDONTÄVÄNTÄMYKSEEN TEHTÄNTÖISESTIÄ TEHTÄNYS KOHJELMAISEN ON ON TÄMYKSEN MÄÄRÄSEKÄSEKSIEN TIEDöntöön TIEDös‑töönpanoon ON ON ÄÄNÄÄTTÄMÄÄNNÄ ÄÄNÄ TÄMÄÄNTÄÄN TIEDok?t?k? t? PUHEEN KIELELLINEN ANALYYSI. ESLORAN HUOMAUTUKSILLA JA METATIEDOILLA SEKÄ HAKURAJAPINNALLA, JOKA JO HELPOTTAA SEN KUULUSTELUA YHDISTETTYJEN HAKUJEN AVULLA, KÄSITELLÄÄN UUSIA PUHUTUN KIELEN ILMIÖITÄ KOSKEVIA ANALYYSEJA. LEKSI-GRAMMAATTISELLA TASOLLA MATERIAALIEN ASIANMUKAINEN KÄSITTELY MAHDOLLISTAA LEMMAS- JA KIELIOPILLISTEN LUOKKIEN JAKAUMAN JA TAAJUUDEN UUTTAMISEN JA ANALYSOINNIN, JOTTA VOIDAAN KEHITTÄÄ TAAJUUSSANAKIRJA, JOKA PERUSTUU ERITYISESTI PUHUTTUA KIELTÄ KOSKEVIIN TIETOIHIN. TOISAALTA JO TEHTYJEN RAKENNELMIA JA SANALLISIA MUOTOJA KOSKEVIEN TUTKIMUSTEN LISÄKSI ANALYSOIDAAN ESPANJAN JA GALICIAN VÄLISEN KOODINVAIHDON ILMIÖTÄ. Sosiolingvistiset JA PRAGMATIC-diskursiiviset henkilöt ovat mukana LINGUISTIC-ANALYSES-palveluissa ja ovat SOPIMUKSEN KÄYTTÖJÄRJESTELMÄT, ATTITUDES- JA IDEOLOGIIT, jotka ovat TÄYTÄNTÖÖN SOPIMUKSEN KOSKEVAT SOPIMUKSEN KÄYTTÖJÄRJESTELMÄT KOSKEVAT KOSKEVAT KOSKEVAT KOSKEVAT SÄÄNNÖT, joita CORPUS._x000D_ 3. RESURSSIEN LOUHINTA. YLEISEN EDUN MUKAISTEN UUDELLEENKÄYTETTÄVIEN RESURSSIEN KEHITTÄMISEKSI PYRITÄÄN LUOMAAN HYÖDYLLISIÄ KIELIVÄLINEITÄ PUHUTTUUN KIELEEN LIITTYVILLÄ ERI ALOILLA. EDELLÄ MAINITTUJEN LASKENNALLISTEN TYÖKALUJEN LISÄKSI KOROSTUU CORPUSIN KÄYTTÖ ESPANJAN OPETTAMISEEN VIERAANA KIELENÄ SEKÄ SELLAISTEN MATERIAALIEN LAADINNASSA, JOIDEN AVULLA VOIDAAN KÄSITELLÄ ERITYISEN VAIKEASTI PUHUTUN VUOROVAIKUTUKSEN ILMIÖITÄ LUOKKAHUONEESSA, SEKÄ SUUNNITELTAESSA ”TIETOKONEAVUSTEISTA KIELTENOPPIMISTA”, JOTKA AUTTAVAT KAIKKIEN SUULLISTEN TAITOJEN KOULUTTAMISESSA VERKKOPOHJAISTEN CORPUS-HAKULIITTYMIEN AVULLA. MYÖS, HYÖDYNTÄMÄLLÄ TEKSTIN JA ÄÄNEN LINJAUS CORPUS, SANAKIRJA TAAJUUDET SÄHKÖISESSÄ VERSIOSSA SISÄLTÄÄ VÄLITTÖMÄN PÄÄSYN TEKSTI- JA ÄÄNIFRAGMENTIT VASTAAVAT LEKSIKAALISET MERKINNÄT. (Finnish)
17 August 2022
0 references
FILWAQT LI TIEĦU L-ĦIDMA MWETTQA TAĦT IL-PROĠETTI PREĊEDENTI TA’ ESLORA BĦALA L-BAŻI TAGĦHA, IL-PROPOSTA ATTWALI GĦANDHA L-GĦAN LI TIŻVILUPPA MODI ĠODDA TA’ ARRIKKIMENT U SFRUTTAMENT LI JIPPERMETTU LI JSIR PROGRESS LEJN IT-TRATTAMENT KOMPUTAZZJONALI TAL-CORPORA ORALI, IL-FEHIM TAL-KOMUNIKAZZJONI MITKELLMA, U L-ELABORAZZJONI TA’ MATERJALI U GĦODOD TA’ INTERESS PUBBLIKU. _x000D_ 1. L-ARRIKKIMENT TAL-KORPUS. SABIEX TITTEJJEB IR-RATA TA’ SUĊĊESS TAT-TAGGER’S U L-ANNOTAZZJONI MORFOSINTATTIKA EŻISTENTI, JIĠU IMPLIMENTATI FUNZJONALITAJIET ĠODDA TA’ RIKONOXXIMENT TAL-FORMA (NUMRI MIKTUBIN TAL-KARDINALI, UNITAJIET B’ĦAFNA KLIEM, SUFFISSI APPREĊITTIVI), IL-KORP TA’ TAĦRIĠ U L-LEXICON JIĠU ESTIŻI, U JIĠU INTRODOTTI RESTRIZZJONIJIET LINGWISTIĊI LI JIKKUMPLIMENTAW IL-METODU STATISTIKU BBAŻAT FUQ ANALIŻI KWALITATTIVA TAL-IŻBALJI LI JIFDAL. L-ANNOTAZZJONI MORFOSINTATTIKA MTEJBA SSERVI BĦALA BAŻI KEMM BIEX TIŻDIED IL-KWALITÀ TAL-CORPUS EŻISTENTI KIF UKOLL BIEX JIĠI ĠĠENERAT TREEBANK DISPONIBBLI F’ŻEWĠ FORMATI U LIVELLI TA’ FOND DIFFERENTI: WAĦDA KOSTITUTTIVA AKTAR DETTALJATA U OĦRA INQAS DETTALJATA BBAŻATA FUQ ID-DIPENDENZI, B’DAN TAL-AĦĦAR JIĠI INKWADRAT FID-DIPENDENZI UNIVERSALI TAL-PROĠETT KOLLABORATTIV INTERNAZZJONALI LI GĦANDU L-GĦAN LI JIŻVILUPPA SISTEMI TA’ ANNOTAZZJONI MULTILINGWI U GĦODOD TA’ PARSING MULTILINGWI. Dwar IL-QASAM OĦRA, F’RELAZZAZZJONI GĦALL-EXTRAZZJONI EĊĊETTA TA’ RIŻORSI, AN APPROXIMAZZJONI INIZJONALI IS MADE GĦALL-ANNOTAZZJONI TA’ PARTI TAL-MATERJALI BIL-INFORMAZZJONI RELVATTIVA GĦALL-ESPOZZJONI TAS-SAĦĦA TAS-SAĦĦA KIF MILL-BASTIMENT FOREĠIJA, SUCHAS AS THEME IDENTIFICATION AND COMMUNICATIVE FUNCTION TAL-QASAM TAL-KORPJU. ANALIŻI LINGWISTIKA TAD-DISKORS. BL-ANNOTAZZJONI U L-METADATA TA’ ESLORA U L-INTERFAĊĊA TAT-TIFTIX LI DIĠÀ TIFFAĊILITA L-INTERROGAZZJONI TAGĦHA PERMEZZ TA’ TFITTXIJIET KOMBINATI, JIĠU INDIRIZZATI ANALIŻIJIET ĠODDA TAL-FENOMENI RILEVANTI TAL-LINGWA MITKELLMA. FIL-LIVELL LEXICAL-GRAMMATIKA, L-IPPROĊESSAR XIERAQ TAL-MATERJALI JIPPERMETTI L-ESTRAZZJONI U L-ANALIŻI TAD-DISTRIBUZZJONI U L-FREKWENZA TA’ KATEGORIJI TA’ LEMMI U GRAMMATIKALI BIEX JIĠI ŻVILUPPAT DIZZJUNARJU TA’ FREKWENZA BBAŻAT SPEĊIFIKAMENT FUQ DATA LINGWISTIKA MITKELLMA. MIN-NAĦA L-OĦRA, MINBARRA L-ISTUDJI DWAR IL-KOSTRUZZJONIJIET U L-FORMOLI VERBALI LI DIĠÀ SARU, IL-FENOMENU TAL-QLIB TAL-KODIĊI SPANJOL-GALICJAN HUWA ANALIZZAT. Il-PERSPECTIVA soċjo-lingwistika U PRAGMATIC hija PRESENTI fl-ANALJIET LINGWISTIĊI U IQONNETTED MAL-ISTUDJU TAR-RAPPREŻENTAZZJONI, L-ATTITUDJI U L-IDEOLOĠIJIET LI QABEL MILL-KONTRATT TA’ L-ISPEZZJONIJIET RICORDED WITH DATA COLLECTED THROUGH QUESTIONNAIRES FL-PROĊESS ta’ eliċitazzjoni tal-CORPUS. ESTRAZZJONI TA’ RIŻORSI. BIL-GĦAN LI JIĠU ŻVILUPPATI RIŻORSI LI JISTGĦU JERĠGĦU JINTUŻAW TA’ INTERESS PUBBLIKU ĠENERALI, HUWA INDIRIZZAT IL-ĦOLQIEN TA’ STRUMENTI LINGWISTIĊI UTLI F’OQSMA DIFFERENTI RELATATI MAL-LINGWA MITKELLMA. MINBARRA L-GĦODOD TAL-KOMPUTAZZJONI DIĠÀ MSEMMIJA, JISPIKKA L-UŻU TAL-KORP GĦAT-TAGĦLIM TAL-ISPANJOL BĦALA LINGWA BARRANIJA, KEMM FL-ELABORAZZJONI TA’ MATERJALI BIEX JIĠU TTRATTATI L-FENOMENI TA’ DIFFIKULTÀ SPEĊJALI FL-INTERAZZJONI MITKELLMA FIL-KLASSI, KIF UKOLL FIT-TFASSIL TA’ ATTIVITAJIET TA’ “TAGĦLIM TAL-LINGWI ASSISTIT MILL-KOMPJUTER” LI JGĦINU FIT-TAĦRIĠ TAL-ĦILIET ORALI KOLLHA PERMEZZ TA’ INTERFAĊĊI TA’ TFITTXIJA TAL-CORPUS IBBAŻATI FUQ IL-WEB. BARRA MINN HEKK, FILWAQT LI JIEĦU VANTAĠĠ MIT-TEST U L-ALLINJAMENT AWDJO TAL-CORPUS, ID-DIZZJUNARJU TAL-FREKWENZI FIL-VERŻJONI ELETTRONIKA JINKORPORA L-AĊĊESS IMMEDJAT GĦALL-FRAMMENTI TESTWALI U TAL-ĦOSS LI JIKKORRISPONDU GĦALL-ENTRATI LEŻIĊI. (Maltese)
17 August 2022
0 references
ŅEMOT PAR PAMATU IEPRIEKŠĒJOS ESLORA PROJEKTOS VEIKTO DARBU, ŠĀ PRIEKŠLIKUMA MĒRĶIS IR IZSTRĀDĀT JAUNUS BAGĀTINĀŠANAS UN IZMANTOŠANAS VEIDUS, KAS ĻAUTU PANĀKT PROGRESU MUTES DOBUMA SKAITĻOŠANĀ, IZPRATNI PAR RUNĀTO KOMUNIKĀCIJU UN SABIEDRĪBAS INTEREŠU MATERIĀLU UN INSTRUMENTU IZSTRĀDI. _x000D_ 1. KORPUSA BAGĀTINĀŠANA. LAI UZLABOTU TAGGERA VEIKSMES RĀDĪTĀJU UN ESOŠO MORFOSINTAKTISKO ANOTĀCIJU, TIEK IEVIESTAS JAUNAS FORMAS ATPAZĪŠANAS FUNKCIJAS (RAKSTISKIE KARDINĀLIE SKAITĻI, DAUDZVĀRDU VIENĪBAS, IEVĒROJAMAS SUFIKSI), PAPLAŠINĀTS MĀCĪBU KORPUSS UN LEKSIKONS, KĀ ARĪ IEVIESTI LINGVISTISKI IEROBEŽOJUMI, KAS PAPILDINA STATISTIKAS METODI, KURAS PAMATĀ IR ATLIKUŠO KĻŪDU KVALITATĪVA ANALĪZE. UZLABOTĀ MORFOSINTAKTISKĀ ANOTĀCIJA KALPO PAR PAMATU GAN ESOŠĀ KORPUSA KVALITĀTES PAAUGSTINĀŠANAI, GAN TREEBANK IZVEIDEI DIVOS DAŽĀDOS FORMĀTOS UN DZIĻUMA LĪMEŅOS: DETALIZĒTĀKS KONSTITUTĪVS VIENS UN OTRS MAZĀK DETALIZĒTS, PAMATOJOTIES UZ ATKARĪBU, KO VEIDO STARPTAUTISKA SADARBĪBAS PROJEKTA UNIVERSĀLĀ ATKARĪBA, KURAS MĒRĶIS IR IZSTRĀDĀT DAUDZVALODU ANOTĀCIJAS SISTĒMAS UN DAUDZVALODU PARSĒŠANAS RĪKUS. Citā valstī, ATTIECĪBĀ UZ IZDEVUMIEM ATTIECĪBĀM ATTIECĪBĀM ATTIECĪBĀ UZ IZDEVUMIEM SPĀNIJAS AIZSARDZĪBAS PIEŅEMŠANAS PIEŅEMŠANAS INFORMĀCIJAS ATTIECĪBAS UN KOPIENCIJAS KOMPENCIĀCIJAS SAISTĪBĀM._x000D_ 2. RUNAS LINGVISTISKĀ ANALĪZE. AR ESLORA ANOTĀCIJU UN METADATIEM UN MEKLĒŠANAS SASKARNI, KAS JAU ATVIEGLO TĀS PRATINĀŠANU, IZMANTOJOT KOMBINĒTU MEKLĒŠANU, TIEK APLŪKOTAS JAUNAS ATTIECĪGO RUNĀTĀS VALODAS PARĀDĪBU ANALĪZES. LEKSISKI-GRAMMĀTISKĀ LĪMENĪ MATERIĀLU PAREIZA APSTRĀDE ĻAUJ IEGŪT UN ANALIZĒT LEMMU UN GRAMATISKO KATEGORIJU IZPLATĪBU UN BIEŽUMU, LAI IZSTRĀDĀTU FREKVENČU VĀRDNĪCU, PAMATOJOTIES ĪPAŠI UZ RUNĀTĀS VALODAS DATIEM. NO OTRAS PUSES, PAPILDUS JAU VEIKTAJIEM PĒTĪJUMIEM PAR KONSTRUKCIJĀM UN VERBĀLAJĀM FORMĀM TIEK ANALIZĒTA SPĀŅU-GALISIJAS KODU PĀRSLĒGŠANAS PARĀDĪBA. Sociolingvistiskā UN PRAGMATIC-discursive PERSPECTIVE ir obligāta LINGUISTIC ANALYS UN IZMANTOJOT PĀRSTĀVJU STUDIJAS, ATTIECĪBAS UN IDEOLOGIJĀM, kas ir APSTRĀDĀTA AR RECORDED SPEECH WITH COLLECTED THROUGH QUESTIONNAIRES PROCESS of elicitation of the CORPUS._x000D_ 3. RESURSU IEGUVE. LAI ATTĪSTĪTU ATKALIZMANTOJAMUS RESURSUS VISPĀRĒJĀS SABIEDRĪBAS INTERESĒS, TIEK RISINĀTS JAUTĀJUMS PAR NODERĪGU LINGVISTISKU INSTRUMENTU IZVEIDI DAŽĀDĀS JOMĀS, KAS SAISTĪTAS AR RUNĀTO VALODU. PAPILDUS JAU MINĒTAJIEM SKAITĻOŠANAS RĪKIEM IZCEĻAS SPĀŅU VALODAS KĀ SVEŠVALODAS MĀCĪŠANAS KORPUSA IZMANTOŠANA GAN MATERIĀLU IZSTRĀDĒ, LAI ĀRSTĒTU ĪPAŠAS GRŪTĪBAS RUNĀTAJĀ MIJIEDARBĪBĀ KLASĒ, GAN “DATORIZĒTAS VALODU APGUVES” PASĀKUMU IZSTRĀDĒ, KAS PALĪDZ APGŪT VISAS MUTISKĀS PRASMES, IZMANTOJOT TĪMEKĻA KORPUSA MEKLĒŠANAS SASKARNES. TURKLĀT, IZMANTOJOT KORPUSA TEKSTU UN AUDIO IZLĪDZINĀŠANU, FREKVENČU VĀRDNĪCA ELEKTRONISKAJĀ VERSIJĀ IETVER TŪLĪTĒJU PIEKĻUVI TEKSTA UN SKAŅAS FRAGMENTIEM, KAS ATBILST LEKSIKAS IERAKSTIEM. (Latvian)
17 August 2022
0 references
VZHĽADOM NA PRÁCU VYKONANÚ V RÁMCI PREDCHÁDZAJÚCICH PROJEKTOV ESLORA SA SÚČASNÝ NÁVRH ZAMERIAVA NA VÝVOJ NOVÝCH SPÔSOBOV OBOHACOVANIA A VYUŽÍVANIA, KTORÉ UMOŽŇUJÚ DOSIAHNUŤ POKROK SMEROM K VÝPOČTOVEJ LIEČBE ORÁLNYCH KORPUSOV, POCHOPENIU HOVORENEJ KOMUNIKÁCIE A VYPRACOVANIU MATERIÁLOV A NÁSTROJOV VEREJNÉHO ZÁUJMU. _x000D_ 1. OBOHATENIE KORPUSU. S CIEĽOM ZLEPŠIŤ MIERU ÚSPEŠNOSTI TAGGERA A EXISTUJÚCU MORFOSYNTAKTICKÚ ANOTÁCIU SA IMPLEMENTUJÚ NOVÉ FUNKCIE ROZPOZNÁVANIA FORIEM (PÍSOMNÉ KARDINÁLNE ČÍSLA, VIACSLOVNÉ JEDNOTKY, OCEŇOVACIE PRÍPONY), ROZŠIRUJÚ SA ŠKOLIACI KORPUS A LEXIKON A ZAVÁDZAJÚ SA JAZYKOVÉ OBMEDZENIA, KTORÉ DOPĹŇAJÚ ŠTATISTICKÚ METÓDU ZALOŽENÚ NA KVALITATÍVNEJ ANALÝZE ZOSTÁVAJÚCICH CHÝB. VYLEPŠENÁ MORFOSYNTAKTICKÁ ANOTÁCIA SLÚŽI AKO ZÁKLAD NA ZVÝŠENIE KVALITY EXISTUJÚCEHO KORPUSU A NA VYTVORENIE TREEBANK DOSTUPNEJ V DVOCH RÔZNYCH FORMÁTOCH A ÚROVNIACH HĹBKY: PODROBNEJŠÍ JEDEN A DRUHÝ, MENEJ PODROBNÝ, ZALOŽENÝ NA ZÁVISLOSTIACH, KTORÝ JE ZAČLENENÝ DO RÁMCA UNIVERZÁLNYCH ZÁVISLOSTÍ MEDZINÁRODNÉHO PROJEKTU SPOLUPRÁCE, KTORÉHO CIEĽOM JE VÝVOJ VIACJAZYČNÝCH ANOTAČNÝCH SYSTÉMOV A VIACJAZYČNÝCH NÁSTROJOV ANALÝZY. Pokiaľ ide o ĎALŠIE SPOLOČENSTVO, V OBCHODNOM PRÍSLUŠENSKU VYKONÁVANÝCH VÝROBKOV ZÁKLADNÝCH VÝROBKOV, INITIÁLNYCH SCHVÁLENÍ ŠPANIELSKÝCH SCHVÁLENÍ, ZÁKLADNÉHO ČASTIA ČASTIÁLNEHO INFORMÁCIE A KOMUNIKATÍVNEJ FUNKCIE CORPUS SEQUENCES._x000D_ 2. JAZYKOVÁ ANALÝZA REČI. S ANOTÁCIOU A METAÚDAJMI ESLORY A VYHĽADÁVACÍM ROZHRANÍM, KTORÉ UŽ UĽAHČUJE JEJ VYPOČÚVANIE PROSTREDNÍCTVOM KOMBINOVANÉHO VYHĽADÁVANIA, SA RIEŠIA NOVÉ ANALÝZY RELEVANTNÝCH JAVOV HOVORENÉHO JAZYKA. NA LEXIKÁLNEJ A GRAMATICKEJ ÚROVNI UMOŽŇUJE SPRÁVNE SPRACOVANIE MATERIÁLOV EXTRAKCIU A ANALÝZU DISTRIBÚCIE A FREKVENCIE LEMOV A GRAMATICKÝCH KATEGÓRIÍ S CIEĽOM VYTVORIŤ FREKVENČNÝ SLOVNÍK ZALOŽENÝ OSOBITNE NA ÚDAJOCH HOVORENÉHO JAZYKA. NA DRUHEJ STRANE, OKREM ŠTÚDIÍ O STAVBÁCH A VERBÁLNYCH FORMÁCH, KTORÉ SA UŽ USKUTOČNILI, SA ANALYZUJE FENOMÉN PRECHODU ŠPANIELSKO-GALÍCIJSKÉHO KÓDEXU. Sociolingvistické a PRAGMATICKÉ diskurzné PERSPEKTÍVY sa riadia v LINGUISTICKÝCH ANALYCH a sú spojené so ŠTUDOU REPRESENTÁCIÍ, ATTITUDÍM a IDEOLOGIES, ktoré sú v procese vyvolania CORPUS._x000D_ 3. 3. ŤAŽBA ZDROJOV. S CIEĽOM VYTVORIŤ OPAKOVANE POUŽITEĽNÉ ZDROJE VŠEOBECNÉHO VEREJNÉHO ZÁUJMU SA RIEŠI VYTVORENIE UŽITOČNÝCH JAZYKOVÝCH NÁSTROJOV V RÔZNYCH OBLASTIACH SÚVISIACICH S HOVORENÝM JAZYKOM. OKREM UŽ SPOMENUTÝCH VÝPOČTOVÝCH NÁSTROJOV VYNIKÁ POUŽITIE KORPUSU NA VÝUČBU ŠPANIELČINY AKO CUDZIEHO JAZYKA, A TO AKO PRI VYPRACOVANÍ MATERIÁLOV NA LIEČBU JAVOV OSOBITNÝCH ŤAŽKOSTÍ PRI HOVORENEJ INTERAKCII V TRIEDE, AKO AJ PRI NAVRHOVANÍ ČINNOSTÍ „POČÍTAČOVÉHO JAZYKOVÉHO VZDELÁVANIA“, KTORÉ POMÁHAJÚ PRI ODBORNEJ PRÍPRAVE VŠETKÝCH ÚSTNYCH ZRUČNOSTÍ PROSTREDNÍCTVOM WEBOVÝCH VYHĽADÁVACÍCH ROZHRANÍ KORPUSU. TAKTIEŽ, S VYUŽITÍM ZAROVNANIA TEXTU A ZVUKU KORPUSU, SLOVNÍK FREKVENCIÍ V ELEKTRONICKEJ VERZII ZAHŔŇA OKAMŽITÝ PRÍSTUP K TEXTOVÝM A ZVUKOVÝM FRAGMENTOM, KTORÉ ZODPOVEDAJÚ LEXIKÁLNYM ZÁZNAMOM. (Slovak)
17 August 2022
0 references
AGUS AN OBAIR A RINNEADH FAOI THIONSCADAIL ESLORA ROIMHE SEO MAR BHUNÚS LEIS, TÁ SÉ MAR AIDHM AG AN TOGRA REATHA BEALAÍ NUA SAIBHRITHE AGUS SAOTHRAITHE A FHORBAIRT LENA BHFÉADFAR DUL CHUN CINN A DHÉANAMH I DTREO CÓIREÁIL RÍOMHAIREACHTÚIL AN CHORPAIS BHÉIL, TUISCINT AR CHUMARSÁID LABHARTHA, AGUS ÁBHAIR AGUS UIRLISÍ A BHAINEANN LE LEAS AN PHOBAIL A FHORBAIRT. _x000D_ 1. SAIBHRIÚ AN CORPAIS. CHUN FEABHAS A CHUR AR RÁTA RATHA NA CLIBEÁLAITHE AGUS AR AN ANÓTÁIL MHOIRFTEACH ATÁ ANN CHEANA, DÉANTAR FEIDHMIÚLACHTAÍ NUA AITHEANTAIS FOIRME (UIMHREACHA CAIRDINÉAL SCRÍOFA, AONAID ILFHOCAIL, IARMHÍREANNA SUNTASACHA) A CHUR CHUN FEIDHME, CUIRTEAR LEIS AN GCORPAS OILIÚNA AGUS LEIS AN LEXICON, AGUS TUGTAR ISTEACH SRIANTA TEANGA A CHOMHLÁNAÍONN AN MODH STAIDRIMH ATÁ BUNAITHE AR ANAILÍS CHÁILÍOCHTÚIL AR NA HEARRÁIDÍ ATÁ FÁGTHA. IS BONN É AN ANÓTÁIL OIRFÉISEACH FHEABHSAITHE CHUN CÁILÍOCHT AN CHORPAIS ATÁ ANN CHEANA A MHÉADÚ AGUS CHUN TREEBANK A GHINIÚINT A BHEIDH AR FÁIL IN DHÁ FHORMÁID AGUS LEIBHÉIL DHOIMHNEACHTA ÉAGSÚLA: BUNAITHEOIR NÍOS MIONSONRAITHE AMHÁIN AGUS CEANN EILE NACH BHFUIL CHOMH MIONSONRAITHE CÉANNA BUNAITHE AR SPLEÁCHAIS, AGUS É MAR AIDHM LEIS SIN CÓRAIS ANÓTÁIL ILTEANGACHA AGUS UIRLISÍ PARSÁLA ILTEANGACHA A FHORBAIRT. Maidir leis an gComhaontú EILE, i ndáil leis an Easpórtáil Athnuachana a Shonraítear, tá an t-iarratas mí-oiriúnach do Chuid de na hOrduithe a ghabhann leis an Acht seo a ghabhann leis an Acht seo a bhaineann leis an áireamhacht a ghabhann leis an Acht seo i gcás cuideachta a bheith á n-úsáid mar chomhlacht, a fhoilsíonn an t-aitheantas agus an chríoch a bhaineann leis an gcorpas. _x000D_ 2. ANAILÍS THEANGEOLAÍOCH AR CHAINT. LE HANÓTÁIL AGUS MEITEASHONRAÍ ESLORA AGUS AN COMHÉADAN CUARDAIGH A ÉASCAÍONN A INIÚCHADH CHEANA FÉIN TRÍ BHÍTHIN CUARDAIGH CHOMHCHEANGAILTE, TUGTAR AGHAIDH AR ANAILÍSÍ NUA AR FHEINIMÉIN ÁBHARTHA NA TEANGA LABHARTHA. AG AN LEIBHÉAL FOCLÓIREACHTA-GHRAMADAÍ, IS FÉIDIR LE PRÓISEÁIL CHUÍ NA N-ÁBHAR DÁILEADH AGUS MINICÍOCHT NA LEMMAS AGUS NA GCATAGÓIRÍ GRAMADAÍ A EASTÓSCADH AGUS A ANAILÍSIÚ CHUN FOCLÓIR MINICÍOCHTA A FHORBAIRT ATÁ BUNAITHE GO SONRACH AR SHONRAÍ TEANGA LABHARTHA. AR AN TAOBH EILE, SEACHAS NA STAIDÉIR AR FHOIRGNÍOCHTAÍ AGUS AR FHOIRMEACHA Ó BHÉAL A RINNEADH CHEANA FÉIN, DÉANTAR ANAILÍS AR FHEINIMÉAN AN CHÓDATHRAITHE SPÁINNIS-GAILÍSIS. Tá an PERSPECTIVE SOCIOLIÚCHEISIÚLA AGUS PRAGMATIC-DISCUSIVE ag brath sna hOidlíochtaí Lingeasacha agus go bhfuil sé faoi réir ag an tréimhse ama a bhaineann le héisteachtaí, le hoiriúnachtaí agus le hidé-eolaíochtaí a d’fhéadfadh a bheith ag gabháil leis an tsonraíocht a cuireadh ar fáil leis an gclár oibre, leis na coinníollacha agus leis na hidé-eolaíochtaí a bhaineann le húsáid an chórais. _x000D_ 3. ACMHAINNÍ A BHAINT AMACH. AGUS É MAR CHUSPÓIR ACMHAINNÍ IN-ATHÚSÁIDTE A FHORBAIRT AR MHAITHE LE LEAS GINEARÁLTA AN PHOBAIL, TUGTAR AGHAIDH AR IONSTRAIMÍ ÚSÁIDEACHA TEANGA A CHRUTHÚ I RÉIMSÍ ÉAGSÚLA A BHAINEANN LEIS AN TEANGA LABHARTHA. CHOMH MAITH LEIS NA HUIRLISÍ RÍOMHAIREACHTA A LUADH CHEANA, SEASANN ÚSÁID AN CHORPAIS CHUN SPÁINNIS A MHÚINEADH MAR THEANGA IASACHTA AMACH, I MIONSAOTHRÚ NA N-ÁBHAR CHUN DÉILEÁIL LE FEINIMÉIN NA DEACRACHTA SPEISIALTA SAN IDIRGHNÍOMHAÍOCHT LABHARTHA SA SEOMRA RANGA, CHOMH MAITH LE GNÍOMHAÍOCHTAÍ ‘FOGHLAIM TEANGA RÍOMHCHUIDITHE’ A DHEARADH A CHABHRAÍONN LE HOILIÚINT NA SCILEANNA BÉIL GO LÉIR TRÍ CHOMHÉADAIN CUARDAIGH CORPAIS GRÉASÁNBHUNAITHE. CHOMH MAITH LEIS SIN, AG BAINT LEASA AS TÉACS AGUS AILÍNIÚ FUAIME AN CHORPAIS, CUIMSÍONN FOCLÓIR NA MINICÍOCHTAÍ I LEAGAN LEICTREONACH AN ROCHTAIN LÁITHREACH AR NA BLÚIRÍ TÉACSÚLA AGUS FUAIME A CHOMHFHREAGRAÍONN DO NA HIONTRÁLACHA FOCLÓIREACHTA. (Irish)
17 August 2022
0 references
STÁVAJÍCÍ NÁVRH VYCHÁZÍ Z PRÁCE VYKONANÉ V RÁMCI PŘEDCHOZÍCH PROJEKTŮ ESLORA A ZAMĚŘUJE SE NA ROZVOJ NOVÝCH ZPŮSOBŮ OBOHACOVÁNÍ A VYUŽÍVÁNÍ, KTERÉ UMOŽNÍ POKROK SMĚREM K VÝPOČETNÍ LÉČBĚ ÚSTNÍCH TĚLES, POCHOPENÍ MLUVENÉ KOMUNIKACE A VYPRACOVÁNÍ MATERIÁLŮ A NÁSTROJŮ VEŘEJNÉHO ZÁJMU. _x000D_ 1. OBOHACENÍ KORPUSU. ABY SE ZLEPŠILA ÚSPĚŠNOST TAGGERA A STÁVAJÍCÍ MORFOSYNTAKTICKÁ ANOTACE, JSOU ZAVEDENY NOVÉ FUNKCE ROZPOZNÁVÁNÍ FORMULÁŘŮ (PÍSEMNÁ KARDINÁLNÍ ČÍSLA, VÍCESLOVNÉ JEDNOTKY, CITLIVÁ PŘÍPONA), JSOU ROZŠÍŘENY TRÉNINKOVÝ KORPUS A LEXIKON A JSOU ZAVEDENA JAZYKOVÁ OMEZENÍ, KTERÁ DOPLŇUJÍ STATISTICKOU METODU ZALOŽENOU NA KVALITATIVNÍ ANALÝZE ZBÝVAJÍCÍCH CHYB. VYLEPŠENÁ MORFOSYNTAKTICKÁ ANOTACE SLOUŽÍ JAKO ZÁKLAD JAK KE ZVÝŠENÍ KVALITY STÁVAJÍCÍHO KORPUSU, TAK K VYTVOŘENÍ STROMOVÉ BANKY DOSTUPNÉ VE DVOU RŮZNÝCH FORMÁTECH A ÚROVNÍCH HLOUBKY: PODROBNĚJŠÍ KONSTITUTIVNÍ JEDEN A DRUHÝ MÉNĚ PODROBNÝ NA ZÁKLADĚ ZÁVISLOSTÍ, KTERÉ JSOU VYMEZENY V MEZINÁRODNÍM SPOLEČNÉM PROJEKTU UNIVERZÁLNÍ ZÁVISLOSTI, JEHOŽ CÍLEM JE VYVINOUT MNOHOJAZYČNÉ SYSTÉMY PRO ANOTACE A VÍCEJAZYČNÉ NÁSTROJE PRO ANALÝZU. Na další straně, v souvislosti s vypuštěnou VÝZOROU RESOURCES, INITIÁLNÍ APPROXIMACE JE PŘEDBĚŽNÝM PŘEDBĚŽNÝM PŘEDBĚŽNÝM PŘEDBĚŽNÝM OBLASTI MATERIALŮ SPRÁVNÍM PŘÍSLUŠNÝM PŘÍSLUŠNÝM VÝBORU V PŘÍSLUŠNÝCH SPOLEČENSTVÍ V PŘÍSLUŠNÝCH PŘÍSLUŠTNÍM PŘÍSLUŽÁVÁNÍM PŘÍZDĚDĚCÍM PŘÍSLUŠTĚ VÝCHODNÍM PŘÍMÁDÁM, PŘIŠTĚDÁNÍ MATERIALSTVÍ s informacemi o tom, že se jedná o informace, které vydávají v souvislosti se ŠPANEM jako PŘEDSEDÁNÝM PŘEDSEDÁNÍEM, SOUŽÍM PŘEDVÁDÁNÍM PŘEDÁDÁNÍEM A SPOLEČNÍM VÝBĚR KORNÍHO SPOLEČNOSTI._x000D_2. JAZYKOVÁ ANALÝZA ŘEČI. S ANOTACEMI A METADATY ESLORY A VYHLEDÁVACÍM ROZHRANÍM, KTERÉ JIŽ USNADŇUJE JEJÍ VÝSLECH POMOCÍ KOMBINOVANÉHO VYHLEDÁVÁNÍ, JSOU ŘEŠENY NOVÉ ANALÝZY RELEVANTNÍCH JEVŮ MLUVENÉHO JAZYKA. NA LEXIKÁLNĚ-GRAMATICKÉ ÚROVNI UMOŽŇUJE SPRÁVNÉ ZPRACOVÁNÍ MATERIÁLŮ EXTRAKCI A ANALÝZU DISTRIBUCE A ČETNOSTI LEMMY A GRAMATICKÝCH KATEGORIÍ K VYTVOŘENÍ FREKVENČNÍHO SLOVNÍKU ZALOŽENÉHO KONKRÉTNĚ NA MLUVENÝCH JAZYKOVÝCH DATECH. NA DRUHÉ STRANĚ, KROMĚ JIŽ PROVEDENÝCH STUDIÍ O STAVBÁCH A VERBÁLNÍCH FORMÁCH, SE ANALYZUJE FENOMÉN ŠPANĚLSKO-GALICIJSKÉHO KÓDOVÁNÍ. Sociolingvistická a PRAGMATICko-diskurzivní OSVĚDČENÍ je předurčena v LINGUISTICKÝCH ANALIZích a je spojena se STUDOU REPRESENTATIONS, ATTITUDES A IDEOLOGIES, která se odvíjí od toho, aby se spojila s daty, které byly shromážděny v souvislosti s návrhem na vyvolání CORPUS._x000D_ 3. TĚŽBA ZDROJŮ. S CÍLEM ROZVÍJET OPAKOVANĚ POUŽITELNÉ ZDROJE OBECNÉHO VEŘEJNÉHO ZÁJMU SE ZABÝVÁ VYTVÁŘENÍM UŽITEČNÝCH JAZYKOVÝCH NÁSTROJŮ V RŮZNÝCH OBLASTECH SOUVISEJÍCÍCH S MLUVENÝM JAZYKEM. KROMĚ JIŽ ZMÍNĚNÝCH VÝPOČETNÍCH NÁSTROJŮ VYNIKÁ POUŽITÍ KORPUSU PRO VÝUKU ŠPANĚLŠTINY JAKO CIZÍHO JAZYKA, A TO JAK PŘI PŘÍPRAVĚ MATERIÁLŮ K LÉČBĚ JEVŮ ZVLÁŠTNÍCH OBTÍŽÍ PŘI MLUVENÉ INTERAKCI VE TŘÍDĚ, TAK PŘI NAVRHOVÁNÍ ČINNOSTÍ „VÝUKY JAZYKŮ ASISTOVANÉHO POČÍTAČEM“, KTERÉ POMÁHAJÍ PŘI ŠKOLENÍ VŠECH ÚSTNÍCH DOVEDNOSTÍ PROSTŘEDNICTVÍM WEBOVÝCH ROZHRANÍ PRO VYHLEDÁVÁNÍ KORPUSŮ. KROMĚ TOHO, S VYUŽITÍM TEXTOVÉHO A ZVUKOVÉHO ZAROVNÁNÍ KORPUSU, SLOVNÍK FREKVENCÍ V ELEKTRONICKÉ VERZI ZAHRNUJE OKAMŽITÝ PŘÍSTUP K TEXTOVÝM A ZVUKOVÝM FRAGMENTŮM ODPOVÍDAJÍCÍCH LEXIKÁLNÍM ZÁZNAMŮM. (Czech)
17 August 2022
0 references
Tendo como base os trabalhos realizados no âmbito dos anteriores projectos de ESLORA, a actual proposta visa desenvolver novas vias de enriquecimento e de exploração que permitam realizar progressos no domínio do tratamento computacional do corpo oral, da compreensão da comunicação falada e da criação de materiais e instrumentos de interesse público. _x000D_ 1. Enriquecimento do Corpo. A fim de melhorar a taxa de sucesso do operador e a anulação morfossintática existente, são implementadas novas funcionalidades de reconhecimento de forma (números de cartão escritos, unidades multipalavras, sufixos apropriados), o corpo formador e o léxico são expandidos e são introduzidas restrições linguísticas que completam o método estatístico baseado na análise quantitativa dos erros que se mantêm. A ANOTAÇÃO MORFOSSINTÁTICA MELHORADA SERVE COM BASE NO AUMENTO DA QUALIDADE DO CORPO EXISTENTE E NA GERAÇÃO DE UM TREEBANK DISPONÍVEL EM DOIS FORMATOS DIFERENTES E NÍVEIS DE PROFUNDIDADE: UMA CONSTITUIÇÃO MAIS DETALHADA E UMA MAIS MENOS DETALHADA COM BASE EM DEPENDÊNCIAS, ESTA CARÁTER ESTÁ ENquadrADA NAS DEPENDÊNCIAS UNIVERSAIS DO PROJECTO COLABORATIVO INTERNACIONAL QUE DIZ RESPEITO AO DESENVOLVIMENTO DE SISTEMAS DE ANÚNCIOS MULTILINGUAIS E DE FERRAMENTAS DE PAGAMENTO MULTILINGUAIS. Por outro lado, no que se refere à esperada extracção de recursos, é feita uma aproximação inicial à anulação de uma parte dos materiais com informações relevantes para a sua exploração no ensino do espanhol como língua estrangeira, tal como a identificação do tema e a função comunitária das sequências do corpo._x000D_ 2. ANÁLISE LINGUÍSTICA DO DISCURSO. Com a anuência e os metadatos da ESLORA e a interface de investigação que já facilitou a sua interrogação por meio de pesquisas combinadas, são abordadas novas análises de fenoménias relevantes de línguas faladas. A NÍVEL LEXICAL-GRAMÁTICO, O PROCESSO PRÓPRIO DOS MATERIAIS PERMITE A EXTRACÇÃO E A ANÁLISE DA DISTRIBUIÇÃO E FREQUÊNCIA DE LEMÃS E CATEGORIAS GRAMÁTICAS PARA DESENVOLVER UM DICIONÁRIO DE FREQUÊNCIA BASEADO ESPECIFICAMENTE EM DADOS LINGUÍSTICOS ESPECÍFICOS. Por outro lado, para além dos estudos sobre as construções e as formas verbais já empreendidos, procede-se à análise do fenomenon do sistema de troca de códigos espanhol-galego. A PERSPECTIVA SOCIOLINGUÍSTICA E PRAGMATIC-DISCURSIVA ESTÁ PRESENTE NAS ANÁLISES LINGUÍSTICAS E ESTÁ RELACIONADA COM O ESTUDO DAS REPRESENTAÇÕES, ATITUDES E IDEOLOGIAS QUE É DESENVOLVIDO CONTRATANDO O DISCURSO REGISTRADO COM OS DADOS RECOLHIDOS ATRAVÉS DE QUESTIONÁRIOS NO PROCESSO DE ELICITAÇÃO DO CORPUS._x000D_ 3. EXTRACÇÃO DE RECURSOS. COM O OBJETIVO DE DESENVOLVIMENTO DE RECURSOS REUTILIZÁVEIS DE INTERESSE PÚBLICO GERAL, É RESPONSÁVEL A CRIAÇÃO DE INSTRUMENTOS LINGUÍSTICOS ÚTEIS EM DIFERENTES DOMÍNIOS RELACIONADOS COM A LÍNGUA ESPECÍFICA. Para além das ferramentas informáticas já mencionadas, a utilização do corpo para o ensino do espanhol como língua estrangeira impõe-se tanto na elaboração de materiais destinados a tratar a fenomenologia de uma dificuldade especial de interacção específica na sala de aula, como na concepção de actividades de «aprendizagem linguística assistida por computador» que contribuem para a formação de todas as competências orais através de interfaces de pesquisa de correspondência baseadas na Internet. O DICIONÁRIO DAS FREQUÊNCIAS EM VERSÃO ELETRÓNICA INCORPORA O ACESSO IMEDIATO AOS FRAGMENTOS TEXTUAIS E SONORES CORRESPONDENTES ÀS ENTRADAS LEXICAS, TENDO TAMBÉM EM AVALIAÇÃO O TEXTO E A AUDIOLOGIA DO CORPO. (Portuguese)
17 August 2022
0 references
VÕTTES ALUSEKS EELMISTE ESLORA PROJEKTIDE RAAMES TEHTUD TÖÖ, ON KÄESOLEVA ETTEPANEKU EESMÄRK TÖÖTADA VÄLJA UUED RIKASTAMIS- JA KASUTAMISVIISID, MIS VÕIMALDAVAD TEHA EDUSAMME SUUKAUDSETE KORPORAATIDE ARVUTUSLIKUL KÄSITLEMISEL, SUULISE SUHTLUSE MÕISTMISEL NING AVALIKKU HUVI PAKKUVATE MATERJALIDE JA VAHENDITE VÄLJATÖÖTAMISEL. _x000D_ 1. KORPUSE RIKASTAMINE. TAGGER’I EDUKUSE JA OLEMASOLEVA MORFOSÜNTAKTILISE ANNOTATSIOONI PARANDAMISEKS RAKENDATAKSE UUSI VORMITUVASTUSFUNKTSIOONE (KIRJALIKUD KARDINAALNUMBRID, MITMESÕNALISED ÜHIKUD, VÄÄRTUSLIKUD JÄRELLIIDED), LAIENDATAKSE KOOLITUSKORPUST JA LEKSIKOONI NING KEHTESTATAKSE KEELELISED PIIRANGUD, MIS TÄIENDAVAD ALLESJÄÄNUD VIGADE KVALITATIIVSEL ANALÜÜSIL PÕHINEVAT STATISTILIST MEETODIT. TÄIUSTATUD MORFOSÜNTAKTILINE ANNOTATSIOON ON ALUSEKS NII OLEMASOLEVA KORPUSE KVALITEEDI TÕSTMISELE KUI KA PUUPANGA LOOMISELE, MIS ON SAADAVAL KAHEL ERINEVAL KUJUL JA SÜGAVUSTASEMEL: ÜKSIKASJALIKUM KONSTITUTIIVNE ÜKS JA TEINE VÄHEM ÜKSIKASJALIK, MIS PÕHINEB SÕLTUVUSEL, KUSJUURES VIIMANE ON SÄTESTATUD RAHVUSVAHELISE KOOSTÖÖPROJEKTI UNIVERSAALSETES SÕLTUVUSES, MILLE EESMÄRK ON TÖÖTADA VÄLJA MITMEKEELSED ANNOTEERIMISSÜSTEEMID JA MITMEKEELSED PARSEERIMISVAHENDID. Mis käsitleb RESOURCide väljaselgitatud väljaselgitatud VÄLJAVÕTMISE TEADMISEKS VÄLJAVÕTMISE VÄLJAVÕTMISE VÄLJAVÕTMISE, VALITSUSTE NIMETAMISE JA KOMMUNIKATSIOONI KOHTUASI TÄHELEPANU TEADMISEKS KOHTUASI SUURDEVÕTMISE JA KOMMUNIKATSIOONI KOHTAVÕTMISE NÕUSTE KOHTAVÕTMISE KOHTUASI. KÕNE KEELELINE ANALÜÜS. KOOS ESLORA ANNOTATSIOONI JA METAANDMETEGA NING OTSINGULIIDESEGA, MIS JUBA HÕLBUSTAB PÄRINGUTE TEGEMIST KOMBINEERITUD OTSINGUTE ABIL, KÄSITLETAKSE KÕNEKEELE ASJAKOHASTE NÄHTUSTE UUSI ANALÜÜSE. LKSIKAALSEL JA GRAMMATILISEL TASANDIL VÕIMALDAB MATERJALIDE NÕUETEKOHANE TÖÖTLEMINE LEMMADE JA GRAMMATILISTE KATEGOORIATE JAOTUSE JA SAGEDUSE EKSTRAHEERIMIST JA ANALÜÜSIMIST, ET TÖÖTADA VÄLJA SAGEDUSSÕNASTIK, MIS PÕHINEB KONKREETSELT KÕNELDAVATEL KEELEANDMETEL. TEISEST KÜLJEST ANALÜÜSITAKSE HISPAANIA-GALITSIUSE KOODIVAHETUSE NÄHTUST, VÄLJA ARVATUD JUBA TEHTUD UURINGUD EHITISTE JA VERBAALSETE VORMIDE KOHTA. Sotsiolingvistiline JA PRAGMATIC-diskursiivne PERSPEKTIIV on olemas LINGUISTIC ANALYSES JA VAHENDATUD VALITSUSTE KIRJELDUSED, ATTITUDES JA IDEOLOGIES, kes on VÕTNUD KOHUSTUSLIKUD PÕHENDATUD KOHTUASI KOHUSTUSLIKUD KOHUSTUSLIKUD KOHUSTUSED CORPUS._x000D_ 3 elikatsiooniks._x000D_ 3. LOODUSVARADE KAEVANDAMINE. EESMÄRGIGA ARENDADA ÜLDHUVI PAKKUVAID TAASKASUTATAVAID RESSURSSE KÄSITLETAKSE KASULIKE KEELEVAHENDITE LOOMIST KÕNEKEELEGA SEOTUD ERI VALDKONDADES. LISAKS JUBA MAINITUD ARVUTUSVAHENDITELE PAISTAB SILMA KA KORPUSE KASUTAMINE HISPAANIA KEELE ÕPETAMISEKS VÕÕRKEELENA, NII MATERJALIDE VÄLJATÖÖTAMISEL, ET KÄSITLEDA KLASSIRUUMIS KÕNELISE SUHTLUSE ERILISI RASKUSI, KUI KA ARVUTIPÕHISE KEELEÕPPE KAVANDAMISEL, MIS AITAVAD VEEBIPÕHISTE KORPUSTE OTSINGULIIDESTE KAUDU KÕIKI SUULISI OSKUSI KOOLITADA. SAMUTI, KASUTADES ÄRA TEKSTI JA HELI JOONDAMISE KORPUS, SÕNASTIK SAGEDUSTE ELEKTROONILISES VERSIOONIS SISALDAB VAHETUT JUURDEPÄÄSU TEKSTI- JA HELIFRAGMENDID VASTAVAD LEXICAL KIRJED. (Estonian)
17 August 2022
0 references
A KORÁBBI ESLORA-PROJEKTEK KERETÉBEN VÉGZETT MUNKÁT ALAPUL VÉVE A JELENLEGI JAVASLAT CÉLJA OLYAN ÚJ DÚSÍTÁSI ÉS HASZNOSÍTÁSI MÓDSZEREK KIDOLGOZÁSA, AMELYEK LEHETŐVÉ TESZIK A SZÓBELI KORPORA SZÁMÍTÁSI KEZELÉSE, A SZÓBELI KOMMUNIKÁCIÓ MEGÉRTÉSE, VALAMINT A KÖZÉRDEKŰ ANYAGOK ÉS ESZKÖZÖK KIDOLGOZÁSA TERÉN TÖRTÉNŐ ELŐREHALADÁST. _x000D_ 1. A KORPUSZ GAZDAGODÁSA. A TAGGER SIKERARÁNYÁNAK ÉS A MEGLÉVŐ MORFOSZINTAKTIKAI ANNOTÁCIÓNAK A JAVÍTÁSA ÉRDEKÉBEN ÚJ FORMAFELISMERŐ FUNKCIÓKAT (ÍROTT BÍBOROS SZÁMOK, TÖBBSZAVAS EGYSÉGEK, ELISMERŐ UTÓTAGOK) HAJTANAK VÉGRE, BŐVÍTIK A KÉPZÉSI KORPUSZT ÉS A LEXIKONT, ÉS NYELVI KORLÁTOZÁSOKAT VEZETNEK BE, AMELYEK KIEGÉSZÍTIK A FENNMARADÓ HIBÁK KVALITATÍV ELEMZÉSÉN ALAPULÓ STATISZTIKAI MÓDSZERT. A JAVÍTOTT MORFOSZINTAKTIKAI ANNOTÁCIÓ ALAPUL SZOLGÁL MIND A MEGLÉVŐ KORPUSZ MINŐSÉGÉNEK JAVÍTÁSÁHOZ, MIND PEDIG EGY KÉT KÜLÖNBÖZŐ FORMÁTUMBAN ÉS MÉLYSÉGI SZINTEN ELÉRHETŐ TREEBANK LÉTREHOZÁSÁHOZ: A FÜGGŐSÉGEKEN ALAPULÓ RÉSZLETESEBB KONSTITUTÍVUM, AMELY A NEMZETKÖZI EGYÜTTMŰKÖDÉSEN ALAPULÓ EGYETEMES FÜGGŐSÉGEK RÉSZÉT KÉPEZI, AMELYNEK CÉLJA TÖBBNYELVŰ ANNOTÁCIÓS RENDSZEREK ÉS TÖBBNYELVŰ ELEMZŐ ESZKÖZÖK KIFEJLESZTÉSE. A másik oldalon, a TERMÉKEK KÖVETKEZTETÉSÉRE VONATKOZÓ KÖVETKEZTETÉSEKRE VONATKOZÓ TÁMOGATÁSRA VONATKOZÓ TÁJÉKOZTATÁSRA VONATKOZÓ TÁJÉKOZTATÁSRA VONATKOZÓ TÁJÉKOZTATÁSRA VONATKOZÓ TÁMOGATÁSRA VONATKOZÓ TÁMOGATÁSA A KORPUS SEQUENCES-nek a KÖZTÁRSASÁGI FELÉTELVEZÉSE._x000D_2 A BESZÉD NYELVI ELEMZÉSE. AZ ESLORA ANNOTÁCIÓJÁVAL ÉS METAADATAIVAL, VALAMINT A KERESÉSI FELÜLETTEL, AMELY KOMBINÁLT KERESÉSEK RÉVÉN MÁR MEGKÖNNYÍTI A LEKÉRDEZÉST, A BESZÉLT NYELV RELEVÁNS JELENSÉGEINEK ÚJ ELEMZÉSEIT KEZELIK. A LEXIKAI-GRAMMATIKUS SZINTEN AZ ANYAGOK MEGFELELŐ FELDOLGOZÁSA LEHETŐVÉ TESZI A LEMMA ÉS A NYELVTANI KATEGÓRIÁK ELOSZLÁSÁNAK ÉS GYAKORISÁGÁNAK EXTRAHÁLÁSÁT ÉS ELEMZÉSÉT EGY KIFEJEZETTEN BESZÉLT NYELVI ADATOKON ALAPULÓ FREKVENCIA SZÓTÁR KIFEJLESZTÉSÉHEZ. MÁSRÉSZT A MÁR ELVÉGZETT ÉPÍTKEZÉSEKEN ÉS SZÓBELI FORMÁKON KÍVÜL A SPANYOL-GALICIAI KÓDVÁLTÁS JELENSÉGÉT IS ELEMZIK. A szociollingvista és PRAGMATIC-diszkurzív PERSPECTIVE PERPECTIVE A LINGUISTIC ANALYSOK ÉS A KÉPVISELŐK, ATTITUDÁSOK ÉS IDEOLOGISZÁSOK HASZNÁLÁSA A KÉPVISELŐK, ATTITUDÁSOK ÉS AZ IDEOLOGISZÁSOK KÖVETELMÉNYEKRE VONATKOZÓ ADATOK A KORPUS._x000D_3. ERŐFORRÁSOK KINYERÉSE. AZ ÁLTALÁNOS KÖZÉRDEKET SZOLGÁLÓ ÚJRAFELHASZNÁLHATÓ ERŐFORRÁSOK FEJLESZTÉSE ÉRDEKÉBEN A BESZÉLT NYELVHEZ KAPCSOLÓDÓ KÜLÖNBÖZŐ TERÜLETEKEN HASZNOS NYELVI ESZKÖZÖK LÉTREHOZÁSÁVAL FOGLALKOZNAK. A MÁR EMLÍTETT SZÁMÍTÁSI ESZKÖZÖKÖN KÍVÜL KIEMELKEDIK A KORPUSZ HASZNÁLATA A SPANYOL NYELV IDEGEN NYELVKÉNT TÖRTÉNŐ TANÍTÁSÁRA, MIND A BESZÉDES INTERAKCIÓ JELENSÉGEINEK KEZELÉSÉRE SZOLGÁLÓ ANYAGOK KIDOLGOZÁSA SORÁN AZ OSZTÁLYTEREMBEN, MIND PEDIG A „SZÁMÍTÓGÉPPEL TÁMOGATOTT NYELVTANULÁS” TEVÉKENYSÉGEINEK MEGTERVEZÉSÉBEN, AMELYEK SEGÍTENEK AZ ÖSSZES SZÓBELI KÉSZSÉG KÉPZÉSÉBEN A WEBALAPÚ CORPUS KERESŐFELÜLETEKEN KERESZTÜL. TOVÁBBÁ, KIHASZNÁLVA A SZÖVEG ÉS A HANG ÖSSZEHANGOLÁSA A CORPUS, A SZÓTÁR FREKVENCIÁK ELEKTRONIKUS VÁLTOZAT MAGÁBAN FOGLALJA A KÖZVETLEN HOZZÁFÉRÉST A SZÖVEGES ÉS HANG TÖREDÉKEK MEGFELELŐ LEXIKAI BEJEGYZÉSEK. (Hungarian)
17 August 2022
0 references
КАТО СЕ ИМА ПРЕДВИД РАБОТАТА, ИЗВЪРШЕНА В РАМКИТЕ НА ПРЕДИШНИТЕ ПРОЕКТИ НА ESLORA, НАСТОЯЩОТО ПРЕДЛОЖЕНИЕ ИМА ЗА ЦЕЛ ДА РАЗРАБОТИ НОВИ НАЧИНИ ЗА ОБОГАТЯВАНЕ И ЕКСПЛОАТАЦИЯ, КОИТО ПОЗВОЛЯВАТ ДА СЕ ПОСТИГНЕ НАПРЕДЪК ПО ОТНОШЕНИЕ НА ИЗЧИСЛИТЕЛНОТО ТРЕТИРАНЕ НА ОРАЛНИТЕ ТЕЛА, РАЗБИРАНЕТО НА ГОВОРИМАТА КОМУНИКАЦИЯ И РАЗРАБОТВАНЕТО НА МАТЕРИАЛИ И ИНСТРУМЕНТИ ОТ ОБЩЕСТВЕН ИНТЕРЕС. _x000D_ 1. ОБОГАТЯВАНЕ НА КОРПУСА. ЗА ДА СЕ ПОДОБРИ УСПЕВАЕМОСТТА НА МАРКЕРА И СЪЩЕСТВУВАЩАТА МОРФОСИНТАКТИЧНА АНОТАЦИЯ, СЕ ПРИЛАГАТ НОВИ ФУНКЦИИ ЗА РАЗПОЗНАВАНЕ НА ФОРМУЛЯРИ (ПИСМЕНИ КАРДИНАЛНИ НОМЕРА, МНОГОСЛОВНИ ЕДИНИЦИ, ОЦЕНЯВАЩИ НАСТАВКИ), УЧЕБНИЯТ КОРПУС И ЛЕКСИКОНЪТ СЕ РАЗШИРЯВАТ И СЕ ВЪВЕЖДАТ ЕЗИКОВИ ОГРАНИЧЕНИЯ, КОИТО ДОПЪЛВАТ СТАТИСТИЧЕСКИЯ МЕТОД, ОСНОВАН НА КАЧЕСТВЕН АНАЛИЗ НА ОСТАВАЩИТЕ ГРЕШКИ. ПОДОБРЕНАТА МОРФОСИНТАКТИЧНА АНОТАЦИЯ СЛУЖИ КАТО ОСНОВА КАКТО ЗА ПОВИШАВАНЕ НА КАЧЕСТВОТО НА СЪЩЕСТВУВАЩИЯ КОРПУС, ТАКА И ЗА ГЕНЕРИРАНЕ НА TREEBANK НА РАЗПОЛОЖЕНИЕ В ДВА РАЗЛИЧНИ ФОРМАТА И НИВА НА ДЪЛБОЧИНА: ПО-ПОДРОБЕН КОНСТИТУТИВЕН ЕДИН И ДРУГ ПО-МАЛКО ПОДРОБЕН, ОСНОВАН НА ЗАВИСИМОСТИ, КАТО ПОСЛЕДНИЯТ Е ВКЛЮЧЕН В МЕЖДУНАРОДНИТЕ СЪВМЕСТНИ ПРОЕКТИ ЗА УНИВЕРСАЛНИ ЗАВИСИМОСТИ, ЧИЯТО ЦЕЛ Е РАЗРАБОТВАНЕТО НА МНОГОЕЗИЧНИ СИСТЕМИ ЗА АНОТАЦИЯ И МНОГОЕЗИЧНИ ИНСТРУМЕНТИ ЗА АНАЛИЗ. В ДРУГАТА ХАНД, В ОТНОСНОТО ИЗКЛЮЧЕНИЕ НА ВЪЗЛОЖЕНИЕТО НА ВЪЗЛОЖЕНИЕТО НА ВЪЗЛОЖЕНИЕТО НА ЧАСТТА С ИНФОРМАЦИЯТА ЗА ИЗПОЛЗВАНЕТО НА ИЗПОЛЗВАНЕТО НА ИЗПОЛЗВАНЕТО НА ИЗПОЛЗВАНЕТО НА СЪСТОЯНИЕТО НА МАТЕРИАНИЯТА С ИНФОРМАЦИЯТА ЗА ИДЕНТИФИКАЦИЯ И КОМУНИКАТИВНО ФУНКЦИЯ НА КОРПУСИТЕ СЕКАЦИИ._x000D_ 2. ЕЗИКОВ АНАЛИЗ НА РЕЧТА. С АНОТАЦИЯТА И МЕТАДАННИТЕ НА ESLORA И ИНТЕРФЕЙСА ЗА ТЪРСЕНЕ, КОЙТО ВЕЧЕ УЛЕСНЯВА НЕГОВОТО ЗАПИТВАНЕ ЧРЕЗ КОМБИНИРАНИ ТЪРСЕНИЯ, СЕ РАЗГЛЕЖДАТ НОВИ АНАЛИЗИ НА СЪОТВЕТНИТЕ ЯВЛЕНИЯ НА ГОВОРИМИЯ ЕЗИК. НА НИВО ЛЕКСИКАЛНО-ГРАМА, ПРАВИЛНАТА ОБРАБОТКА НА МАТЕРИАЛИТЕ ПОЗВОЛЯВА ИЗВЛИЧАНЕТО И АНАЛИЗА НА РАЗПРЕДЕЛЕНИЕТО И ЧЕСТОТАТА НА ЛЕМИТЕ И ГРАМАТИЧЕСКИТЕ КАТЕГОРИИ, ЗА ДА СЕ РАЗРАБОТИ ЧЕСТОТЕН РЕЧНИК, БАЗИРАН СПЕЦИАЛНО НА ДАННИТЕ ЗА ГОВОРИМИЯ ЕЗИК. ОТ ДРУГА СТРАНА, ОСВЕН ВЕЧЕ ИЗВЪРШЕНИТЕ ПРОУЧВАНИЯ НА КОНСТРУКЦИИТЕ И ВЕРБАЛНИТЕ ФОРМИ, СЕ АНАЛИЗИРА ЯВЛЕНИЕТО ИСПАНСКО-ГАЛИСИЙСКО КОДОВО ПРЕВКЛЮЧВАНЕ. Социолингвистичното и PRAGMATIC-discursive PERSPECTIVE е ПРЕДСТАВИТЕЛНО В ЛИНГИСТИЧНИТЕ АНАЛИЗИ И СЪГЛАСИЕ С СТУДИТЕ НА ПРЕДСТАВИТЕЛИТЕ, АТИТУДИ И ИДЕОЛОГИИ, които са се развили, като се договарят с получената СПЕЦИРАНА С ДАТА КОЛИКТИВИ ТРЕЗИ В ПРОЦЕСАТА на предизвикване на CORPUS._x000D_ 3. ИЗВЛИЧАНЕ НА РЕСУРСИ. С ЦЕЛ РАЗРАБОТВАНЕ НА РЕСУРСИ ОТ ОБЩ ОБЩЕСТВЕН ИНТЕРЕС ЗА МНОГОКРАТНА УПОТРЕБА СЕ РАЗГЛЕЖДА СЪЗДАВАНЕТО НА ПОЛЕЗНИ ЕЗИКОВИ ИНСТРУМЕНТИ В РАЗЛИЧНИ ОБЛАСТИ, СВЪРЗАНИ С ГОВОРИМИЯ ЕЗИК. В ДОПЪЛНЕНИЕ КЪМ ВЕЧЕ СПОМЕНАТИТЕ ИЗЧИСЛИТЕЛНИ ИНСТРУМЕНТИ СЕ ОТКРОЯВА ИЗПОЛЗВАНЕТО НА КОРПУСА ЗА ПРЕПОДАВАНЕ НА ИСПАНСКИ ЕЗИК КАТО ЧУЖД ЕЗИК, КАКТО ПРИ РАЗРАБОТВАНЕТО НА МАТЕРИАЛИ ЗА ЛЕЧЕНИЕ НА ЯВЛЕНИЯТА НА ОСОБЕНА ТРУДНОСТ ПРИ УСТНОТО ВЗАИМОДЕЙСТВИЕ В КЛАСНАТА СТАЯ, ТАКА И ПРИ ПРОЕКТИРАНЕТО НА ДЕЙНОСТИ ЗА „КОМПЮТЪРНО ПОДПОМАГАНО ИЗУЧАВАНЕ НА ЕЗИЦИ“, КОИТО ПОМАГАТ ПРИ ОБУЧЕНИЕТО НА ВСИЧКИ УСТНИ УМЕНИЯ ЧРЕЗ УЕБ БАЗИРАНИ ИНТЕРФЕЙСИ ЗА ТЪРСЕНЕ НА КОРПУСИ. СЪЩО ТАКА, КАТО СЕ ВЪЗПОЛЗВА ОТ ТЕКСТА И АУДИО ПОДРАВНЯВАНЕТО НА КОРПУСА, РЕЧНИКЪТ НА ЧЕСТОТИТЕ В ЕЛЕКТРОННАТА ВЕРСИЯ ВКЛЮЧВА НЕЗАБАВЕН ДОСТЪП ДО ТЕКСТОВИТЕ И ЗВУКОВИТЕ ФРАГМЕНТИ, СЪОТВЕТСТВАЩИ НА ЛЕКСИКАЛНИТЕ ЗАПИСИ. (Bulgarian)
17 August 2022
0 references
REMIANTIS PAGAL ANKSTESNIUS ESLOROS PROJEKTUS ATLIKTU DARBU, DABARTINIU PASIŪLYMU SIEKIAMA SUKURTI NAUJUS SODRINIMO IR PANAUDOJIMO BŪDUS, KURIE LEISTŲ DARYTI PAŽANGĄ APSKAIČIUOJANT ŽODINIŲ KŪNŲ APDOROJIMĄ, SUPRATIMĄ APIE ŠNEKAMĄJĄ KOMUNIKACIJĄ IR RENGIANT VIEŠOJO INTERESO MEDŽIAGAS IR PRIEMONES. _x000D_ 1. KŪNO SODRINIMAS. SIEKIANT PAGERINTI ŽYMEKLIO SĖKMĖS RODIKLĮ IR ESAMĄ MORFOSINTAKTIKOS ANOTACIJĄ, ĮDIEGIAMOS NAUJOS FORMOS ATPAŽINIMO FUNKCIJOS (RAŠYTINIAI KARDINOLINIAI NUMERIAI, KELIŲ ŽODŽIŲ VIENETAI, VERTINAMOSIOS PRIESAGOS), IŠPLEČIAMAS MOKOMASIS RINKINYS IR ŽODYNAS, ĮVEDAMI KALBINIAI APRIBOJIMAI, KURIE PAPILDO STATISTINĮ METODĄ, PAGRĮSTĄ KOKYBINE LIKUSIŲ KLAIDŲ ANALIZE. PATOBULINTA MORFOSINTAKTINĖ ANOTACIJA YRA PAGRINDAS TIEK PAGERINTI ESAMO KORPUSO KOKYBĘ, TIEK SUKURTI „TREEBANK“ DVIEJŲ SKIRTINGŲ FORMATŲ IR GYLIO LYGIUS: IŠSAMESNIS KONSTITUTYVUS, MAŽIAU IŠSAMUS, PAGRĮSTAS PRIKLAUSOMYBE, O PASTARASIS – TARPTAUTINIO BENDRADARBIAVIMO PROJEKTO VISUOTINĖS PRIKLAUSOMYBĖS, KURIA SIEKIAMA SUKURTI DAUGIAKALBES ANOTAVIMO SISTEMAS IR DAUGIAKALBES ANALIZAVIMO PRIEMONES, DALIS. Dėl KITOS ŠEŽIOS, SUSIJUSIOS IŠLAIDŲ IŠLAIDŲ IŠLAIDŲ KONTROLĖS ATASKAITA, PAGAL VALSTYBĖS ATASKAITA su informacija, susijusia su informacija, susijusia su IŠSKYRUS IŠLAIDŲ IŠLAIDAVIMĄ, APSAUGOS LANGUJOJE, TAIKOMAS PRIEMONĖS IR KOMUNIKATINĖS FUNIKACIJOS FUNKCIJAI CORPUS SEQUENCES._x000D_ 2. KALBINĖS KALBOS ANALIZĖ. NAUDOJANT „ESLORA“ ANOTACIJĄ IR METADUOMENIS BEI PAIEŠKOS SĄSAJĄ, KURI JAU PALENGVINA APKLAUSĄ ATLIEKANT BENDRAS PAIEŠKAS, NAGRINĖJAMOS NAUJOS ATITINKAMŲ ŠNEKAMOSIOS KALBOS REIŠKINIŲ ANALIZĖS. LEKSINIU-GRAMATIKOS LYGIU, TINKAMAS MEDŽIAGŲ APDOROJIMAS LEIDŽIA IŠGAUTI IR ANALIZUOTI LEMMŲ IR GRAMATINIŲ KATEGORIJŲ PASISKIRSTYMĄ IR DAŽNUMĄ, KAD BŪTŲ SUKURTAS DAŽNIŲ ŽODYNAS, PAGRĮSTAS KONKREČIAI ŠNEKAMOSIOS KALBOS DUOMENIMIS. KITA VERTUS, BE JAU ATLIKTŲ STATINIŲ IR ŽODINIŲ FORMŲ TYRIMŲ, ANALIZUOJAMAS ISPANIJOS-GALICIJOS KODO KEITIMO REIŠKINYS. Sociolingvistinės ir PRAGMATIC-diskursinės PASLAUGOS PRIEMONĖS IR SUSITARIANČIOS SUSITARIANČIOS ATSTOVŲ, GALIMYBIŲ ir IDEOLOGIJŲ, KURIUOS SUSITARIANČIOS SU SUSITARIANČIOS NUOSTATOS DUOMENŲ KLAUSIMŲ KONKRETŲ KLAUSIMŲ PROCEDŪROJE._x000D_ 3. IŠTEKLIŲ GAVYBA. SIEKIANT SUKURTI DAUGKARTINIO NAUDOJIMO VISUOTINĖS SVARBOS IŠTEKLIUS, SPRENDŽIAMAS NAUDINGŲ KALBINIŲ PRIEMONIŲ, SUSIJUSIŲ SU ŠNEKAMĄJA KALBA, KŪRIMO KLAUSIMAS. BE JAU MINĖTŲ SKAIČIAVIMO PRIEMONIŲ, IŠSISKIRIA TEKSTYNAS, SKIRTAS ISPANŲ KALBOS MOKYMUI KAIP UŽSIENIO KALBAI, TIEK RENGIANT MEDŽIAGĄ, SKIRTĄ GYDYTI YPATINGŲ SUNKUMŲ, SUSIJUSIŲ SU KALBINE SĄVEIKA KLASĖJE, REIŠKINIUS, TAIP PAT KURIANT „KOMPIUTERIŲ PADEDAMO KALBŲ MOKYMOSI“ VEIKLĄ, KURI PADEDA MOKYTI VISUS ŽODINIUS ĮGŪDŽIUS PER INTERNETINES KORPUSŲ PAIEŠKOS SĄSAJAS. BE TO, PASINAUDOJANT TEKSTO IR GARSO SUDERINIMO KORPUSU, DAŽNIŲ ŽODYNAS ELEKTRONINĖJE VERSIJOJE APIMA TIESIOGINĘ PRIEIGĄ PRIE TEKSTINIŲ IR GARSO FRAGMENTŲ, ATITINKANČIŲ LEKSINIUS ĮRAŠUS. (Lithuanian)
17 August 2022
0 references
NA TEMELJU DOSADAŠNJIH PROJEKATA ESLORA, OVIM SE PRIJEDLOGOM NASTOJE RAZVITI NOVI NAČINI OBOGAĆIVANJA I ISKORIŠTAVANJA KOJIMA SE OMOGUĆUJE NAPREDAK PREMA RAČUNALNOM LIJEČENJU USMENE KORPUSE, RAZUMIJEVANJU GOVORNE KOMUNIKACIJE TE IZRADI MATERIJALA I ALATA OD JAVNOG INTERESA. _x000D_ 1. OBOGAĆIVANJE KORPUSA. KAKO BI SE POBOLJŠALA STOPA USPJEŠNOSTI TAGGERA I POSTOJEĆA MORFOSINTAKTIČKA NAPOMENA, UVODE SE NOVE FUNKCIONALNOSTI PREPOZNAVANJA OBLIKA (PISANI KARDINALNI BROJEVI, JEDINICE S VIŠE RIJEČI, VRIJEDNI SUFIKSI), PROŠIRENI SU KORPUS I LEKSIKON TE SE UVODE JEZIČNA OGRANIČENJA KOJA NADOPUNJUJU STATISTIČKU METODU KOJA SE TEMELJI NA KVALITATIVNOJ ANALIZI PREOSTALIH POGREŠAKA. POBOLJŠANA MORFOSINTAKTIČKA NAPOMENA SLUŽI KAO OSNOVA ZA POVEĆANJE KVALITETE POSTOJEĆEG KORPUSA I ZA STVARANJE TREEBANKE DOSTUPNE U DVA RAZLIČITA FORMATA I RAZINE DUBINE: DETALJNIJA KONSTITUTIVNA, A DRUGA MANJE DETALJNA KOJA SE TEMELJI NA OVISNOSTIMA, PRI ČEMU JE POTONJI DIO UNIVERZALNIH OVISNOSTI MEĐUNARODNOG PROJEKTA SURADNJE ČIJI JE CILJ RAZVOJ VIŠEJEZIČNIH SUSTAVA ZA OZNAČIVANJE I VIŠEJEZIČNIH ALATA ZA RAŠČLAMBU. Na JEDNOJ RUKU, U RELATIONU IZVJEŠĆA IZVJEŠĆA IZVJEŠĆA, INITIVNA PRIMJENA ZA PRIMJENJIVANJE DIJELA MATERIJALA S INFORMACIJAMA U OBZIR ŠPANJNIŠTVA kao FOREIGN LANGUAGE, SUCH AS THEME IDENTIFICATION I COMMUNICATIVE FUNCTION THE CORPUS SEQUENCES._x000D_ 2. JEZIČNA ANALIZA GOVORA. UZ NAPOMENU I METAPODATKE ESLORE I SUČELJE ZA PRETRAŽIVANJE KOJE VEĆ OLAKŠAVA NJEGOVO ISPITIVANJE KOMBINIRANIM PRETRAŽIVANJEM, OBRAĐUJU SE NOVE ANALIZE RELEVANTNIH POJAVA GOVORNOG JEZIKA. NA LEKSIČKO-GRAMMATSKOJ RAZINI, PRAVILNA OBRADA MATERIJALA OMOGUĆUJE EKSTRAKCIJU I ANALIZU DISTRIBUCIJE I UČESTALOSTI LEMME I GRAMATIČKIH KATEGORIJA KAKO BI SE RAZVIO FREKVENCIJSKI RJEČNIK KOJI SE TEMELJI POSEBNO NA PODACIMA GOVORNOG JEZIKA. S DRUGE STRANE, OSIM VEĆ PROVEDENIH STUDIJA O KONSTRUKCIJAMA I VERBALNIM OBLICIMA, ANALIZIRA SE POJAVA ŠPANJOLSKO-GALICIJSKOG KODIRANJA. Sociolingvistika I PRAGMATIC-diskurzivni PERSPECTIVE PREDSTAVNOSTI U LINGUISTIČKOM ANALIZU I ZAJEDNIČKOM STARNOM PREDSTAVNOSTI, ATTITUDES I IDEOLOGIJA OBAVIJESTI JE UGOVORA UGOVORA REKODEDNE SPČE sa DATA COLLECTED THROUGH QUESTIONNAIRES u procesu pokretanja CORPUS-a._x000D_ 3. VAĐENJE RESURSA. U CILJU RAZVOJA PONOVNO UPOTREBLJIVIH RESURSA OD OPĆEG JAVNOG INTERESA RAZMATRA SE STVARANJE KORISNIH JEZIČNIH INSTRUMENATA U RAZLIČITIM PODRUČJIMA POVEZANIMA S GOVORNIM JEZIKOM. OSIM VEĆ SPOMENUTIH RAČUNALNIH ALATA, ISTIČE SE I UPORABA KORPUSA ZA PODUČAVANJE ŠPANJOLSKOG KAO STRANOG JEZIKA, KAKO U IZRADI MATERIJALA ZA LIJEČENJE FENOMENA POSEBNIH POTEŠKOĆA U GOVORNOJ INTERAKCIJI U UČIONICI, TAKO I U OSMIŠLJAVANJU AKTIVNOSTI „UČENJA RAČUNALNO POTPOMOGNUTOG JEZIKA” KOJE POMAŽU U OSPOSOBLJAVANJU SVIH USMENIH VJEŠTINA PUTEM INTERNETSKIH SUČELJA ZA PRETRAŽIVANJE KORPUSA. TAKOĐER, KORISTEĆI TEKST I AUDIO PORAVNANJE KORPUSA, RJEČNIK FREKVENCIJA U ELEKTRONIČKOJ VERZIJI UKLJUČUJE NEPOSREDAN PRISTUP TEKSTUALNIM I ZVUČNIM FRAGMENTIMA KOJI ODGOVARAJU LEKSIČKIM UNOSIMA. (Croatian)
17 August 2022
0 references
MED UTGÅNGSPUNKT I DET ARBETE SOM UTFÖRTS INOM RAMEN FÖR DE TIDIGARE ESLORA-PROJEKTEN SYFTAR DET NUVARANDE FÖRSLAGET TILL ATT UTVECKLA NYA SÄTT ATT BERIKA OCH UTNYTTJA DEM SOM GÖR DET MÖJLIGT ATT GÖRA FRAMSTEG NÄR DET GÄLLER DATORBEHANDLING AV ORALA KORPORER, FÖRSTÅELSE AV MUNTLIG KOMMUNIKATION OCH UTARBETANDE AV MATERIAL OCH VERKTYG AV ALLMÄNT INTRESSE. _x000D_ 1. BERIKNING AV CORPUS. FÖR ATT FÖRBÄTTRA TAGGARENS FRAMGÅNGSGRAD OCH DEN BEFINTLIGA MORFOSYNTAKTISKA ANNOTATIONEN INFÖRS NYA FUNKTIONER FÖR ERKÄNNANDE AV FORMULÄR (SKRIVNA KARDINALNUMMER, FLERORDSENHETER, APPRECIATIVA SUFFIX), UTBILDNINGENS CORPUS OCH LEXIKONET UTÖKAS OCH SPRÅKLIGA BEGRÄNSNINGAR INFÖRS SOM KOMPLETTERAR DEN STATISTISKA METOD SOM BYGGER PÅ KVALITATIV ANALYS AV DE ÅTERSTÅENDE FELEN. DEN FÖRBÄTTRADE MORFOSYNTAKTISKA ANNOTATIONEN TJÄNAR SOM GRUND BÅDE FÖR ATT HÖJA KVALITETEN PÅ DEN BEFINTLIGA CORPUS OCH FÖR ATT GENERERA EN TREEBANK SOM FINNS I TVÅ OLIKA FORMAT OCH DJUPNIVÅER: EN MER DETALJERAD KONSTITUTIV OCH EN ANNAN MINDRE DETALJERAD, SOM BYGGER PÅ BEROENDEN, SOM SENARE INGÅR I DET INTERNATIONELLA SAMARBETSPROJEKTET UNIVERSELLA BEROENDEN SOM SYFTAR TILL ATT UTVECKLA FLERSPRÅKIGA ANNOTATIONSSYSTEM OCH FLERSPRÅKIGA TOLKVERKTYG. Om ANDRA HAND, I VERKSAMHET TILL DEN EXPECTERADE EXTRAKTIONEN AV RESOURCES, EN INITIAL ANSÖKNING ÄR MEDDELANDE TILL MEDDELANDE AV MATERIALS MED INFORMATION RELEVANT FÖR ITS EXPLOITATION I SPANISKA Tjänsten som en FOREIGN LANGUAGE, SUCH ASME IDENTIFICATION OCH KOMMUNIKATIV FUNKTION AV CORPUS SEQUENCES._x000D_ 2. SPRÅKLIG ANALYS AV TAL. MED ESLORAS ANTECKNING OCH METADATA OCH SÖKGRÄNSSNITTET SOM REDAN UNDERLÄTTAR FÖRHÖRET MED HJÄLP AV KOMBINERADE SÖKNINGAR BEHANDLAS NYA ANALYSER AV RELEVANTA FÖRETEELSER I DET TALADE SPRÅKET. PÅ LEXIKALISK-GRAMMATISK NIVÅ MÖJLIGGÖR KORREKT BEARBETNING AV MATERIALEN EXTRAKTION OCH ANALYS AV DISTRIBUTIONEN OCH FREKVENSEN AV LEMMAS OCH GRAMMATISKA KATEGORIER FÖR ATT UTVECKLA EN FREKVENSORDLISTA BASERAD SPECIFIKT PÅ TALADE SPRÅKDATA. Å ANDRA SIDAN ANALYSERAS, FÖRUTOM DE STUDIER OM KONSTRUKTIONER OCH VERBALA FORMER SOM REDAN GENOMFÖRTS, FENOMENET MED DEN SPANSK-GALICISKA KODBYTET. Det sociolingvistiska och PRAGMATIC-diskursiva PERSPEKTIVA ÄR PRESENTLIGT I LINGUISTIC ANALYSER OCH SOM KONSTATERAR MED STUDY of REPRESENTATIONER, ATTITUDES OCH IDEOLOGIER som är utvecklade genom att de RECORDEDDA ÄR MED DEN DATA COLLEKTEDTA DETTA QUESTIONNAIER I CORPUSS PROCESS of elicitation._x000D_ 3. UTVINNING AV RESURSER. I SYFTE ATT UTVECKLA ÅTERANVÄNDBARA RESURSER AV ALLMÄNT INTRESSE BEHANDLAS SKAPANDET AV ANVÄNDBARA SPRÅKLIGA INSTRUMENT PÅ OLIKA OMRÅDEN MED ANKNYTNING TILL TALAD SPRÅK. UTÖVER DE BERÄKNINGSVERKTYG SOM REDAN NÄMNTS UTMÄRKER SIG ANVÄNDNINGEN AV CORPUS FÖR UNDERVISNING I SPANSKA SOM FRÄMMANDE SPRÅK, BÅDE VID UTARBETANDET AV MATERIAL FÖR ATT BEHANDLA FENOMEN MED SÄRSKILDA SVÅRIGHETER I TALAD INTERAKTION I KLASSRUMMET, LIKSOM VID UTFORMNINGEN AV AKTIVITETER FÖR DATORSTÖDD SPRÅKINLÄRNING SOM HJÄLPER TILL ATT UTBILDA ALLA MUNTLIGA FÄRDIGHETER GENOM WEBBASERADE CORPUS-SÖKNINGSGRÄNSSNITT. OCKSÅ, DRA NYTTA AV TEXT OCH LJUDANPASSNING AV CORPUS, LEXIKON AV FREKVENSER I ELEKTRONISK VERSION INNEHÅLLER OMEDELBAR TILLGÅNG TILL TEXT OCH LJUDFRAGMENT SOM MOTSVARAR LEXIKALISKA POSTER. (Swedish)
17 August 2022
0 references
PORNIND DE LA ACTIVITATEA DESFĂȘURATĂ ÎN CADRUL PROIECTELOR ANTERIOARE ESLORA, PREZENTA PROPUNERE VIZEAZĂ DEZVOLTAREA UNOR NOI MODALITĂȚI DE ÎMBOGĂȚIRE ȘI EXPLOATARE CARE SĂ PERMITĂ REALIZAREA DE PROGRESE ÎN CEEA CE PRIVEȘTE TRATAMENTUL COMPUTAȚIONAL AL CORPULUI ORAL, ÎNȚELEGEREA COMUNICĂRII VERBALE ȘI ELABORAREA DE MATERIALE ȘI INSTRUMENTE DE INTERES PUBLIC. _x000D_ 1. ÎMBOGĂȚIREA CORPULUI. PENTRU A ÎMBUNĂTĂȚI RATA DE SUCCES A TAGGERULUI ȘI ADNOTAREA MORFOSITACTICĂ EXISTENTĂ, SUNT IMPLEMENTATE FUNCȚIONALITĂȚI NOI DE RECUNOAȘTERE A FORMELOR (NUMERE CARDINALE SCRISE, UNITĂȚI DE CUVINTE MULTIPLE, SUFIXE APRECIATIVE), CORPUL DE FORMARE ȘI LEXICONUL SUNT EXTINSE ȘI SE INTRODUC RESTRICȚII LINGVISTICE CARE COMPLETEAZĂ METODA STATISTICĂ BAZATĂ PE ANALIZA CALITATIVĂ A ERORILOR RĂMASE. ADNOTAREA MORFOSITACTICĂ ÎMBUNĂTĂȚITĂ SERVEȘTE DREPT BAZĂ ATÂT PENTRU CREȘTEREA CALITĂȚII CORPULUI EXISTENT, CÂT ȘI PENTRU GENERAREA UNEI BĂNCI DE ARBORI DISPONIBILE ÎN DOUĂ FORMATE ȘI NIVELURI DE ADÂNCIME DIFERITE: UNA MAI DETALIATĂ ȘI UNA MAI PUȚIN DETALIATĂ, BAZATĂ PE DEPENDENȚE, ACEASTA DIN URMĂ FIIND ÎNCADRATĂ ÎN PROIECTUL DE COLABORARE INTERNAȚIONALĂ DEPENDENȚE UNIVERSALE CARE VIZEAZĂ DEZVOLTAREA UNOR SISTEME DE ADNOTARE MULTILINGVE ȘI INSTRUMENTE MULTILINGVE DE PARSARE. Pe de altă parte, în conformitate cu EXTRACȚIA EXTRACȚIEI EXPECTATE a RESURSElor, o cerere INITIALĂ este în măsură să se raporteze la o parte a MATERIANIILOR CU INFORMAȚII RELEVANTE la EXPLOITAREA ESTE ÎN CONSIDERAREA SPANIEI ca o LANGUAGE FOREIGNĂ, SUCH as THEME IDENTIFICATION and COMUNICATIVE FUNCTION OF THE CORPUS SEQUENCES._x000D_ 2. ANALIZA LINGVISTICĂ A DISCURSULUI. CU ADNOTAREA ȘI METADATELE ESLORA ȘI INTERFAȚA DE CĂUTARE CARE FACILITEAZĂ DEJA INTEROGAREA ACESTEIA PRIN CĂUTĂRI COMBINATE, SUNT ABORDATE NOI ANALIZE ALE FENOMENELOR RELEVANTE ALE LIMBAJULUI VORBIT. LA NIVEL LEXICAL-GRAMATICAL, PRELUCRAREA CORECTĂ A MATERIALELOR PERMITE EXTRAGEREA ȘI ANALIZA DISTRIBUȚIEI ȘI FRECVENȚEI LEMELOR ȘI A CATEGORIILOR GRAMATICALE PENTRU A DEZVOLTA UN DICȚIONAR DE FRECVENȚĂ BAZAT ÎN MOD SPECIFIC PE DATELE DE LIMBĂ VORBITĂ. PE DE ALTĂ PARTE, PE LÂNGĂ STUDIILE PRIVIND CONSTRUCȚIILE ȘI FORMELE VERBALE DEJA EFECTUATE, SE ANALIZEAZĂ FENOMENUL DE COMUTARE A CODULUI SPANIOLO-GALICIAN. PERSPECTIVEle socio-lingvistice ȘI PRAGMATICE PREȘTE ÎN ANALIZA LINGUISTICĂ ȘI ESTE CONNECTATE CU STUDIA DE REPREZENTARE, ATTITUDII ȘI IDOLOGII CARE ESTE DEZVOLTATE ÎN CONTRATAREA SPECIALULUI RECORDED CU DATA COLLECTATE ÎN PREZENTE ÎN PROCESURILE Elicitării CORPUS._x000D_ 3. EXTRAGEREA RESURSELOR. ÎN SCOPUL DEZVOLTĂRII RESURSELOR REUTILIZABILE DE INTERES PUBLIC GENERAL, SE ABORDEAZĂ CREAREA DE INSTRUMENTE LINGVISTICE UTILE ÎN DIFERITE DOMENII LEGATE DE LIMBA VORBITĂ. ÎN PLUS FAȚĂ DE INSTRUMENTELE DE CALCUL DEJA MENȚIONATE, UTILIZAREA CORPUSULUI PENTRU PREDAREA LIMBII SPANIOLE CA LIMBĂ STRĂINĂ SE EVIDENȚIAZĂ, ATÂT ÎN ELABORAREA DE MATERIALE PENTRU TRATAREA FENOMENELOR DE DIFICULTATE DEOSEBITĂ ÎN INTERACȚIUNEA VORBITĂ ÎN CLASĂ, CÂT ȘI ÎN PROIECTAREA ACTIVITĂȚILOR DE „ÎNVĂȚARE A LIMBILOR STRĂINE ASISTATĂ DE CALCULATOR” CARE CONTRIBUIE LA FORMAREA TUTUROR COMPETENȚELOR ORALE PRIN INTERFEȚE DE CĂUTARE DE CORPUS BAZATE PE WEB. DE ASEMENEA, PROFITÂND DE ALINIEREA TEXTULUI ȘI AUDIO A CORPULUI, DICȚIONARUL FRECVENȚELOR ÎN VERSIUNEA ELECTRONICĂ ÎNCORPOREAZĂ ACCESUL IMEDIAT LA FRAGMENTELE TEXTUALE ȘI SONORE CORESPUNZĂTOARE INTRĂRILOR LEXICALE. (Romanian)
17 August 2022
0 references
NAMEN SEDANJEGA PREDLOGA JE NA PODLAGI DELA, OPRAVLJENEGA V OKVIRU PREJŠNJIH PROJEKTOV ESLORA, RAZVITI NOVE NAČINE OBOGATITVE IN IZKORIŠČANJA, KI OMOGOČAJO NAPREDEK PRI RAČUNSKEM ZDRAVLJENJU USTNIH KORPUSOV, RAZUMEVANJU GOVORNE KOMUNIKACIJE TER IZDELAVI MATERIALOV IN ORODIJ JAVNEGA INTERESA. _x000D_ 1. OBOGATITEV KORPUSA. DA BI IZBOLJŠALI STOPNJO USPEŠNOSTI TAGGERJA IN OBSTOJEČO MORFOSINTAKTIČNO OZNAKO, SE IZVAJAJO NOVE FUNKCIJE PREPOZNAVANJA OBLIK (PISANE KARDINALNE ŠTEVILKE, VEČBESEDNE ENOTE, APRECIATIVNE PRIPONE), RAZŠIRITA SE KORPUS ZA USPOSABLJANJE IN LEKSIKON TER UVEDEJO JEZIKOVNE OMEJITVE, KI DOPOLNJUJEJO STATISTIČNO METODO, KI TEMELJI NA KVALITATIVNI ANALIZI PREOSTALIH NAPAK. IZBOLJŠANA MORZOSINTAKTIČNA OZNAKA SLUŽI KOT OSNOVA ZA POVEČANJE KAKOVOSTI OBSTOJEČEGA KORPUSA IN ZA USTVARJANJE TREEBANK, KI JE NA VOLJO V DVEH RAZLIČNIH FORMATIH IN GLOBINAH: PODROBNEJŠA KONSTITUTIVNA IN MANJ PODROBNA, KI TEMELJI NA ODVISNOSTIH, PRI ČEMER JE SLEDNJI DEL UNIVERZALNE ODVISNOSTI MEDNARODNEGA SODELOVALNEGA PROJEKTA, KATEREGA CILJ JE RAZVOJ VEČJEZIČNIH SISTEMOV ZA OZNAČEVANJE IN VEČJEZIČNIH ORODIJ ZA RAZČLENJEVANJE. Na DRUGI HANDU, V PODLAGI IZVAJANJA RESOURCIJ, INITIČNA ODPORJA V PRILOGI DELETNIH IMERIALOV Z INFORMACIJEJO ODLOČILA IZ IZKLJUČENO IZKLJUČENO V SKLADU SPREMEMLJANJA V ZDRUŽENJIH JAVNIH JAVNIH JAVNIH JAVNIH JAVNIH JAVNIH JAVNIH IN PODROČJIH IZPOSTAVLJANJA IN UPORABE CORPUS SEQUENCES._x000D_ 2. JEZIKOVNA ANALIZA GOVORA. Z OPOMBO IN METAPODATKI O ESLORI IN ISKALNIM VMESNIKOM, KI ŽE OMOGOČA NJEGOVO ZASLIŠEVANJE S KOMBINIRANIM ISKANJEM, SE OBRAVNAVAJO NOVE ANALIZE POMEMBNIH POJAVOV GOVORJENEGA JEZIKA. NA LEKSIKALNO-GRAMSKI RAVNI PRAVILNA OBDELAVA MATERIALOV OMOGOČA EKSTRAKCIJO IN ANALIZO PORAZDELITVE IN POGOSTOSTI LEMM IN SLOVNIČNIH KATEGORIJ ZA RAZVOJ FREKVENČNEGA SLOVARJA, KI TEMELJI POSEBEJ NA PODATKIH GOVORJENEGA JEZIKA. PO DRUGI STRANI PA SE POLEG ŽE OPRAVLJENIH ŠTUDIJ O KONSTRUKCIJAH IN VERBALNIH OBLIKAH ANALIZIRA POJAV ŠPANSKO-GALIČANSKEGA KODNEGA PREKLAPLJANJA. Socialno-jezikovni IN PRAGMATIC diskurzni PERSPECTIVE JE PREDSTAVNIK V LINGUISTIC ANALIZACIJI IN JE KONEKTIRANJI S STUDIJEM PREDSTAVNIKOV, ATTITUDES IN IDEOLOGIJI, ki so se razvijali tako, da se ZAHTEVAJO PODROČJE PREDSTAVNIKOV S PODATKIH VPRAŠANJIH VPRAŠANJIH V PREDHODNIH VPRAŠANJIH VELIKOVANJU CORPUS-a._x000D_ 3. ČRPANJE VIROV. DA BI RAZVILI VIRE SPLOŠNEGA JAVNEGA INTERESA, KI JIH JE MOGOČE PONOVNO UPORABITI, SE OBRAVNAVA OBLIKOVANJE KORISTNIH JEZIKOVNIH INSTRUMENTOV NA RAZLIČNIH PODROČJIH, POVEZANIH Z GOVORJENIM JEZIKOM. POLEG ŽE OMENJENIH RAČUNALNIŠKIH ORODIJ IZSTOPA UPORABA KORPUSA ZA POUČEVANJE ŠPANŠČINE KOT TUJEGA JEZIKA, TAKO PRI IZDELAVI GRADIVA ZA ZDRAVLJENJE POJAVOV POSEBNIH TEŽAV PRI GOVORJENI INTERAKCIJI V RAZREDU KOT TUDI PRI OBLIKOVANJU DEJAVNOSTI „UČENJA JEZIKOV S POMOČJO RAČUNALNIKA“, KI POMAGAJO PRI USPOSABLJANJU VSEH USTNIH SPRETNOSTI PREK SPLETNIH VMESNIKOV ZA ISKANJE KORPUSA. POLEG TEGA SLOVAR FREKVENC V ELEKTRONSKI RAZLIČICI, KI IZKORIŠČA BESEDILO IN ZVOČNO PORAVNAVO KORPUSA, VKLJUČUJE TAKOJŠEN DOSTOP DO BESEDILNIH IN ZVOČNIH FRAGMENTOV, KI USTREZAJO LEKSIKALNIM VNOSOM. (Slovenian)
17 August 2022
0 references
BIORĄC ZA PODSTAWĘ PRACE PROWADZONE W RAMACH POPRZEDNICH PROJEKTÓW ESLORA, NINIEJSZY WNIOSEK MA NA CELU OPRACOWANIE NOWYCH SPOSOBÓW WZBOGACANIA I WYKORZYSTYWANIA, KTÓRE UMOŻLIWIAJĄ OSIĄGNIĘCIE POSTĘPÓW W ZAKRESIE OBLICZENIOWEGO TRAKTOWANIA KORPUSU JAMY USTNEJ, ZROZUMIENIA KOMUNIKACJI MÓWIONEJ ORAZ OPRACOWANIA MATERIAŁÓW I NARZĘDZI LEŻĄCYCH W INTERESIE PUBLICZNYM. _x000D_ 1. WZBOGACENIE KORPUSU. ABY POPRAWIĆ WSKAŹNIK SUKCESU TAGGERA I ISTNIEJĄCĄ ADNOTACJĘ MORFOSYNTAKTYCZNĄ, WDRAŻANE SĄ NOWE FUNKCJE ROZPOZNAWANIA FORMULARZY (PISANE LICZBY KARDYNAŁÓW, JEDNOSTKI WIELOSŁOWE, PRZYROSTKI DOCENIAJĄCE), ROZSZERZA SIĘ KORPUS SZKOLENIOWY I LEKSYKON ORAZ WPROWADZA SIĘ OGRANICZENIA JĘZYKOWE, KTÓRE UZUPEŁNIAJĄ METODĘ STATYSTYCZNĄ OPARTĄ NA JAKOŚCIOWEJ ANALIZIE POZOSTAŁYCH BŁĘDÓW. ULEPSZONA ADNOTACJA MORFOSYNTAKTYCZNA SŁUŻY ZA PODSTAWĘ ZARÓWNO DO PODNIESIENIA JAKOŚCI ISTNIEJĄCEGO KORPUSU, JAK I DO WYGENEROWANIA BANKU DRZEWNEGO DOSTĘPNEGO W DWÓCH RÓŻNYCH FORMATACH I POZIOMACH GŁĘBOKOŚCI: BARDZIEJ SZCZEGÓŁOWE, JEDNO I DRUGIE, MNIEJ SZCZEGÓŁOWE, OPARTE NA ZALEŻNOŚCIACH, PRZY CZYM TA OSTATNIA ZOSTAŁA WBUDOWANA W RAMY MIĘDZYNARODOWEGO PROJEKTU WSPÓŁPRACY UNIWERSALNEGO UZALEŻNIENIA, KTÓREGO CELEM JEST OPRACOWANIE WIELOJĘZYCZNYCH SYSTEMÓW ADNOTACJI I WIELOJĘZYCZNYCH NARZĘDZI ANALIZOWANIA. W sprawie INNYCH WYKONAWCZEJ WYDATKOWANIA DO WYDATKOWANIA WYDARZENIA MATERIAŁÓW ZAWIERAJĄCYCH INFORMACJI I WYKONAWCZEJ WYKONAWCZEJ HISZPANSKIEJ JAKO WYKONAWCZEJ WYKONAWCZEJ WYDARZENIA I FUNKCJI WSPÓLNOTYCZNEJ WYDAŻNOŚCI Przedsiębiorstwa._x000D_ 2. ANALIZA JĘZYKOWA MOWY. DZIĘKI ADNOTACJI I METADANYCH ESLORY ORAZ INTERFEJSOWI WYSZUKIWANIA, KTÓRE JUŻ UŁATWIA JEJ PRZESŁUCHANIE ZA POMOCĄ POŁĄCZONYCH WYSZUKIWAŃ, PORUSZANE SĄ NOWE ANALIZY ISTOTNYCH ZJAWISK JĘZYKA MÓWIONEGO. NA POZIOMIE LEKSYKANO-GRAMATYCZNYM WŁAŚCIWE PRZETWARZANIE MATERIAŁÓW POZWALA NA EKSTRAKCJĘ I ANALIZĘ ROZKŁADU I CZĘSTOTLIWOŚCI LEMMAS I KATEGORII GRAMATYCZNYCH W CELU OPRACOWANIA SŁOWNIKA CZĘSTOTLIWOŚCI OPARTEGO W SZCZEGÓLNOŚCI NA DANYCH JĘZYKA MÓWIONEGO. Z DRUGIEJ STRONY, OPRÓCZ PRZEPROWADZONYCH JUŻ BADAŃ NAD BUDYNKAMI I FORMAMI SŁOWNYMI, ANALIZOWANE JEST ZJAWISKO HISZPAŃSKO-GALIJSKIEGO PRZEŁĄCZANIA KODU. Socjolingwistyczny I PRAGMATYCZNY PERSPEKTYWY PERSPEKTYWY JEST PRZEDSTAWICIELI W ANALIZACH LINGUZYTYCZNYCH I JEST PRZEZNACZONYCH Z WYDARZENIEM PRZEDSTAWICIELI, UWAŻENIA I IDEOLOGII, KTÓRYCH JEST PRZEZNACZONY DO KONTAKTOWANIA W PROCESIE eliktyzacji USA._x000D_ 3. WYDOBYCIE ZASOBÓW. W CELU ROZWOJU ZASOBÓW WIELOKROTNEGO UŻYTKU ŚWIADCZONYCH W OGÓLNYM INTERESIE PUBLICZNYM PODJĘTO KWESTIĘ TWORZENIA UŻYTECZNYCH INSTRUMENTÓW JĘZYKOWYCH W RÓŻNYCH DZIEDZINACH ZWIĄZANYCH Z JĘZYKIEM MÓWIONYM. OPRÓCZ WSPOMNIANYCH JUŻ NARZĘDZI OBLICZENIOWYCH, WYKORZYSTANIE KORPUSU DO NAUCZANIA JĘZYKA HISZPAŃSKIEGO JAKO JĘZYKA OBCEGO WYRÓŻNIA SIĘ ZARÓWNO W OPRACOWYWANIU MATERIAŁÓW DO LECZENIA ZJAWISK SZCZEGÓLNYCH TRUDNOŚCI W INTERAKCJACH MÓWIONYCH W KLASIE, JAK I W PROJEKTOWANIU DZIAŁAŃ W ZAKRESIE „UCZENIA SIĘ JĘZYKÓW WSPOMAGANYCH KOMPUTEROWO”, KTÓRE POMAGAJĄ W SZKOLENIU WSZYSTKICH UMIEJĘTNOŚCI USTNYCH ZA POŚREDNICTWEM INTERNETOWYCH INTERFEJSÓW WYSZUKIWANIA KORPUSÓW. PONADTO, KORZYSTAJĄC Z WYRÓWNANIA TEKSTU I DŹWIĘKU KORPUSU, SŁOWNIK CZĘSTOTLIWOŚCI W WERSJI ELEKTRONICZNEJ ZAWIERA NATYCHMIASTOWY DOSTĘP DO FRAGMENTÓW TEKSTOWYCH I DŹWIĘKOWYCH ODPOWIADAJĄCYCH ZAPISOM LEKSYKALNYM. (Polish)
17 August 2022
0 references
Santiago de Compostela
0 references
20 December 2023
0 references
Identifiers
FFI2017-86379-P
0 references