Historical Manuscript transcription platform (Q3128152): Difference between revisions
Jump to navigation
Jump to search
(Changed label, description and/or aliases in da, fi, mt, lv, sk, ga, cs, pt, et, hu, bg, lt, hr, sv, ro, sl, pl, nl, fr, de, el, it, es, and other parts: Adding translations: da, fi, mt, lv, sk, ga, cs, pt, et, hu, bg, lt, hr, sv, ro, sl, pl,) |
(Changed label, description and/or aliases in pt) |
||||||
(3 intermediate revisions by 2 users not shown) | |||||||
label / pt | label / pt | ||||||
Plataforma | Plataforma de transcrição de manuscritos históricos | ||||||
Property / summary: Although several efforts have been made to date to digitise and access the content of these collections, none has been led to a satisfactory result in a full digital transcription, which automatically converts digital images of historical manuscripts into simple electronic text. Consequently, a large number of historical manuscripts cannot be easily studied and remain unexploited. The aim of the MDOC.tS project is to develop an innovative and cost-effective solution to help not only specialist scholars but also archives, libraries, museums, etc. in the full transcription of historical manuscripts. The resulting technologies will be integrated into a toolkit to be implemented in a specialised manuscript transcription assistance platform. The final product of the project will enable users to:- Export the full text from the digitised historical manuscripts automatically through a Handwritten Transcription Engine HTR using modern recurrent Neural Networks and language models.- Improve quality (e.g. noise removal) and highlight text areas in digitised historical manuscript texts.- Search for keywords directly in the digitised documents of historical collections using modern word tracing techniques (e.g. noise removal) and highlight text areas in digitised historical manuscript texts. (English) / qualifier | |||||||
readability score: 0.2571883616692846
| |||||||
Property / summary | Property / summary | ||||||
Embora tenham sido envidados vários esforços até à data para digitalizar e aceder ao conteúdo destas coleções, nenhum deles conduziu a um resultado satisfatório numa transcrição digital completa, que converte automaticamente imagens digitais de manuscritos históricos em texto eletrónico simples. Consequentemente, um grande número de manuscritos históricos não podem ser facilmente estudados e permanecem inexplorados. O objetivo do projeto MDOC.tS é desenvolver uma solução inovadora e económica para ajudar não só académicos especializados, mas também arquivos, bibliotecas, museus, etc., na transcrição completa de manuscritos históricos. As tecnologias resultantes serão integradas num conjunto de ferramentas a implementar numa plataforma especializada de assistência à transcrição de manuscritos. O produto final do projeto permitirá aos utilizadores:- Exportar automaticamente o texto integral dos manuscritos históricos digitalizados através de um motor de transcrição manuscrita HTR, utilizando redes neurais e modelos linguísticos modernos e recorrentes.- Melhorar a qualidade (por exemplo, remoção de ruído) e destacar áreas de texto em textos manuscritos históricos digitalizados.- Procurar palavras-chave diretamente nos documentos digitalizados de coleções históricas utilizando técnicas modernas de rastreio de palavras (por exemplo, remoção de ruído) e destacar áreas de texto em textos manuscritos históricos digitalizados. (Portuguese) | |||||||
Property / contained in Local Administrative Unit | |||||||
Property / contained in Local Administrative Unit: Commune of Kimmeria / rank | |||||||
Normal rank |
Latest revision as of 22:44, 9 October 2024
Project Q3128152 in Greece
Language | Label | Description | Also known as |
---|---|---|---|
English | Historical Manuscript transcription platform |
Project Q3128152 in Greece |
Statements
657,540.0 Euro
0 references
28 June 2018
0 references
27 December 2021
0 references
ΕΙΔΙΚΟΣ ΛΟΓΑΡΙΑΣΜΟΣ ΚΟΝΔΥΛΙΩΝ ΕΡΕΥΝΑΣ ΔΗΜΟΚΡΙΤΕΙΟΥ ΠΑΝΕΠΙΣΤΗΜΙΟΥ ΘΡΑΚΗΣ
0 references
Παρόλο, που μέχρι σήμερα έχουν γίνει αρκετές προσπάθειες ψηφιοποίησης και ηλεκτρονικής πρόσβασης στο περιεχόμενο των συλλογών αυτών, καμία δεν έχει οδηγηθεί με ικανοποιητικό αποτέλεσμα σε πλήρη ψηφιακή μεταγραφή (transcription), το οποίο μετατρέπει αυτόματα ψηφιακές εικόνες ιστορικών χειρόγραφων σε απλό ηλεκτρονικό κείμενο (text). Κατά συνέπεια μεγάλος αριθμός ιστορικών χειρόγραφων κειμένων να μη μπορεί να μελετηθεί εύκολα και να παραμένει ανεκμετάλλευτος.Ο στόχος του έργου μDOC.tS είναι είναι να αναπτύξει μία καινοτόμο και οικονομικά αποδοτική λύση για να βοηθήσει όχι μόνο ειδικούς μελετητές αλλά και αρχεία, βιβλιοθήκες, μουσεία, κ.τ.λ. στην πλήρη μεταγραφή των ιστορικών χειρόγραφων. Οι τεχνολογίες που θα προκύψουν θα ενσωματωθούν σε ένα σύνολο εργαλείων τα οποία θα υλοποιηθούν σε μια εξειδικευμένη πλατφόρμα υποβοήθησης μεταγραφής χειρογράφων. Το τελικό προϊόν του έργου θα δώσει στους χρήστες τη δυνατότητα να:- Εξάγουν αυτόματα το πλήρες κείμενο από τα ψηφιοποιημένα ιστορικά χειρόγραφα μέσω μιάς μηχανής μεταγραφής (Handwritten Transcription Engine HTR) χρησιμοποιώντας σύγχρονα επαναλαμβανόμενα νευρωνικά δίκτυα (Recurrent Neural Networks) και γλωσσικά μοντέλα.- Βελτιώσουν την ποιότητα (π.χ. αφαίρεση θορύβου) και να αναδείξουν τις περιοχές κειμένου στα ψηφιοποιημένα ιστορικά χειρόγραφα κείμενα.- Αναζητήσουν λέξεις-κλειδιά απευθείας στα ψηφιοποιημένα έγγραφα των ιστορικών συλλογών χρησιμοποιώντας σύγχρονες τεχνικές εντοπισμού λέξεων (Keyword Spotting KWS).- Διαχειρισθούν με φιλικό προς τον χρήστη, έξυπνο και αποδοτικό τρόπο τα ψηφιοποιημένα χειρόγραφα έγγραφα παρέχοντας περιβάλλον αυτόματης επεξεργασίας, μεταγραφής και διαχείρισης των δεδομένων. (Greek)
0 references
Although several efforts have been made to date to digitise and access the content of these collections, none has been led to a satisfactory result in a full digital transcription, which automatically converts digital images of historical manuscripts into simple electronic text. Consequently, a large number of historical manuscripts cannot be easily studied and remain unexploited. The aim of the MDOC.tS project is to develop an innovative and cost-effective solution to help not only specialist scholars but also archives, libraries, museums, etc. in the full transcription of historical manuscripts. The resulting technologies will be integrated into a toolkit to be implemented in a specialised manuscript transcription assistance platform. The final product of the project will enable users to:- Export the full text from the digitised historical manuscripts automatically through a Handwritten Transcription Engine HTR using modern recurrent Neural Networks and language models.- Improve quality (e.g. noise removal) and highlight text areas in digitised historical manuscript texts.- Search for keywords directly in the digitised documents of historical collections using modern word tracing techniques (e.g. noise removal) and highlight text areas in digitised historical manuscript texts. (English)
30 September 2021
0.2571883616692846
0 references
Bien que plusieurs efforts aient été faits à ce jour pour numériser et accéder au contenu de ces collections, aucun n’a abouti à un résultat satisfaisant en une transcription numérique complète, qui convertit automatiquement les images numériques de manuscrits historiques en texte électronique simple. Par conséquent, un grand nombre de manuscrits historiques ne peuvent pas être facilement étudiés et restent inexploités. Le projet MDOC.tS vise à développer une solution innovante et rentable pour aider non seulement les chercheurs spécialisés, mais aussi les archives, bibliothèques, musées, etc. dans la transcription complète des manuscrits historiques. Les technologies qui en résultent seront intégrées dans une boîte à outils qui sera mise en œuvre dans une plateforme spécialisée d’assistance à la transcription manuscrite. Le produit final du projet permettra aux utilisateurs:- d’exporter automatiquement le texte intégral des manuscrits historiques numérisés au moyen d’un moteur de transcription manuscrite HTR à l’aide de réseaux neuronaux récurrents modernes et de modèles linguistiques.- Améliorer la qualité (par exemple, élimination du bruit) et mettre en évidence les zones de texte dans les textes manuscrits historiques numérisés.- Rechercher des mots-clés directement dans les documents numérisés des collections historiques à l’aide de techniques modernes de traçage des mots (par exemple, élimination du bruit) et mettre en évidence les zones de texte dans les textes manuscrits historiques numérisés. (French)
30 November 2021
0 references
Obwohl bisher mehrere Anstrengungen unternommen wurden, um den Inhalt dieser Sammlungen zu digitalisieren und zuzugreifen, wurde keines zu einem zufrieden stellenden Ergebnis in einer vollständigen digitalen Transkription geführt, die digitale Bilder historischer Handschriften automatisch in einfachen elektronischen Text umwandelt. Das Ziel des MDOC.tS-Projekts ist es, eine innovative und kostengünstige Lösung zu entwickeln, um nicht nur Fachwissenschaftlern, sondern auch Archiven, Bibliotheken, Museen usw. in der vollständigen Transkription historischer Handschriften zu helfen. Die daraus resultierenden Technologien werden in ein Toolkit integriert, das in einer spezialisierten Handschriftshilfeplattform implementiert werden soll. Das Endprodukt des Projekts wird es Nutzern ermöglichen,:- den Volltext aus den digitalisierten historischen Manuskripten automatisch über eine handgeschriebene Transkriptionsmaschine HTR mit modernen wiederkehrenden Neural Networks und Sprachmodellen zu exportieren.- Qualität (z. B. Lärmentfernung) zu verbessern und Textbereiche digitalisierter historischer Manuskripttexte zu markieren.- Suchen Sie nach Schlüsselwörtern direkt in digitalisierten Dokumenten historischer Sammlungen mit modernen Wortverfolgungstechniken (z. B. Lärmentfernung) und markieren Textbereiche in digitalisierten historischen Handschriftentexten. (German)
7 December 2021
0 references
Hoewel er tot nu toe verscheidene inspanningen zijn geleverd om de inhoud van deze collecties te digitaliseren en toegankelijk te maken, is geen enkele tot een bevredigend resultaat geleid tot een volledige digitale transcriptie, die digitale afbeeldingen van historische manuscripten automatisch omzet in eenvoudige elektronische tekst. Het MDOC.tS-project heeft als doel een innovatieve en kosteneffectieve oplossing te ontwikkelen om niet alleen gespecialiseerde geleerden te helpen, maar ook archieven, bibliotheken, musea, enz. bij de volledige transcriptie van historische manuscripten. De resulterende technologieën zullen worden geïntegreerd in een toolkit die moet worden geïmplementeerd in een gespecialiseerd platform voor ondersteuning bij transcriptie van manuscripten. Het uiteindelijke product van het project zal gebruikers in staat stellen:- De volledige tekst uit de gedigitaliseerde historische manuscripten automatisch exporteren via een Handgeschreven Transcription Engine HTR met behulp van moderne terugkerende Neural Networks en taalmodellen.- Verbeter de kwaliteit (bijv. ruisverwijdering) en markeer tekstgebieden in gedigitaliseerde historische manuscriptteksten.- Zoek naar trefwoorden rechtstreeks in de gedigitaliseerde documenten van historische collecties met behulp van moderne woordtraceringstechnieken (bv. lawaaiverwijdering) en markeer tekstgebieden in gedigitaliseerde historische manuscriptteksten. (Dutch)
17 December 2021
0 references
Sebbene finora siano stati compiuti diversi sforzi per digitalizzare e accedere al contenuto di queste collezioni, nessuna è stata portata a un risultato soddisfacente in una trascrizione digitale completa, che converte automaticamente le immagini digitali dei manoscritti storici in semplici testi elettronici. L'obiettivo del progetto MDOC.tS è quello di sviluppare una soluzione innovativa ed economica per aiutare non solo gli studiosi specialistici ma anche gli archivi, le biblioteche, i musei, ecc. nella trascrizione completa dei manoscritti storici. Le tecnologie risultanti saranno integrate in un kit di strumenti da implementare in una piattaforma specializzata di assistenza alla trascrizione dei manoscritti. Il prodotto finale del progetto consentirà agli utenti di:- Esportare il testo completo dai manoscritti storici digitalizzati automaticamente attraverso un motore di trascrizione manuale HTR utilizzando moderne reti neurali e modelli linguistici ricorrenti.- Migliorare la qualità (ad es. rimozione del rumore) ed evidenziare le aree di testo nei testi storici digitalizzati.- Cercare le parole chiave direttamente nei documenti digitalizzati delle collezioni storiche utilizzando le moderne tecniche di tracciatura delle parole (ad esempio rimozione del rumore) ed evidenziare le aree di testo nei testi storici digitalizzati. (Italian)
15 January 2022
0 references
Aunque hasta la fecha se han realizado varios esfuerzos para digitalizar y acceder al contenido de estas colecciones, ninguna ha dado lugar a un resultado satisfactorio en una transcripción digital completa, que convierte automáticamente las imágenes digitales de manuscritos históricos en texto electrónico simple. Por lo tanto, un gran número de manuscritos históricos no se pueden estudiar fácilmente y permanecer inexplotados. El objetivo del proyecto MDOC.tS es desarrollar una solución innovadora y rentable para ayudar no solo a académicos especializados, sino también archivos, bibliotecas, museos, etc. en la transcripción completa de manuscritos históricos. Las tecnologías resultantes se integrarán en un conjunto de herramientas que se implementará en una plataforma especializada de asistencia para la transcripción de manuscritos. El producto final del proyecto permitirá a los usuarios:- Exportar el texto completo de los manuscritos históricos digitalizados automáticamente a través de un motor de transcripción manuscrita HTR utilizando redes neurales modernas y modelos lingüísticos recurrentes.- Mejorar la calidad (por ejemplo, eliminación de ruido) y resaltar áreas de texto en textos manuscritos históricos digitalizados.- Buscar palabras clave directamente en los documentos digitalizados de colecciones históricas utilizando técnicas modernas de rastreo de palabras (por ejemplo, eliminación de ruido) y resaltar áreas de texto en textos manuscritos históricos digitalizados. (Spanish)
15 January 2022
0 references
Selv om der til dato er gjort en stor indsats for at digitalisere og få adgang til indholdet af disse samlinger, er ingen af dem blevet ført til et tilfredsstillende resultat i en fuld digital transskription, som automatisk konverterer digitale billeder af historiske manuskripter til simpel elektronisk tekst. Derfor kan et stort antal historiske manuskripter ikke let studeres og forblive uudnyttede. Formålet med MDOC.tS-projektet er at udvikle en innovativ og omkostningseffektiv løsning, der kan hjælpe ikke blot specialiserede forskere, men også arkiver, biblioteker, museer m.v. med fuld transskription af historiske manuskripter. De deraf følgende teknologier vil blive integreret i en værktøjskasse, der skal implementeres på en specialiseret platform for udskriftshjælp. Slutproduktet af projektet vil sætte brugerne i stand til:- Eksporter den fulde tekst fra de digitaliserede historiske manuskripter automatisk gennem en håndskrevet Transcription Engine HTR ved hjælp af moderne tilbagevendende neurale netværk og sprogmodeller.- Forbedre kvalitet (f.eks. støjfjernelse) og fremhæve tekstområder i digitaliserede historiske manuskripttekster.- Søg efter søgeord direkte i de digitaliserede dokumenter i historiske samlinger ved hjælp af moderne ordsporingsteknikker (f.eks. støjfjernelse) og fremhæve tekstområder i digitaliserede historiske manuskripttekster. (Danish)
17 August 2022
0 references
Vaikka näiden kokoelmien sisällön digitoimiseksi ja käyttämiseksi on tähän mennessä tehty useita toimia, mikään niistä ei ole johtanut tyydyttävään tulokseen täydellisessä digitaalisessa transkriptiossa, joka muuntaa automaattisesti historiallisen käsikirjoituksen digitaaliset kuvat yksinkertaiseksi sähköiseksi tekstiksi. Näin ollen suurta määrää historiallisia käsikirjoituksia ei voida helposti tutkia ja hyödyntää. MDOC.tS-hankkeen tavoitteena on kehittää innovatiivinen ja kustannustehokas ratkaisu, joka auttaa erikoistutkijoiden lisäksi arkistoja, kirjastoja, museoita jne. historiallisten käsikirjoitusten täydellisessä transkriptiossa. Tuloksena olevat teknologiat integroidaan välineistöön, joka pannaan täytäntöön erityisellä käsikirjoituksen transkriptioapualustalla. Hankkeen lopputuotteen avulla käyttäjät voivat:- viedä koko tekstin digitoiduista historiallisista käsikirjoituksista automaattisesti käsinkirjoitetun Transcription Engine HTR:n kautta käyttäen nykyaikaisia toistuvia Neural Networks- ja kielimalleja.- Paranna laatua (esim. melunpoisto) ja korosta tekstialueita digitoiduissa historiallisissa käsikirjoituksissa.- Etsi avainsanoja suoraan historiallisten kokoelmien digitoiduista asiakirjoista käyttäen nykyaikaisia sananseurantatekniikoita (esim. melunpoisto) ja korostavat tekstialueita digitoiduissa historiallisissa käsikirjoissa. (Finnish)
17 August 2022
0 references
Għalkemm sal-lum saru diversi sforzi biex jiġi diġitizzat u aċċessat il-kontenut ta’ dawn il-kollezzjonijiet, l-ebda waħda ma wasslet għal riżultat sodisfaċenti fi traskrizzjoni diġitali sħiħa, li awtomatikament tikkonverti immaġnijiet diġitali ta’ manuskritti storiċi f’test elettroniku sempliċi. Konsegwentement, għadd kbir ta’ manuskritti storiċi ma jistgħux jiġu studjati faċilment u jibqgħu ma jiġux sfruttati. L-għan tal-proġett MDOC.tS huwa li jiżviluppa soluzzjoni innovattiva u kost-effettiva biex jgħin mhux biss lill-istudjużi speċjalizzati iżda wkoll lill-arkivji, il-libreriji, il-mużewijiet, eċċ. fit-traskrizzjoni sħiħa ta’ manuskritti storiċi. It-teknoloġiji li jirriżultaw se jiġu integrati f’sett ta’ għodod li għandu jiġi implimentat fi pjattaforma speċjalizzata ta’ assistenza għat-traskrizzjoni tal-manuskritt. Il-prodott finali tal-proġett se jippermetti lill-utenti biex:- Jesportaw it-test sħiħ mill-manuskritti storiċi diġitizzati awtomatikament permezz ta’ HTR tal-Magna tat-Traskrizzjoni bl-idejn bl-użu ta’ Netwerks Neurali u mudelli tal-lingwa rikorrenti moderni.- Ittejjeb il-kwalità (eż. it-tneħħija tal-istorbju) u tenfasizza ż-żoni tat-test f’testi ta’ manuskritt storiku diġitizzat.- Fittex kliem ewlieni direttament fid-dokumenti diġitizzati ta’ kollezzjonijiet storiċi bl-użu ta’ tekniki moderni ta’ traċċar tal-kliem (eż. tneħħija tal-istorbju) u jenfasizzaw iż-żoni tat-test f’testi ta’ manuskritti storiċi diġitizzati. (Maltese)
17 August 2022
0 references
Lai gan līdz šim ir veikti vairāki pasākumi, lai digitalizētu un piekļūtu šo kolekciju saturam, neviena no tām nav devusi apmierinošus rezultātus pilnīgai digitālai transkripcijai, kas automātiski pārveido vēsturisko manuskriptu digitālos attēlus vienkāršā elektroniskā tekstā. Līdz ar to lielu skaitu vēsturisku manuskriptu nevar viegli izpētīt un izmantot. MDOC.tS projekta mērķis ir izstrādāt inovatīvu un rentablu risinājumu, lai palīdzētu ne tikai speciālistiem zinātniekiem, bet arī arhīviem, bibliotēkām, muzejiem u. c., pilnībā pārrakstot vēsturiskos manuskriptus. Iegūtās tehnoloģijas tiks integrētas instrumentu kopumā, ko paredzēts ieviest specializētā manuskriptu transkripcijas palīdzības platformā. Projekta galaprodukts ļaus lietotājiem:- eksportēt pilnu tekstu no digitalizētajiem vēsturiskajiem manuskriptiem automātiski, izmantojot ar roku rakstītu transkripcijas dzinēju HTR, izmantojot modernus atkārtojošos neironu tīklus un valodu modeļus.- Uzlabojiet kvalitāti (piemēram, trokšņu noņemšana) un izcelt teksta zonas digitalizētos vēsturisko manuskriptu tekstos.- Meklēt atslēgvārdus tieši vēsturisko kolekciju digitalizētajos dokumentos, izmantojot modernas vārdu izsekošanas metodes (piemēram, trokšņu noņemšana) un izcelt teksta zonas digitalizētos vēsturiskos manuskriptos. (Latvian)
17 August 2022
0 references
Hoci sa doteraz vyvinulo niekoľko snáh o digitalizáciu obsahu týchto zbierok a prístup k nemu, žiadne z nich neviedlo k uspokojivému výsledku úplného digitálneho prepisu, ktorý automaticky premieňa digitálne obrázky historických rukopisov na jednoduchý elektronický text. V dôsledku toho sa veľký počet historických rukopisov nedá ľahko študovať a zostáva nevyužitý. Cieľom projektu MDOC.tS je vyvinúť inovatívne a nákladovo efektívne riešenie, ktoré pomôže nielen odborníkom, ale aj archívom, knižniciam, múzeám atď. pri úplnom prepise historických rukopisov. Výsledné technológie sa začlenia do súboru nástrojov, ktorý sa zavedie do špecializovanej platformy na pomoc pri prepise rukopisu. Konečný produkt projektu umožní používateľom:- exportovať celý text z digitalizovaných historických rukopisov automaticky cez rukou písaný popis motora HTR pomocou moderných opakujúcich sa neurálnych sietí a jazykových modelov.- Zlepšiť kvalitu (napr. odstránenie hluku) a zvýrazniť textové oblasti v digitalizovaných historických textoch rukopisov.- Hľadať kľúčové slová priamo v digitalizovaných dokumentoch historických zbierok pomocou moderných techník sledovania slov (napr. odstránenie hluku) a zvýrazniť textové oblasti v digitalizovaných historických rukopisných textoch. (Slovak)
17 August 2022
0 references
Cé go ndearnadh roinnt iarrachtaí go dtí seo chun ábhar na mbailiúchán seo a dhigitiú agus chun rochtain a fháil orthu, níor éirigh le tras-scríobh digiteach iomlán a bheith mar thoradh ar aon cheann acu, rud a thiontaíonn íomhánna digiteacha de lámhscríbhinní stairiúla go téacs leictreonach simplí. Dá bhrí sin, ní féidir staidéar a dhéanamh go héasca ar líon mór lámhscríbhinní stairiúla agus ní féidir iad a shaothrú. Is é is aidhm don tionscadal MDOC.tS réiteach nuálach agus cost-éifeachtach a fhorbairt chun cabhrú ní hamháin le sainscoláirí ach le cartlanna, leabharlanna, músaeim, etc., agus lámhscríbhinní stairiúla á dtrasscríobh ina n-iomláine. Déanfar na teicneolaíochtaí a thiocfaidh as sin a chomhtháthú i sraith straitéisí a chuirfear chun feidhme in ardán speisialaithe um chúnamh tras-scríofa lámhscríbhinní. Cuirfidh toradh deiridh an tionscadail ar chumas úsáideoirí:- Easpórtáil an téacs iomlán ó na lámhscríbhinní stairiúla digitithe go huathoibríoch trí HTR Inneall Tras-scríofa Lámhscríofa ag baint úsáide as Líonraí Neural agus samhlacha teanga athfhillteacha nua-aimseartha.- Cáilíocht (e.g. baint torainn) a fheabhsú agus réimsí téacs a aibhsiú i dtéacsanna lámhscríbhinne stairiúla digitithe.- Cuardaigh eochairfhocail go díreach i ndoiciméid dhigitithe na mbailiúchán stairiúil ag baint úsáide as teicnící nua-aimseartha rianaithe focal (e.g. baint torainn) agus aird a tharraingt ar réimsí téacs i dtéacsanna lámhscríbhinne stairiúla digitithe. (Irish)
17 August 2022
0 references
Přestože bylo dosud vyvinuto několik snah o digitalizaci a přístup k obsahu těchto sbírek, žádné z nich nebylo vedeno k uspokojivému výsledku v úplném digitálním přepisu, který automaticky převádí digitální obrazy historických rukopisů na jednoduchý elektronický text. V důsledku toho nelze velké množství historických rukopisů snadno studovat a zůstat nevyužívány. Cílem projektu MDOC.tS je vyvinout inovativní a nákladově efektivní řešení, které pomůže nejen specializovaným učencům, ale i archivům, knihovnám, muzeím atd. v úplném přepisu historických rukopisů. Výsledné technologie budou začleněny do souboru nástrojů, který bude realizován ve specializované platformě pro pomoc při přepisu rukopisu. Finální produkt projektu umožní uživatelům:- Exportovat celý text z digitalizovaných historických rukopisů automaticky prostřednictvím ručně psaného přepisového motoru HTR pomocí moderních opakujících se neuronových sítí a jazykových modelů.- Zlepšit kvalitu (např. odstranění šumu) a zvýraznit textové oblasti v digitalizovaných historických rukopisných textech.- Vyhledávání klíčových slov přímo v digitalizovaných dokumentech historických sbírek pomocí moderních technik sledování slov (např. odstraňování hluku) a zvýraznění textových oblastí v digitalizovaných historických rukopisných textech. (Czech)
17 August 2022
0 references
Embora tenham sido envidados vários esforços até à data para digitalizar e aceder ao conteúdo destas coleções, nenhum deles conduziu a um resultado satisfatório numa transcrição digital completa, que converte automaticamente imagens digitais de manuscritos históricos em texto eletrónico simples. Consequentemente, um grande número de manuscritos históricos não podem ser facilmente estudados e permanecem inexplorados. O objetivo do projeto MDOC.tS é desenvolver uma solução inovadora e económica para ajudar não só académicos especializados, mas também arquivos, bibliotecas, museus, etc., na transcrição completa de manuscritos históricos. As tecnologias resultantes serão integradas num conjunto de ferramentas a implementar numa plataforma especializada de assistência à transcrição de manuscritos. O produto final do projeto permitirá aos utilizadores:- Exportar automaticamente o texto integral dos manuscritos históricos digitalizados através de um motor de transcrição manuscrita HTR, utilizando redes neurais e modelos linguísticos modernos e recorrentes.- Melhorar a qualidade (por exemplo, remoção de ruído) e destacar áreas de texto em textos manuscritos históricos digitalizados.- Procurar palavras-chave diretamente nos documentos digitalizados de coleções históricas utilizando técnicas modernas de rastreio de palavras (por exemplo, remoção de ruído) e destacar áreas de texto em textos manuscritos históricos digitalizados. (Portuguese)
17 August 2022
0 references
Kuigi nende kogude sisu digiteerimiseks ja sellele juurdepääsuks on seni tehtud mitmeid jõupingutusi, ei ole ükski neist andnud rahuldavat tulemust täieliku digitaalse transkriptsioonini, mis muudab ajalooliste käsikirjade digitaalsed kujutised automaatselt lihtsaks elektrooniliseks tekstiks. Seetõttu ei saa paljusid ajaloolisi käsikirju hõlpsasti uurida ja neid ei kasutata. Projekti MDOC.tS eesmärk on töötada välja uuenduslik ja kulutõhus lahendus, mis aitab lisaks spetsialistidele ka arhiivid, raamatukogud, muuseumid jne ajalooliste käsikirjade täielikus transkriptsioonis. Sellest tulenevad tehnoloogiad integreeritakse töövahendisse, mida rakendatakse spetsiaalse käsikirja ümberkirjutamise abiplatvormi kaudu. Projekti lõpptoode võimaldab kasutajatel:- Eksportida täistekst digiteeritud ajalookäsikirjadest automaatselt käsitsi kirjutatud transkriptsioonimootori HTR kaudu, kasutades kaasaegseid korduvaid neurovõrke ja keelemudeleid.- Parandada kvaliteeti (nt müra eemaldamine) ja esile tõsta tekstivaldkondi digiteeritud ajalooliste käsikirjade tekstides.- Otsi märksõnu otse ajalooliste kogude digiteeritud dokumentides, kasutades kaasaegseid sõnajälgimise tehnikaid (nt müra eemaldamine) ja tõsta esile tekstivaldkondi digiteeritud ajalooliste käsikirjade tekstides. (Estonian)
17 August 2022
0 references
Bár eddig számos erőfeszítést tettek e gyűjtemények tartalmának digitalizálása és hozzáférhetősége érdekében, egyik sem vezetett kielégítő eredményhez a teljes digitális átíráshoz, amely automatikusan egyszerű elektronikus szöveggé alakítja át a történelmi kéziratok digitális képeit. Következésképpen számos történelmi kéziratot nem lehet könnyen tanulmányozni és kihasználatlanul hagyni. Az MDOC.tS projekt célja, hogy innovatív és költséghatékony megoldást dolgozzon ki, amely nemcsak szakembereknek, hanem levéltáraknak, könyvtáraknak, múzeumoknak stb. is segíti a történelmi kéziratok teljes átírását. Az így létrejövő technológiákat beépítik egy olyan eszköztárba, amelyet egy speciális kézirat-átírási segítségnyújtási platformon kell végrehajtani. A projekt végterméke lehetővé teszi a felhasználók számára, hogy:- a teljes szöveget a digitalizált történelmi kéziratokból automatikusan exportálják egy Kézírásos Átírási Engine HTR segítségével, modern ismétlődő neurális hálózatok és nyelvi modellek felhasználásával.- Javítsa a minőséget (pl. zajeltávolítás) és kiemelje a szövegterületeket digitalizált történelmi kéziratokban.- Kulcsszavak keresése a történelmi gyűjtemények digitalizált dokumentumaiban, modern szókövetési technikák (pl. zajeltávolítás) alkalmazásával, és a szövegterületek kiemelése a digitalizált történelmi kéziratszövegekben. (Hungarian)
17 August 2022
0 references
Въпреки че до момента са положени няколко усилия за цифровизация и достъп до съдържанието на тези колекции, нито една от тях не е довела до задоволителен резултат до пълна цифрова транскрипция, която автоматично преобразува цифровите изображения на исторически ръкописи в прост електронен текст. Следователно голям брой исторически ръкописи не могат лесно да бъдат проучени и да останат неизползвани. Целта на проекта MDOC.tS е да се разработи иновативно и икономически ефективно решение, което да помогне не само на специализирани учени, но и на архиви, библиотеки, музеи и др. в пълната транскрипция на исторически ръкописи. Получените в резултат на това технологии ще бъдат интегрирани в инструментариум, който ще бъде приложен в специализирана платформа за подпомагане на транскрипцията на ръкописите. Крайният продукт от проекта ще даде възможност на потребителите да:- Експортиране на пълния текст от цифровизираните исторически ръкописи автоматично чрез ръкописен транскрипционен двигател HTR с помощта на съвременни повтарящи се невронни мрежи и езикови модели.- Подобряване на качеството (напр. премахване на шума) и подчертаване на текстовите области в цифровизираните текстове на исторически ръкописи.- Търсене на ключови думи директно в цифровизираните документи на историческите колекции, като се използват съвременни техники за проследяване на думи (напр. премахване на шума) и подчертаване на текстовите области в цифровизираните исторически ръкописни текстове. (Bulgarian)
17 August 2022
0 references
Nors iki šiol buvo dedamos kelios pastangos skaitmeninti šių kolekcijų turinį ir gauti prieigą prie jo, nė vienas iš jų nebuvo pasiektas patenkinamas rezultatas – visa skaitmeninė transkripcija, kuri automatiškai paverčia istorinių rankraščių skaitmeninius vaizdus į paprastą elektroninį tekstą. Todėl daug istorinių rankraščių negali būti lengvai išnagrinėtos ir neišnaudojamos. MDOC.tS projekto tikslas – sukurti novatorišką ir ekonomišką sprendimą, kuris padėtų ne tik specialistams, bet ir archyvams, bibliotekoms, muziejams ir kt. pilnoje istorinių rankraščių transkripcijoje. Sukurtos technologijos bus integruotos į priemonių rinkinį, kuris bus įgyvendintas specializuotoje rankraščių transkripcijos pagalbos platformoje. Galutinis projekto produktas leis vartotojams:- Eksportuoti visą tekstą iš suskaitmenintų istorinių rankraščių automatiškai per ranka rašytą transkripcijos variklį HTR, naudojant šiuolaikinius pasikartojančius Neural Networks ir kalbos modelius.- Gerinti kokybę (pvz., triukšmo šalinimą) ir pabrėžti teksto sritis suskaitmenintuose istoriniuose rankraščių tekstuose.- Raktažodžių paieška tiesiogiai suskaitmenintuose istorinių kolekcijų dokumentuose, naudojant šiuolaikines žodžių sekimo technologijas (pvz., triukšmo šalinimą) ir paryškinti teksto sritis suskaitmenintuose istoriniuose rankraščių tekstuose. (Lithuanian)
17 August 2022
0 references
Iako je dosad uloženo nekoliko napora u digitalizaciju i pristup sadržaju tih zbirki, nijedan od njih nije doveo do zadovoljavajućeg rezultata u potpunoj digitalnoj transkripciji kojom se digitalne slike povijesnih rukopisa automatski pretvaraju u jednostavan elektronički tekst. Stoga se velik broj povijesnih rukopisa ne može lako proučiti i ostati neiskorišten. Cilj projekta MDOC.tS je razviti inovativno i isplativo rješenje koje će pomoći ne samo specijaliziranim znanstvenicima, već i arhivima, knjižnicama, muzejima itd. u punom prijepisu povijesnih rukopisa. Tehnologije koje iz toga proizlaze integrirat će se u skup alata koji će se uvesti u specijaliziranu platformu za pomoć u prijepisu rukopisa. Konačni proizvod projekta omogućit će korisnicima da:- Izvoz cijelog teksta iz digitaliziranih povijesnih rukopisa automatski putem ručno napisanog Transcription Engine HTR koristeći moderne rekurentne neuronske mreže i jezične modele.- Poboljšati kvalitetu (npr. uklanjanje buke) i istaknuti tekstualna područja u digitaliziranim povijesnim rukopisima.- Tražiti ključne riječi izravno u digitaliziranim dokumentima povijesnih zbirki koristeći moderne tehnike praćenja riječi (npr. uklanjanje buke) i istaknuti tekstualna područja u digitaliziranim povijesnim rukopisnim tekstovima. (Croatian)
17 August 2022
0 references
Även om flera ansträngningar hittills har gjorts för att digitalisera och få tillgång till innehållet i dessa samlingar, har inget lett till ett tillfredsställande resultat i en fullständig digital transkription, som automatiskt omvandlar digitala bilder av historiska manuskript till enkel elektronisk text. Följaktligen kan ett stort antal historiska manuskript inte lätt studeras och förbli outnyttjade. Syftet med MDOC.tS-projektet är att utveckla en innovativ och kostnadseffektiv lösning för att hjälpa inte bara specialiserade forskare utan även arkiv, bibliotek, museer m.m. i den fullständiga transkriberingen av historiska manuskript. Den teknik som blir resultatet kommer att integreras i en verktygslåda som ska implementeras i en specialiserad hjälpplattform för transkription. Slutprodukten av projektet kommer att göra det möjligt för användare att:- Exportera hela texten från de digitaliserade historiska manuskripten automatiskt genom en handskriven transkriptionsmotor HTR med hjälp av moderna återkommande neurala nätverk och språkmodeller.- Förbättra kvaliteten (t.ex. bullerborttagning) och markera textområden i digitaliserade historiska manuskripttexter.- Sök efter nyckelord direkt i de digitaliserade dokumenten i historiska samlingar med hjälp av moderna ordspårningstekniker (t.ex. bullerborttagning) och markera textområden i digitaliserade historiska manuskripttexter. (Swedish)
17 August 2022
0 references
Deși până în prezent s-au depus mai multe eforturi pentru digitalizarea și accesarea conținutului acestor colecții, niciunul nu a fost condus la un rezultat satisfăcător într-o transcriere digitală completă, care transformă automat imaginile digitale ale manuscriselor istorice în text electronic simplu. Prin urmare, un număr mare de manuscrise istorice nu pot fi studiate cu ușurință și rămân neexploatate. Scopul proiectului MDOC.tS este de a dezvolta o soluție inovatoare și rentabilă pentru a ajuta nu numai cercetătorii specialiști, ci și arhivele, bibliotecile, muzeele etc. în transcrierea completă a manuscriselor istorice. Tehnologiile rezultate vor fi integrate într-un set de instrumente care urmează să fie implementat într-o platformă specializată de asistență pentru transcrierea manuscriselor. Produsul final al proiectului va permite utilizatorilor să:- Exportați textul integral din manuscrisele istorice digitalizate în mod automat printr-un motor de transcriere scris de mână HTR folosind rețele moderne recurente și modele lingvistice.- Îmbunătățirea calității (de exemplu, eliminarea zgomotului) și evidențiați zonele de text în texte manuscrise istorice digitalizate.- Căutați cuvinte-cheie direct în documentele digitalizate ale colecțiilor istorice utilizând tehnici moderne de urmărire a cuvintelor (de exemplu, eliminarea zgomotului) și evidențiați zonele de text în texte manuscrise istorice digitalizate. (Romanian)
17 August 2022
0 references
Čeprav je bilo do zdaj vloženih več prizadevanj za digitalizacijo in dostop do vsebine teh zbirk, nobena ni prinesla zadovoljivega rezultata v popolnem digitalnem prepisu, ki samodejno pretvarja digitalne podobe zgodovinskih rokopisov v preprosto elektronsko besedilo. Zato velikega števila zgodovinskih rokopisov ni mogoče enostavno preučevati in ostati neizkoriščeni. Cilj projekta MDOC.tS je razviti inovativno in stroškovno učinkovito rešitev, ki bo pomagala ne le specializiranim znanstvenikom, ampak tudi arhivom, knjižnicam, muzejem itd. v celotnem prepisu zgodovinskih rokopisov. Tehnologije, ki izhajajo iz tega, bodo vključene v zbirko orodij, ki se bo izvajala v specializirani platformi za pomoč pri prepisu rokopisa. Končni produkt projekta bo uporabnikom omogočil, da:- Izvoz celotnega besedila iz digitaliziranih zgodovinskih rokopisov samodejno prek ročno napisanega transkripcijskega motorja HTR z uporabo sodobnih ponavljajočih se nevronskih omrežij in jezikovnih modelov.- Izboljšajte kakovost (npr. odstranjevanje hrupa) in poudarite besedilna področja v digitaliziranih zgodovinskih rokopisnih besedilih.- Iskanje ključnih besed neposredno v digitaliziranih dokumentih zgodovinskih zbirk z uporabo sodobnih tehnik sledenja besed (npr. odstranjevanje hrupa) in poudarjanje besedilnih področij v digitaliziranih zgodovinskih rokopisnih besedilih. (Slovenian)
17 August 2022
0 references
Mimo że do tej pory podjęto szereg wysiłków na rzecz digitalizacji i dostępu do treści tych zbiorów, żaden z nich nie doprowadził do zadowalających rezultatów w postaci pełnej cyfrowej transkrypcji, która automatycznie przekształca cyfrowe obrazy historycznych rękopisów w prosty tekst elektroniczny. W związku z tym duża liczba historycznych rękopisów nie może być łatwo zbadana i pozostaje niewykorzystana. Celem projektu MDOC.tS jest opracowanie innowacyjnego i opłacalnego rozwiązania, które pomoże nie tylko specjalistom, ale także archiwom, bibliotekom, muzeom itp. w pełnej transkrypcji historycznych rękopisów. Powstałe w ten sposób technologie zostaną włączone do zestawu narzędzi, który zostanie wdrożony w ramach specjalistycznej platformy wspomagającej transkrypcję rękopisu. Końcowy produkt projektu umożliwi użytkownikom:- Eksportowanie pełnego tekstu z zdigitalizowanych historycznych rękopisów automatycznie poprzez Ręczną Transkrypcję Silnika HTR za pomocą nowoczesnych sieci neuronowych i modeli językowych.- Popraw jakość (np. usuwanie szumów) i wyróżnij obszary tekstowe w zdigitalizowanych historycznych tekstach rękopisu.- Szukaj słów kluczowych bezpośrednio w zdigitalizowanych dokumentach zbiorów historycznych przy użyciu nowoczesnych technik śledzenia słów (np. usuwanie szumu) i wyróżnij obszary tekstowe w zdigitalizowanych historycznych tekstach manuskryptowych. (Polish)
17 August 2022
0 references
Identifiers
5.030.443
0 references