Historical Manuscript transcription platform (Q3128152)

From EU Knowledge Graph
Revision as of 09:04, 17 December 2021 by DG Regio (talk | contribs) (‎Changed label, description and/or aliases in nl, and other parts: Adding Dutch translations)
Jump to navigation Jump to search
Project Q3128152 in Greece
Language Label Description Also known as
English
Historical Manuscript transcription platform
Project Q3128152 in Greece

    Statements

    0 references
    657,540.0 Euro
    0 references
    28 June 2018
    0 references
    27 December 2021
    0 references
    ΕΙΔΙΚΟΣ ΛΟΓΑΡΙΑΣΜΟΣ ΚΟΝΔΥΛΙΩΝ ΕΡΕΥΝΑΣ ΔΗΜΟΚΡΙΤΕΙΟΥ ΠΑΝΕΠΙΣΤΗΜΙΟΥ ΘΡΑΚΗΣ
    0 references
    0 references

    38°41'1.00"N, 21°24'37.51"E
    0 references

    41°10'1.60"N, 25°1'29.57"E
    0 references
    Παρόλο, που μέχρι σήμερα έχουν γίνει αρκετές προσπάθειες ψηφιοποίησης και ηλεκτρονικής πρόσβασης στο περιεχόμενο των συλλογών αυτών, καμία δεν έχει οδηγηθεί με ικανοποιητικό αποτέλεσμα σε πλήρη ψηφιακή μεταγραφή (transcription), το οποίο μετατρέπει αυτόματα ψηφιακές εικόνες ιστορικών χειρόγραφων σε απλό ηλεκτρονικό κείμενο (text). Κατά συνέπεια μεγάλος αριθμός ιστορικών χειρόγραφων κειμένων να μη μπορεί να μελετηθεί εύκολα και να παραμένει ανεκμετάλλευτος.Ο στόχος του έργου μDOC.tS είναι είναι να αναπτύξει μία καινοτόμο και οικονομικά αποδοτική λύση για να βοηθήσει όχι μόνο ειδικούς μελετητές αλλά και αρχεία, βιβλιοθήκες, μουσεία, κ.τ.λ. στην πλήρη μεταγραφή των ιστορικών χειρόγραφων. Οι τεχνολογίες που θα προκύψουν θα ενσωματωθούν σε ένα σύνολο εργαλείων τα οποία θα υλοποιηθούν σε μια εξειδικευμένη πλατφόρμα υποβοήθησης μεταγραφής χειρογράφων. Το τελικό προϊόν του έργου θα δώσει στους χρήστες τη δυνατότητα να:- Εξάγουν αυτόματα το πλήρες κείμενο από τα ψηφιοποιημένα ιστορικά χειρόγραφα μέσω μιάς μηχανής μεταγραφής (Handwritten Transcription Engine – HTR) χρησιμοποιώντας σύγχρονα επαναλαμβανόμενα νευρωνικά δίκτυα (Recurrent Neural Networks) και γλωσσικά μοντέλα.- Βελτιώσουν την ποιότητα (π.χ. αφαίρεση θορύβου) και να αναδείξουν τις περιοχές κειμένου στα ψηφιοποιημένα ιστορικά χειρόγραφα κείμενα.- Αναζητήσουν λέξεις-κλειδιά απευθείας στα ψηφιοποιημένα έγγραφα των ιστορικών συλλογών χρησιμοποιώντας σύγχρονες τεχνικές εντοπισμού λέξεων (Keyword Spotting – KWS).- Διαχειρισθούν με φιλικό προς τον χρήστη, έξυπνο και αποδοτικό τρόπο τα ψηφιοποιημένα χειρόγραφα έγγραφα παρέχοντας περιβάλλον αυτόματης επεξεργασίας, μεταγραφής και διαχείρισης των δεδομένων. (Greek)
    0 references
    Although several efforts have been made to date to digitise and access the content of these collections, none has been led to a satisfactory result in a full digital transcription, which automatically converts digital images of historical manuscripts into simple electronic text. Consequently, a large number of historical manuscripts cannot be easily studied and remain unexploited. The aim of the MDOC.tS project is to develop an innovative and cost-effective solution to help not only specialist scholars but also archives, libraries, museums, etc. in the full transcription of historical manuscripts. The resulting technologies will be integrated into a toolkit to be implemented in a specialised manuscript transcription assistance platform. The final product of the project will enable users to:- Export the full text from the digitised historical manuscripts automatically through a Handwritten Transcription Engine HTR using modern recurrent Neural Networks and language models.- Improve quality (e.g. noise removal) and highlight text areas in digitised historical manuscript texts.- Search for keywords directly in the digitised documents of historical collections using modern word tracing techniques (e.g. noise removal) and highlight text areas in digitised historical manuscript texts. (English)
    30 September 2021
    0 references
    Bien que plusieurs efforts aient été faits à ce jour pour numériser et accéder au contenu de ces collections, aucun n’a abouti à un résultat satisfaisant en une transcription numérique complète, qui convertit automatiquement les images numériques de manuscrits historiques en texte électronique simple. Par conséquent, un grand nombre de manuscrits historiques ne peuvent pas être facilement étudiés et restent inexploités. Le projet MDOC.tS vise à développer une solution innovante et rentable pour aider non seulement les chercheurs spécialisés, mais aussi les archives, bibliothèques, musées, etc. dans la transcription complète des manuscrits historiques. Les technologies qui en résultent seront intégrées dans une boîte à outils qui sera mise en œuvre dans une plateforme spécialisée d’assistance à la transcription manuscrite. Le produit final du projet permettra aux utilisateurs:- d’exporter automatiquement le texte intégral des manuscrits historiques numérisés au moyen d’un moteur de transcription manuscrite HTR à l’aide de réseaux neuronaux récurrents modernes et de modèles linguistiques.- Améliorer la qualité (par exemple, élimination du bruit) et mettre en évidence les zones de texte dans les textes manuscrits historiques numérisés.- Rechercher des mots-clés directement dans les documents numérisés des collections historiques à l’aide de techniques modernes de traçage des mots (par exemple, élimination du bruit) et mettre en évidence les zones de texte dans les textes manuscrits historiques numérisés. (French)
    30 November 2021
    0 references
    Obwohl bisher mehrere Anstrengungen unternommen wurden, um den Inhalt dieser Sammlungen zu digitalisieren und zuzugreifen, wurde keines zu einem zufrieden stellenden Ergebnis in einer vollständigen digitalen Transkription geführt, die digitale Bilder historischer Handschriften automatisch in einfachen elektronischen Text umwandelt. Das Ziel des MDOC.tS-Projekts ist es, eine innovative und kostengünstige Lösung zu entwickeln, um nicht nur Fachwissenschaftlern, sondern auch Archiven, Bibliotheken, Museen usw. in der vollständigen Transkription historischer Handschriften zu helfen. Die daraus resultierenden Technologien werden in ein Toolkit integriert, das in einer spezialisierten Handschriftshilfeplattform implementiert werden soll. Das Endprodukt des Projekts wird es Nutzern ermöglichen,:- den Volltext aus den digitalisierten historischen Manuskripten automatisch über eine handgeschriebene Transkriptionsmaschine HTR mit modernen wiederkehrenden Neural Networks und Sprachmodellen zu exportieren.- Qualität (z. B. Lärmentfernung) zu verbessern und Textbereiche digitalisierter historischer Manuskripttexte zu markieren.- Suchen Sie nach Schlüsselwörtern direkt in digitalisierten Dokumenten historischer Sammlungen mit modernen Wortverfolgungstechniken (z. B. Lärmentfernung) und markieren Textbereiche in digitalisierten historischen Handschriftentexten. (German)
    7 December 2021
    0 references
    Hoewel er tot nu toe verscheidene inspanningen zijn geleverd om de inhoud van deze collecties te digitaliseren en toegankelijk te maken, is geen enkele tot een bevredigend resultaat geleid tot een volledige digitale transcriptie, die digitale afbeeldingen van historische manuscripten automatisch omzet in eenvoudige elektronische tekst. Het MDOC.tS-project heeft als doel een innovatieve en kosteneffectieve oplossing te ontwikkelen om niet alleen gespecialiseerde geleerden te helpen, maar ook archieven, bibliotheken, musea, enz. bij de volledige transcriptie van historische manuscripten. De resulterende technologieën zullen worden geïntegreerd in een toolkit die moet worden geïmplementeerd in een gespecialiseerd platform voor ondersteuning bij transcriptie van manuscripten. Het uiteindelijke product van het project zal gebruikers in staat stellen:- De volledige tekst uit de gedigitaliseerde historische manuscripten automatisch exporteren via een Handgeschreven Transcription Engine HTR met behulp van moderne terugkerende Neural Networks en taalmodellen.- Verbeter de kwaliteit (bijv. ruisverwijdering) en markeer tekstgebieden in gedigitaliseerde historische manuscriptteksten.- Zoek naar trefwoorden rechtstreeks in de gedigitaliseerde documenten van historische collecties met behulp van moderne woordtraceringstechnieken (bv. lawaaiverwijdering) en markeer tekstgebieden in gedigitaliseerde historische manuscriptteksten. (Dutch)
    17 December 2021
    0 references

    Identifiers

    5.030.443
    0 references