Historical Manuscript transcription platform (Q3128152)
Jump to navigation
Jump to search
Project Q3128152 in Greece
Language | Label | Description | Also known as |
---|---|---|---|
English | Historical Manuscript transcription platform |
Project Q3128152 in Greece |
Statements
657,540.0 Euro
0 references
28 June 2018
0 references
27 December 2021
0 references
ΕΙΔΙΚΟΣ ΛΟΓΑΡΙΑΣΜΟΣ ΚΟΝΔΥΛΙΩΝ ΕΡΕΥΝΑΣ ΔΗΜΟΚΡΙΤΕΙΟΥ ΠΑΝΕΠΙΣΤΗΜΙΟΥ ΘΡΑΚΗΣ
0 references
Παρόλο, που μέχρι σήμερα έχουν γίνει αρκετές προσπάθειες ψηφιοποίησης και ηλεκτρονικής πρόσβασης στο περιεχόμενο των συλλογών αυτών, καμία δεν έχει οδηγηθεί με ικανοποιητικό αποτέλεσμα σε πλήρη ψηφιακή μεταγραφή (transcription), το οποίο μετατρέπει αυτόματα ψηφιακές εικόνες ιστορικών χειρόγραφων σε απλό ηλεκτρονικό κείμενο (text). Κατά συνέπεια μεγάλος αριθμός ιστορικών χειρόγραφων κειμένων να μη μπορεί να μελετηθεί εύκολα και να παραμένει ανεκμετάλλευτος.Ο στόχος του έργου μDOC.tS είναι είναι να αναπτύξει μία καινοτόμο και οικονομικά αποδοτική λύση για να βοηθήσει όχι μόνο ειδικούς μελετητές αλλά και αρχεία, βιβλιοθήκες, μουσεία, κ.τ.λ. στην πλήρη μεταγραφή των ιστορικών χειρόγραφων. Οι τεχνολογίες που θα προκύψουν θα ενσωματωθούν σε ένα σύνολο εργαλείων τα οποία θα υλοποιηθούν σε μια εξειδικευμένη πλατφόρμα υποβοήθησης μεταγραφής χειρογράφων. Το τελικό προϊόν του έργου θα δώσει στους χρήστες τη δυνατότητα να:- Εξάγουν αυτόματα το πλήρες κείμενο από τα ψηφιοποιημένα ιστορικά χειρόγραφα μέσω μιάς μηχανής μεταγραφής (Handwritten Transcription Engine HTR) χρησιμοποιώντας σύγχρονα επαναλαμβανόμενα νευρωνικά δίκτυα (Recurrent Neural Networks) και γλωσσικά μοντέλα.- Βελτιώσουν την ποιότητα (π.χ. αφαίρεση θορύβου) και να αναδείξουν τις περιοχές κειμένου στα ψηφιοποιημένα ιστορικά χειρόγραφα κείμενα.- Αναζητήσουν λέξεις-κλειδιά απευθείας στα ψηφιοποιημένα έγγραφα των ιστορικών συλλογών χρησιμοποιώντας σύγχρονες τεχνικές εντοπισμού λέξεων (Keyword Spotting KWS).- Διαχειρισθούν με φιλικό προς τον χρήστη, έξυπνο και αποδοτικό τρόπο τα ψηφιοποιημένα χειρόγραφα έγγραφα παρέχοντας περιβάλλον αυτόματης επεξεργασίας, μεταγραφής και διαχείρισης των δεδομένων. (Greek)
0 references
Although several efforts have been made to date to digitise and access the content of these collections, none has been led to a satisfactory result in a full digital transcription, which automatically converts digital images of historical manuscripts into simple electronic text. Consequently, a large number of historical manuscripts cannot be easily studied and remain unexploited. The aim of the MDOC.tS project is to develop an innovative and cost-effective solution to help not only specialist scholars but also archives, libraries, museums, etc. in the full transcription of historical manuscripts. The resulting technologies will be integrated into a toolkit to be implemented in a specialised manuscript transcription assistance platform. The final product of the project will enable users to:- Export the full text from the digitised historical manuscripts automatically through a Handwritten Transcription Engine HTR using modern recurrent Neural Networks and language models.- Improve quality (e.g. noise removal) and highlight text areas in digitised historical manuscript texts.- Search for keywords directly in the digitised documents of historical collections using modern word tracing techniques (e.g. noise removal) and highlight text areas in digitised historical manuscript texts. (English)
30 September 2021
0 references
Identifiers
5.030.443
0 references