Historical Manuscript transcription platform (Q3128152): Difference between revisions
Jump to navigation
Jump to search
(Changed label, description and/or aliases in fr: translated_label) |
(Created claim: summary (P836): Bien que plusieurs efforts aient été faits à ce jour pour numériser et accéder au contenu de ces collections, aucun n’a abouti à un résultat satisfaisant en une transcription numérique complète, qui convertit automatiquement les images numériques de manuscrits historiques en texte électronique simple. Par conséquent, un grand nombre de manuscrits historiques ne peuvent pas être facilement étudiés et restent inexploités. Le projet MDOC.tS vise à...) |
||||||||||||||
Property / summary | |||||||||||||||
Bien que plusieurs efforts aient été faits à ce jour pour numériser et accéder au contenu de ces collections, aucun n’a abouti à un résultat satisfaisant en une transcription numérique complète, qui convertit automatiquement les images numériques de manuscrits historiques en texte électronique simple. Par conséquent, un grand nombre de manuscrits historiques ne peuvent pas être facilement étudiés et restent inexploités. Le projet MDOC.tS vise à développer une solution innovante et rentable pour aider non seulement les chercheurs spécialisés, mais aussi les archives, bibliothèques, musées, etc. dans la transcription complète des manuscrits historiques. Les technologies qui en résultent seront intégrées dans une boîte à outils qui sera mise en œuvre dans une plateforme spécialisée d’assistance à la transcription manuscrite. Le produit final du projet permettra aux utilisateurs:- d’exporter automatiquement le texte intégral des manuscrits historiques numérisés au moyen d’un moteur de transcription manuscrite HTR à l’aide de réseaux neuronaux récurrents modernes et de modèles linguistiques.- Améliorer la qualité (par exemple, élimination du bruit) et mettre en évidence les zones de texte dans les textes manuscrits historiques numérisés.- Rechercher des mots-clés directement dans les documents numérisés des collections historiques à l’aide de techniques modernes de traçage des mots (par exemple, élimination du bruit) et mettre en évidence les zones de texte dans les textes manuscrits historiques numérisés. (French) | |||||||||||||||
Property / summary: Bien que plusieurs efforts aient été faits à ce jour pour numériser et accéder au contenu de ces collections, aucun n’a abouti à un résultat satisfaisant en une transcription numérique complète, qui convertit automatiquement les images numériques de manuscrits historiques en texte électronique simple. Par conséquent, un grand nombre de manuscrits historiques ne peuvent pas être facilement étudiés et restent inexploités. Le projet MDOC.tS vise à développer une solution innovante et rentable pour aider non seulement les chercheurs spécialisés, mais aussi les archives, bibliothèques, musées, etc. dans la transcription complète des manuscrits historiques. Les technologies qui en résultent seront intégrées dans une boîte à outils qui sera mise en œuvre dans une plateforme spécialisée d’assistance à la transcription manuscrite. Le produit final du projet permettra aux utilisateurs:- d’exporter automatiquement le texte intégral des manuscrits historiques numérisés au moyen d’un moteur de transcription manuscrite HTR à l’aide de réseaux neuronaux récurrents modernes et de modèles linguistiques.- Améliorer la qualité (par exemple, élimination du bruit) et mettre en évidence les zones de texte dans les textes manuscrits historiques numérisés.- Rechercher des mots-clés directement dans les documents numérisés des collections historiques à l’aide de techniques modernes de traçage des mots (par exemple, élimination du bruit) et mettre en évidence les zones de texte dans les textes manuscrits historiques numérisés. (French) / rank | |||||||||||||||
Normal rank | |||||||||||||||
Property / summary: Bien que plusieurs efforts aient été faits à ce jour pour numériser et accéder au contenu de ces collections, aucun n’a abouti à un résultat satisfaisant en une transcription numérique complète, qui convertit automatiquement les images numériques de manuscrits historiques en texte électronique simple. Par conséquent, un grand nombre de manuscrits historiques ne peuvent pas être facilement étudiés et restent inexploités. Le projet MDOC.tS vise à développer une solution innovante et rentable pour aider non seulement les chercheurs spécialisés, mais aussi les archives, bibliothèques, musées, etc. dans la transcription complète des manuscrits historiques. Les technologies qui en résultent seront intégrées dans une boîte à outils qui sera mise en œuvre dans une plateforme spécialisée d’assistance à la transcription manuscrite. Le produit final du projet permettra aux utilisateurs:- d’exporter automatiquement le texte intégral des manuscrits historiques numérisés au moyen d’un moteur de transcription manuscrite HTR à l’aide de réseaux neuronaux récurrents modernes et de modèles linguistiques.- Améliorer la qualité (par exemple, élimination du bruit) et mettre en évidence les zones de texte dans les textes manuscrits historiques numérisés.- Rechercher des mots-clés directement dans les documents numérisés des collections historiques à l’aide de techniques modernes de traçage des mots (par exemple, élimination du bruit) et mettre en évidence les zones de texte dans les textes manuscrits historiques numérisés. (French) / qualifier | |||||||||||||||
point in time: 30 November 2021
|
Revision as of 13:44, 30 November 2021
Project Q3128152 in Greece
Language | Label | Description | Also known as |
---|---|---|---|
English | Historical Manuscript transcription platform |
Project Q3128152 in Greece |
Statements
657,540.0 Euro
0 references
28 June 2018
0 references
27 December 2021
0 references
ΕΙΔΙΚΟΣ ΛΟΓΑΡΙΑΣΜΟΣ ΚΟΝΔΥΛΙΩΝ ΕΡΕΥΝΑΣ ΔΗΜΟΚΡΙΤΕΙΟΥ ΠΑΝΕΠΙΣΤΗΜΙΟΥ ΘΡΑΚΗΣ
0 references
Παρόλο, που μέχρι σήμερα έχουν γίνει αρκετές προσπάθειες ψηφιοποίησης και ηλεκτρονικής πρόσβασης στο περιεχόμενο των συλλογών αυτών, καμία δεν έχει οδηγηθεί με ικανοποιητικό αποτέλεσμα σε πλήρη ψηφιακή μεταγραφή (transcription), το οποίο μετατρέπει αυτόματα ψηφιακές εικόνες ιστορικών χειρόγραφων σε απλό ηλεκτρονικό κείμενο (text). Κατά συνέπεια μεγάλος αριθμός ιστορικών χειρόγραφων κειμένων να μη μπορεί να μελετηθεί εύκολα και να παραμένει ανεκμετάλλευτος.Ο στόχος του έργου μDOC.tS είναι είναι να αναπτύξει μία καινοτόμο και οικονομικά αποδοτική λύση για να βοηθήσει όχι μόνο ειδικούς μελετητές αλλά και αρχεία, βιβλιοθήκες, μουσεία, κ.τ.λ. στην πλήρη μεταγραφή των ιστορικών χειρόγραφων. Οι τεχνολογίες που θα προκύψουν θα ενσωματωθούν σε ένα σύνολο εργαλείων τα οποία θα υλοποιηθούν σε μια εξειδικευμένη πλατφόρμα υποβοήθησης μεταγραφής χειρογράφων. Το τελικό προϊόν του έργου θα δώσει στους χρήστες τη δυνατότητα να:- Εξάγουν αυτόματα το πλήρες κείμενο από τα ψηφιοποιημένα ιστορικά χειρόγραφα μέσω μιάς μηχανής μεταγραφής (Handwritten Transcription Engine HTR) χρησιμοποιώντας σύγχρονα επαναλαμβανόμενα νευρωνικά δίκτυα (Recurrent Neural Networks) και γλωσσικά μοντέλα.- Βελτιώσουν την ποιότητα (π.χ. αφαίρεση θορύβου) και να αναδείξουν τις περιοχές κειμένου στα ψηφιοποιημένα ιστορικά χειρόγραφα κείμενα.- Αναζητήσουν λέξεις-κλειδιά απευθείας στα ψηφιοποιημένα έγγραφα των ιστορικών συλλογών χρησιμοποιώντας σύγχρονες τεχνικές εντοπισμού λέξεων (Keyword Spotting KWS).- Διαχειρισθούν με φιλικό προς τον χρήστη, έξυπνο και αποδοτικό τρόπο τα ψηφιοποιημένα χειρόγραφα έγγραφα παρέχοντας περιβάλλον αυτόματης επεξεργασίας, μεταγραφής και διαχείρισης των δεδομένων. (Greek)
0 references
Although several efforts have been made to date to digitise and access the content of these collections, none has been led to a satisfactory result in a full digital transcription, which automatically converts digital images of historical manuscripts into simple electronic text. Consequently, a large number of historical manuscripts cannot be easily studied and remain unexploited. The aim of the MDOC.tS project is to develop an innovative and cost-effective solution to help not only specialist scholars but also archives, libraries, museums, etc. in the full transcription of historical manuscripts. The resulting technologies will be integrated into a toolkit to be implemented in a specialised manuscript transcription assistance platform. The final product of the project will enable users to:- Export the full text from the digitised historical manuscripts automatically through a Handwritten Transcription Engine HTR using modern recurrent Neural Networks and language models.- Improve quality (e.g. noise removal) and highlight text areas in digitised historical manuscript texts.- Search for keywords directly in the digitised documents of historical collections using modern word tracing techniques (e.g. noise removal) and highlight text areas in digitised historical manuscript texts. (English)
30 September 2021
0 references
Bien que plusieurs efforts aient été faits à ce jour pour numériser et accéder au contenu de ces collections, aucun n’a abouti à un résultat satisfaisant en une transcription numérique complète, qui convertit automatiquement les images numériques de manuscrits historiques en texte électronique simple. Par conséquent, un grand nombre de manuscrits historiques ne peuvent pas être facilement étudiés et restent inexploités. Le projet MDOC.tS vise à développer une solution innovante et rentable pour aider non seulement les chercheurs spécialisés, mais aussi les archives, bibliothèques, musées, etc. dans la transcription complète des manuscrits historiques. Les technologies qui en résultent seront intégrées dans une boîte à outils qui sera mise en œuvre dans une plateforme spécialisée d’assistance à la transcription manuscrite. Le produit final du projet permettra aux utilisateurs:- d’exporter automatiquement le texte intégral des manuscrits historiques numérisés au moyen d’un moteur de transcription manuscrite HTR à l’aide de réseaux neuronaux récurrents modernes et de modèles linguistiques.- Améliorer la qualité (par exemple, élimination du bruit) et mettre en évidence les zones de texte dans les textes manuscrits historiques numérisés.- Rechercher des mots-clés directement dans les documents numérisés des collections historiques à l’aide de techniques modernes de traçage des mots (par exemple, élimination du bruit) et mettre en évidence les zones de texte dans les textes manuscrits historiques numérisés. (French)
30 November 2021
0 references
Identifiers
5.030.443
0 references