Historical Manuscript transcription platform (Q3128152)
Jump to navigation
Jump to search
Project Q3128152 in Greece
Language | Label | Description | Also known as |
---|---|---|---|
English | Historical Manuscript transcription platform |
Project Q3128152 in Greece |
Statements
657,540.0 Euro
0 references
28 June 2018
0 references
27 December 2021
0 references
ΕΙΔΙΚΟΣ ΛΟΓΑΡΙΑΣΜΟΣ ΚΟΝΔΥΛΙΩΝ ΕΡΕΥΝΑΣ ΔΗΜΟΚΡΙΤΕΙΟΥ ΠΑΝΕΠΙΣΤΗΜΙΟΥ ΘΡΑΚΗΣ
0 references
Παρόλο, που μέχρι σήμερα έχουν γίνει αρκετές προσπάθειες ψηφιοποίησης και ηλεκτρονικής πρόσβασης στο περιεχόμενο των συλλογών αυτών, καμία δεν έχει οδηγηθεί με ικανοποιητικό αποτέλεσμα σε πλήρη ψηφιακή μεταγραφή (transcription), το οποίο μετατρέπει αυτόματα ψηφιακές εικόνες ιστορικών χειρόγραφων σε απλό ηλεκτρονικό κείμενο (text). Κατά συνέπεια μεγάλος αριθμός ιστορικών χειρόγραφων κειμένων να μη μπορεί να μελετηθεί εύκολα και να παραμένει ανεκμετάλλευτος.Ο στόχος του έργου μDOC.tS είναι είναι να αναπτύξει μία καινοτόμο και οικονομικά αποδοτική λύση για να βοηθήσει όχι μόνο ειδικούς μελετητές αλλά και αρχεία, βιβλιοθήκες, μουσεία, κ.τ.λ. στην πλήρη μεταγραφή των ιστορικών χειρόγραφων. Οι τεχνολογίες που θα προκύψουν θα ενσωματωθούν σε ένα σύνολο εργαλείων τα οποία θα υλοποιηθούν σε μια εξειδικευμένη πλατφόρμα υποβοήθησης μεταγραφής χειρογράφων. Το τελικό προϊόν του έργου θα δώσει στους χρήστες τη δυνατότητα να:- Εξάγουν αυτόματα το πλήρες κείμενο από τα ψηφιοποιημένα ιστορικά χειρόγραφα μέσω μιάς μηχανής μεταγραφής (Handwritten Transcription Engine HTR) χρησιμοποιώντας σύγχρονα επαναλαμβανόμενα νευρωνικά δίκτυα (Recurrent Neural Networks) και γλωσσικά μοντέλα.- Βελτιώσουν την ποιότητα (π.χ. αφαίρεση θορύβου) και να αναδείξουν τις περιοχές κειμένου στα ψηφιοποιημένα ιστορικά χειρόγραφα κείμενα.- Αναζητήσουν λέξεις-κλειδιά απευθείας στα ψηφιοποιημένα έγγραφα των ιστορικών συλλογών χρησιμοποιώντας σύγχρονες τεχνικές εντοπισμού λέξεων (Keyword Spotting KWS).- Διαχειρισθούν με φιλικό προς τον χρήστη, έξυπνο και αποδοτικό τρόπο τα ψηφιοποιημένα χειρόγραφα έγγραφα παρέχοντας περιβάλλον αυτόματης επεξεργασίας, μεταγραφής και διαχείρισης των δεδομένων. (Greek)
0 references
Although several efforts have been made to date to digitise and access the content of these collections, none has been led to a satisfactory result in a full digital transcription, which automatically converts digital images of historical manuscripts into simple electronic text. Consequently, a large number of historical manuscripts cannot be easily studied and remain unexploited. The aim of the MDOC.tS project is to develop an innovative and cost-effective solution to help not only specialist scholars but also archives, libraries, museums, etc. in the full transcription of historical manuscripts. The resulting technologies will be integrated into a toolkit to be implemented in a specialised manuscript transcription assistance platform. The final product of the project will enable users to:- Export the full text from the digitised historical manuscripts automatically through a Handwritten Transcription Engine HTR using modern recurrent Neural Networks and language models.- Improve quality (e.g. noise removal) and highlight text areas in digitised historical manuscript texts.- Search for keywords directly in the digitised documents of historical collections using modern word tracing techniques (e.g. noise removal) and highlight text areas in digitised historical manuscript texts. (English)
30 September 2021
0 references
Bien que plusieurs efforts aient été faits à ce jour pour numériser et accéder au contenu de ces collections, aucun n’a abouti à un résultat satisfaisant en une transcription numérique complète, qui convertit automatiquement les images numériques de manuscrits historiques en texte électronique simple. Par conséquent, un grand nombre de manuscrits historiques ne peuvent pas être facilement étudiés et restent inexploités. Le projet MDOC.tS vise à développer une solution innovante et rentable pour aider non seulement les chercheurs spécialisés, mais aussi les archives, bibliothèques, musées, etc. dans la transcription complète des manuscrits historiques. Les technologies qui en résultent seront intégrées dans une boîte à outils qui sera mise en œuvre dans une plateforme spécialisée d’assistance à la transcription manuscrite. Le produit final du projet permettra aux utilisateurs:- d’exporter automatiquement le texte intégral des manuscrits historiques numérisés au moyen d’un moteur de transcription manuscrite HTR à l’aide de réseaux neuronaux récurrents modernes et de modèles linguistiques.- Améliorer la qualité (par exemple, élimination du bruit) et mettre en évidence les zones de texte dans les textes manuscrits historiques numérisés.- Rechercher des mots-clés directement dans les documents numérisés des collections historiques à l’aide de techniques modernes de traçage des mots (par exemple, élimination du bruit) et mettre en évidence les zones de texte dans les textes manuscrits historiques numérisés. (French)
30 November 2021
0 references
Obwohl bisher mehrere Anstrengungen unternommen wurden, um den Inhalt dieser Sammlungen zu digitalisieren und zuzugreifen, wurde keines zu einem zufrieden stellenden Ergebnis in einer vollständigen digitalen Transkription geführt, die digitale Bilder historischer Handschriften automatisch in einfachen elektronischen Text umwandelt. Das Ziel des MDOC.tS-Projekts ist es, eine innovative und kostengünstige Lösung zu entwickeln, um nicht nur Fachwissenschaftlern, sondern auch Archiven, Bibliotheken, Museen usw. in der vollständigen Transkription historischer Handschriften zu helfen. Die daraus resultierenden Technologien werden in ein Toolkit integriert, das in einer spezialisierten Handschriftshilfeplattform implementiert werden soll. Das Endprodukt des Projekts wird es Nutzern ermöglichen,:- den Volltext aus den digitalisierten historischen Manuskripten automatisch über eine handgeschriebene Transkriptionsmaschine HTR mit modernen wiederkehrenden Neural Networks und Sprachmodellen zu exportieren.- Qualität (z. B. Lärmentfernung) zu verbessern und Textbereiche digitalisierter historischer Manuskripttexte zu markieren.- Suchen Sie nach Schlüsselwörtern direkt in digitalisierten Dokumenten historischer Sammlungen mit modernen Wortverfolgungstechniken (z. B. Lärmentfernung) und markieren Textbereiche in digitalisierten historischen Handschriftentexten. (German)
7 December 2021
0 references
Hoewel er tot nu toe verscheidene inspanningen zijn geleverd om de inhoud van deze collecties te digitaliseren en toegankelijk te maken, is geen enkele tot een bevredigend resultaat geleid tot een volledige digitale transcriptie, die digitale afbeeldingen van historische manuscripten automatisch omzet in eenvoudige elektronische tekst. Het MDOC.tS-project heeft als doel een innovatieve en kosteneffectieve oplossing te ontwikkelen om niet alleen gespecialiseerde geleerden te helpen, maar ook archieven, bibliotheken, musea, enz. bij de volledige transcriptie van historische manuscripten. De resulterende technologieën zullen worden geïntegreerd in een toolkit die moet worden geïmplementeerd in een gespecialiseerd platform voor ondersteuning bij transcriptie van manuscripten. Het uiteindelijke product van het project zal gebruikers in staat stellen:- De volledige tekst uit de gedigitaliseerde historische manuscripten automatisch exporteren via een Handgeschreven Transcription Engine HTR met behulp van moderne terugkerende Neural Networks en taalmodellen.- Verbeter de kwaliteit (bijv. ruisverwijdering) en markeer tekstgebieden in gedigitaliseerde historische manuscriptteksten.- Zoek naar trefwoorden rechtstreeks in de gedigitaliseerde documenten van historische collecties met behulp van moderne woordtraceringstechnieken (bv. lawaaiverwijdering) en markeer tekstgebieden in gedigitaliseerde historische manuscriptteksten. (Dutch)
17 December 2021
0 references
Sebbene finora siano stati compiuti diversi sforzi per digitalizzare e accedere al contenuto di queste collezioni, nessuna è stata portata a un risultato soddisfacente in una trascrizione digitale completa, che converte automaticamente le immagini digitali dei manoscritti storici in semplici testi elettronici. L'obiettivo del progetto MDOC.tS è quello di sviluppare una soluzione innovativa ed economica per aiutare non solo gli studiosi specialistici ma anche gli archivi, le biblioteche, i musei, ecc. nella trascrizione completa dei manoscritti storici. Le tecnologie risultanti saranno integrate in un kit di strumenti da implementare in una piattaforma specializzata di assistenza alla trascrizione dei manoscritti. Il prodotto finale del progetto consentirà agli utenti di:- Esportare il testo completo dai manoscritti storici digitalizzati automaticamente attraverso un motore di trascrizione manuale HTR utilizzando moderne reti neurali e modelli linguistici ricorrenti.- Migliorare la qualità (ad es. rimozione del rumore) ed evidenziare le aree di testo nei testi storici digitalizzati.- Cercare le parole chiave direttamente nei documenti digitalizzati delle collezioni storiche utilizzando le moderne tecniche di tracciatura delle parole (ad esempio rimozione del rumore) ed evidenziare le aree di testo nei testi storici digitalizzati. (Italian)
15 January 2022
0 references
Aunque hasta la fecha se han realizado varios esfuerzos para digitalizar y acceder al contenido de estas colecciones, ninguna ha dado lugar a un resultado satisfactorio en una transcripción digital completa, que convierte automáticamente las imágenes digitales de manuscritos históricos en texto electrónico simple. Por lo tanto, un gran número de manuscritos históricos no se pueden estudiar fácilmente y permanecer inexplotados. El objetivo del proyecto MDOC.tS es desarrollar una solución innovadora y rentable para ayudar no solo a académicos especializados, sino también archivos, bibliotecas, museos, etc. en la transcripción completa de manuscritos históricos. Las tecnologías resultantes se integrarán en un conjunto de herramientas que se implementará en una plataforma especializada de asistencia para la transcripción de manuscritos. El producto final del proyecto permitirá a los usuarios:- Exportar el texto completo de los manuscritos históricos digitalizados automáticamente a través de un motor de transcripción manuscrita HTR utilizando redes neurales modernas y modelos lingüísticos recurrentes.- Mejorar la calidad (por ejemplo, eliminación de ruido) y resaltar áreas de texto en textos manuscritos históricos digitalizados.- Buscar palabras clave directamente en los documentos digitalizados de colecciones históricas utilizando técnicas modernas de rastreo de palabras (por ejemplo, eliminación de ruido) y resaltar áreas de texto en textos manuscritos históricos digitalizados. (Spanish)
15 January 2022
0 references
Identifiers
5.030.443
0 references