Εσπασε η «κατάρα του Κυρίλλου» με τη βοήθεια της ΑΙ

Εσπασε η «κατάρα του Κυρίλλου» με τη βοήθεια της ΑΙ

Στην ψηφιακή καταγραφή του ιστορικού «Λεξικού του Κυρίλλου» στοχεύει, με τη βοήθεια της τεχνητής νοημοσύνης, το έργο «Cyril Lexicon», που παρουσιάζεται στο συνέδριο της Γενναδείου Βιβλιοθήκης

2' 28" χρόνος ανάγνωσης
Φόρτωση Text-to-Speech...

Θεωρείται το «Λίντελ-Σκοτ» της ύστερης αρχαιότητας και των βυζαντινών και μεταβυζαντινών χρόνων. Κάθε βιβλιοθήκη, κάθε μοναστήρι, έπρεπε να έχει αντίγραφό του. Σε αντίθεση όμως με το μεγάλο οξφορδιανό εγχειρίδιο της αρχαιοελληνικής γλώσσας, το «Λεξικό του Κυρίλλου», που πιθανότατα συντάχθηκε στον 5ο μ.Χ. αιώνα και αποδίδεται στον Αγιο Κύριλλο, Πατριάρχη Αλεξανδρείας (370-444 μ.Χ.), διασώζεται σε περίπου 170 διασκορπισμένα χειρόγραφα (μόνο στον ελλαδικό χώρο), 100 σελίδων έκαστο, στα οποία αποτυπώθηκαν ανά τους αιώνες προσθαφαιρέσεις λημμάτων, διαφορετικοί γραφικοί χαρακτήρες και διάλεκτοι και ποικίλες συντομογραφίες – ένα αχανές συμπίλημα από λέξεις. «Είναι αδύνατον ένας άνθρωπος, ακόμα και μια ομάδα, να διαχειριστεί τέτοιο όγκο δεδομένων», λέει ο Σταμάτης Μπουσές, καθηγητής Φιλολογίας και Παπυρολογίας στο Δημοκρίτειο Πανεπιστήμιο Θράκης. «Βασιστήκαμε επομένως στην αυτόματη μεταγραφή των χειρογράφων –που γίνεται μέσα σε μερικές ώρες, αντί για τα χρόνια που θα χρειάζονταν με το ανθρώπινο χέρι– και κατόπιν στην ανάλυσή τους, μέσω ενός προγράμματος επεξεργασίας φυσικού λόγου».

Το πρόγραμμα αυτόματης μεταγραφής λέγεται HTR (Handwritten Text Recognition), ενώ τα δεδομένα που παράγει αναλύονται από το NLP (Natural Language Processing). Με αυτά τα δύο βασικά εργαλεία ξεκίνησε προ διετίας μια ομάδα φιλολόγων την προσπάθεια να θέσει τα θεμέλια μιας περιεκτικής έκδοσης του «Λεξικού του Κυρίλλου». Και άλλοι φιλόλογοι είχαν προσπαθήσει στο παρελθόν να εκδώσουν το «Λεξικό», όμως ο όγκος εργασίας ήταν τέτοιος, που δεν πρόλαβαν να το ολοκληρώσουν: «μπορούμε να μιλήσουμε για την… “κατάρα του Κυρίλλου”», λέει ο κ. Μπουσές αστειευόμενος.

Ομάδα ερευνητών «δίδαξε» παλαιογραφία τον αλγόριθμο και επεξεργάστηκε πλήρως 8 χειρόγραφα του ιστορικού Λεξικού του Κυρίλλου.

Υπάρχουν πάντως λόγοι για αισιοδοξία. Η ομάδα του έργου «Cyril Lexicon», που υλοποιήθηκε από το Δημοκρίτειο Πανεπιστήμιο σε συνεργασία με το Πανεπιστήμιο Αιγαίου (στο πλαίσιο δράσης του ΕΛΙΔΕΚ), επεξεργάστηκε πλήρως 8 χειρόγραφα (περίπου 800 σελίδες) του «Λεξικού του Κυρίλλου», αφού ταυτοποίησε όσα βρίσκονται στον ελλαδικό χώρο. Η επιστημονική υπεύθυνη του έργου, η επίκουρη καθηγήτρια Φιλολογίας του Δημοκρίτειου, Μαρία Κωνσταντινίδου, συνοψίζει στην «Κ» το πώς ο αλγόριθμος του HTR έμαθε να διαβάζει χειρόγραφα: «Τον διδάσκεις πρώτα παλαιογραφία και έπειτα αφιερώνεις λίγο χρόνο στο να εκπαιδευτεί πάνω σε ένα δύσκολο χειρόγραφο», λέει. Το NLP, συνεχίζει, εντόπισε συνδέσεις μεταξύ των λέξεων των χειρογράφων του «Λεξικού του Κυρίλλου» και βοήθησε την ομάδα των φιλολόγων να σχεδιάσει ένα «γενεαλογικό δέντρο». «Θέλαμε να δημιουργήσουμε τη μεθοδολογία που θα συμβάλει επιτέλους σε μια έκδοση του “Λεξικού”», σημειώνει η κ. Κωνσταντινίδου. «Να διευκρινίσουμε», λέει ο κ. Μπουσές, επικεφαλής της επιστημονικής επιτροπής του Cyril Lexicon, «ότι την τελική κρίση και τις τελικές αποφάσεις, π.χ. για το πώς συνδέονται τα χειρόγραφα, τις λαμβάνουν οι φιλόλογοι, οι άνθρωποι».

Ο κ. Μπουσές και η κ. Κωνσταντινίδου, μαζί με τους ερευνητές Βασίλη Γάτο και Κωνσταντίνο Παλαιολόγο του ΕΚΕΦΕ «Δημόκριτος», θα παρουσιάσουν το Cyril Lexicon στο διεθνές συνέδριο για τα 100 χρόνια της Γενναδείου Βιβλιοθήκης της Αμερικανικής Σχολής Κλασικών Σπουδών στην Αθήνα, που πραγματοποιείται σήμερα και αύριο στο αμφιθέατρο Cotsen Hall (Αναπήρων Πολέμου 9). Το πρόγραμμα περιλαμβάνει διαλέξεις για τη σχέση τεχνητής νοημοσύνης και πολιτιστικής κληρονομιάς, αλλά και για ζητήματα οργάνωσης της γνώσης και ψηφιακής μετάβασης των βιβλιοθηκών, πρόσβασης στις ιδιωτικές συλλογές κ.ά.

comment-below Λάβετε μέρος στη συζήτηση 0 Εγγραφείτε για να διαβάσετε τα σχόλια ή
βρείτε τη συνδρομή που σας ταιριάζει για να σχολιάσετε.
Για να σχολιάσετε, επιλέξτε τη συνδρομή που σας ταιριάζει. Παρακαλούμε σχολιάστε με σεβασμό προς την δημοσιογραφική ομάδα και την κοινότητα της «Κ».
Σχολιάζοντας συμφωνείτε με τους όρους χρήσης.
Εγγραφή Συνδρομή

Editor’s Pick

ΤΙ ΔΙΑΒΑΖΟΥΝ ΟΙ ΣΥΝΔΡΟΜΗΤΕΣ

MHT