Κάποιος θα μπορούσε να παρομοιάσει τη μελέτη της ιστορίας με τη συναρμολόγηση ενός δύσκολου παζλ, λέει στην «Κ» ο Γιάννης Ασσαέλ, ερευνητής της DeepMind, του σκέλους της εταιρείας Google που ασχολείται αποκλειστικά με την τεχνητή νοημοσύνη, και σύμβουλος της ελληνικής κυβέρνησης για την τεχνητή νοημοσύνη.
Το 2022, ο ίδιος και η Τέα Σόμερσιλντ, η οποία πλέον είναι ερευνήτρια στο Πανεπιστήμιο του Νότιγχαμ, είχαν παρουσιάσει την «Ιθάκη», το πρώτο νευρωνικό δίκτυο για την αποκατάσταση κειμένου κατεστραμμένων επιγραφών και τον προσδιορισμό του τόπου και της χρονολογίας γραφής τους. Ηταν μια απαραίτητη αρχή, αλλά σύντομα συνειδητοποίησαν πως δεν αρκούσε.
«Με την “Ιθάκη”, την προηγούμενη δουλειά μας, εστιάσαμε στο να τελειοποιήσουμε τα μεμονωμένα κομμάτια – την αποκατάσταση, χρονολόγηση και γεωγραφική απόδοση ενός κειμένου. Ομως, μια μεμονωμένη πρόβλεψη, όσο ακριβής κι αν είναι, παραμένει ένα κομμάτι παζλ χωρίς να ξέρουμε πώς συνδέεται με τα υπόλοιπα», εξηγεί.
Βρίσκοντας την έννοια
Την προηγούμενη εβδομάδα δημοσίευσαν στο κορυφαίο επιστημονικό περιοδικό Nature τη μελέτη τους για τον «Αινεία», το πρώτο προηγμένο σύστημα τεχνητής νοημοσύνης για την εννοιολογική πλαισίωση αρχαίων επιγραφών.
Μιλώντας σήμερα στην «Κ», ο Γιάννης Ασσαέλ εξηγεί πως, σε σχέση με την «Ιθάκη», ο «Αινείας» κάνει ένα βήμα παραπέρα. «Βοηθάει τους ιστορικούς να ερμηνεύσουν και να πλαισιώσουν ένα κείμενο, να δώσουν νόημα σε μεμονωμένα αποσπάσματα, να καταλήξουν σε πληρέστερα συμπεράσματα και, τελικά, να συνθέσουν μια βαθύτερη κατανόηση της Αρχαίας Ιστορίας», σημειώνει. Η ανάπτυξη του συγκεκριμένου συστήματος αποτελεί ομαδική προσπάθεια – έγινε από την Google DeepMind και το Πανεπιστήμιο του Νότιγχαμ, σε σύμπραξη με ερευνητές από τα Πανεπιστήμια του Γουόρικ, της Οξφόρδης και το Οικονομικό Πανεπιστήμιο Αθηνών.
Καθώς όραμά τους είναι η γνώση να είναι προσβάσιμη σε όλους, μια διαδραστική έκδοση του «Αινεία» διατίθεται δωρεάν για ερευνητές, φοιτητές, εκπαιδευτικούς, επαγγελματίες μουσείων και άλλους στη διεύθυνση predictingthepast.com, ενώ οι ερευνητές παρέχουν επίσης ελεύθερη πρόσβαση στον κώδικα και το σύνολο δεδομένων τους.
Συνδέοντας το παζλ
Η βασική καινοτομία του «Αινεία», συμπληρώνει ο δρ Ασσαέλ, είναι η ικανότητά του να παρέχει εννοιολογικό πλαίσιο, ανακτώντας αμέσως «παράλληλα» κείμενα από μια τεράστια βάση δεδομένων με 176.000 λατινικές επιγραφές.
Βασική καινοτομία του προγράμματος είναι η ικανότητά του να παρέχει εννοιολογικό πλαίσιο, ανακτώντας αμέσως «παράλληλα» κείμενα από μια βάση δεδομένων με 176.000 λατινικές επιγραφές.
«Η διαδικασία αυτή μέχρι σήμερα γινόταν με απλή αναζήτηση κειμένου, κάτι ιδιαίτερα περιορισμένο και ευάλωτο σε μικρές διαφορές στη γραφή, στα ονόματα κ.α. Αυτά τα “παράλληλα” κείμενα είναι τα γειτονικά κομμάτια του παζλ, που βοηθούν τους ιστορικούς να θεμελιώσουν τις υποθέσεις τους και να δώσουν νόημα στο απόσπασμα προς μελέτη – συνδέοντας το παζλ της ιστορίας», τονίζει ο ίδιος.
Ταυτόχρονα, ο «Αινείας» μπορεί να συμπληρώνει κενά σε κείμενα όπου το μήκος των φθαρμένων τμημάτων είναι άγνωστο, ενώ χρησιμοποιεί για πρώτη φορά πολυτροπικά δεδομένα, συνδυάζοντας την ανάλυση του κειμένου με οπτικές πληροφορίες, όπως φωτογραφίες μιας επιγραφής, για να βελτιώσει τον γεωγραφικό προσδιορισμό της.
Με ακρίβεια 73%
Ο «Αινείας» αποκαθιστά κατεστραμμένες επιγραφές με ακρίβεια 73% στις 20 κορυφαίες προτάσεις για κενά έως δέκα χαρακτήρων. Το ποσοστό αυτό μειώνεται μόλις στο 58% όταν το μήκος του κενού είναι άγνωστο – μια πρόκληση που ο κ. Ασσαέλ χαρακτηρίζει «εξαιρετικά δύσκολη».
Χάρη στη χρήση οπτικών δεδομένων, το σύστημα μπορεί να αποδώσει μια επιγραφή σε μία από τις 62 ρωμαϊκές επαρχίες με ακρίβεια 72%, ενώ, όσον αφορά τη χρονολόγηση, ο «Αινείας» τοποθετεί ένα κείμενο με απόκλιση 13 ετών από τις χρονολογικές περιόδους που προτείνουν οι ιστορικοί. Για να διαπιστώσουν τον πραγματικό αντίκτυπο του «Αινεία», διεξήγαγαν τη μεγαλύτερη μελέτη συνεργασίας ιστορικών και τεχνητής νοημοσύνης μέχρι σήμερα, δηλώνει ο δρ Ασσαέλ. «Στο 90% των περιπτώσεων, οι ιστορικοί βρήκαν τα “παράλληλα” κείμενα που πρότεινε ο “Αινείας” χρήσιμα ως αφετηρία για την έρευνά τους. Η χρήση του εργαλείου βελτίωσε την αυτοπεποίθησή τους στις βασικές εργασίες κατά 44%», αναφέρει στην «Κ».
Πέρα από την επιτάχυνση της έρευνας, σημειώνει ο ίδιος, ο «Αινείας» εισάγει και έναν νέο τρόπο προσέγγισης ιστορικών ζητημάτων. «Αυτό φάνηκε καθαρά στην περίπτωση του Res Gestae Divi Augusti, της αυτοβιογραφίας του Αυγούστου», λέει. Οι ιστορικοί διαφωνούν εδώ και καιρό για τη χρονολόγησή της. «Ο “Αινείας”, αντί να δώσει μία απάντηση, παρήγαγε μια κατανομή πιθανοτήτων που αποτύπωσε τέλεια τις δύο όψεις της επιστημονικής συζήτησης, δίνοντας προβάδισμα στη μία. Συνεργαστήκαμε με την πλέον ειδική ιστορικό στο θέμα, Αλισον Κούλεϊ, και είδαμε ότι για πρώτη φορά μπορούμε να μελετήσουμε την Ιστορία με μια ποσοτική οπτική γωνία».
Επιστροφή στην «Ιθάκη»
Μπορεί η «Ιθάκη» να τους έδωσε την αφετηρία για το ωραίο ταξίδι, αλλά δεν αφήνουν κι εκείνο το σύστημα πίσω. Ενσωματώνοντας τις νέες δυνατότητες του «Αινεία», αναβαθμίζουν την «Ιθάκη» για κείμενα στα αρχαία ελληνικά. Παράλληλα, καθώς η εκπαίδευση είναι προτεραιότητα της ομάδας τους, σε συνεργασία με το Sint-Lievenscollege στη Γάνδη, έχουν σχεδιάσει ένα νέο, ολοκληρωμένο πρόγραμμα διδασκαλίας της Ιστορίας μέσα από την τεχνητή νοημοσύνη, αναφέρει στην «Κ».
«Σκοπός του είναι να βοηθήσει τους μαθητές και τους φοιτητές να γεφυρώσουν τις τεχνικές δεξιότητες με την ιστορική κριτική σκέψη. Δεν παραδίδουμε απλώς ένα εργαλείο», δηλώνει ο κ. Ασσαέλ, «αλλά συμβάλλουμε ενεργά στην εκπαίδευση της επόμενης γενιάς ιστορικών που θα μπορεί να αξιοποιεί την τεχνολογία και δείχνουμε πως οι ανθρωπιστικές και οι φυσικές επιστήμες είναι σήμερα αλληλένδετες».
