Οταν ερευνητές του Πανεπιστημίου του Στάνφορντ ζήτησαν από το πανίσχυρο chatbot Claude 3.5 να γράψει ένα ποίημα στην παραδοσιακή βιετναμέζικη φόρμα «song thất lục bát», που ακολουθεί ένα μοτίβο επτά, επτά, έξι και οκτώ λέξεων, το αποτέλεσμα ήταν ένα ποίημα που δεν ακολουθούσε τη φόρμα.
Η ομάδα τού έθεσε έπειτα μια πιο απλή άσκηση: Ποια είναι η βιετναμέζικη λέξη για τον μικρό αδελφό της μητέρας; Η εφαρμογή τεχνητής νοημοσύνης (ΑΙ) πάλι δεν τα πήγε καλά. Απάντησε τη λέξη για τα μεγάλα ή μικρά αδέλφια του πατέρα. Αυτά τα ελαττώματα δεν υπάρχουν βεβαίως μόνο στο Claude 3.5. Περισσότερο αντικατοπτρίζουν τον λόγο για τον οποίο η ΑΙ δεν διαχειρίζεται γλώσσες πέρα από τα κοινά αγγλικά. Αν και η χρήση της γνωρίζει εκρηκτική διάδοση στη Δύση, πολλές χώρες του υπόλοιπου κόσμου μένουν έξω από τη συζήτηση, καθώς το μεγαλύτερο μέρος της νέας τεχνολογίας εκπαιδεύεται στα αγγλικά.
Ειδικοί ανησυχούν πλέον πως το γλωσσικό κενό μπορεί να οξύνει τις τεχνολογικές ανισότητες, αφήνοντας πίσω πολλές χώρες και πολιτισμούς του κόσμου. «Μια καθυστέρηση ακόμη και μερικών ετών της πρόσβασης σε τεχνολογία υψηλού επιπέδου μπορεί να οδηγήσει σε δεκαετίες καθυστέρησης την εθνική οικονομία», δήλωσε ο Σανγκ Τρουόνγκ, υποψήφιος διδάκτορας στο εργαστήριο τεχνητής νοημοσύνης του Στάνφορντ.
Το παράδοξο
Φαίνεται πως ολόκληρο το φάσμα των εργαλείων τεχνητής νοημοσύνης κάνει εύκολα λάθη σε γλώσσες όπως τα βιετναμέζικα, που θεωρούνται γλώσσες με «περιορισμένες πηγές». Από την άλλη, οι γλώσσες αυτές ομιλούνται από δεκάδες ή και εκατοντάδες εκατομμύρια ανθρώπους, που τυχαίνει απλώς να μη βρίσκονται στα κέντρα ανάπτυξης της τεχνητής νοημοσύνης, δηλαδή την Κίνα και τις Ηνωμένες Πολιτείες της Αμερικής. Σ’ αυτές τις γλώσσες περιλαμβάνονται η Χίντι (σύγχρονα ινδικά), η Μπενγκάλι (7η πιο ομιλούμενη γλώσσα στον κόσμο) και η Σουαχίλι.
Εκτεταμένη ανάλυση της εταιρείας W3Techs βρήκε πως το 60% του περιεχομένου του Ιντερνετ χρησιμοποιεί την αγγλική γλώσσα. Ενδιαφέρον παρουσιάζει το γεγονός ότι μόλις το 5% του πλανήτη έχει ως μητρική γλώσσα τα αγγλικά. Τα κινεζικά (μανδαρινικά) και τα ισπανικά αποτελούν επίσης παραδείγματα γλωσσών με σημαντική παρουσία στο Διαδίκτυο.
Πανεπιστημιακά ιδρύματα, οργανισμοί και εθελοντές προσπαθούν να δημιουργήσουν πηγές στο Ιντερνετ για ομιλητές γλωσσών που δεν εκπροσωπούνται δίκαια στον ψηφιακό κόσμο. Η εταιρεία Lelapa AI, φερ’ ειπείν, που δραστηριοποιείται στο Γιοχάνεσμπουργκ της Νότιας Αφρικής, είναι μία από τις εταιρείες που ηγείται τέτοιων προσπαθειών στην αφρικανική ήπειρο. Η εν λόγω startup αναπτύσσει πολύγλωσσα προϊόντα για εταιρείες, αλλά και απλούς χρήστες σε ολόκληρη την Αφρική.
«Πιστεύω πως είναι πολύ επικίνδυνη ιδέα οι άνθρωποι να πρέπει να ενσωματωθούν σε μια κουλτούρα διαφορετική από τη δική τους προκειμένου να έχουν πρόσβαση στην πρόοδο», σχολίασε η Πελονόμι Μοϊλόα, διευθύντρια και συνιδρύτρια της εταιρείας. «Οι μεγάλες εταιρείες όπως η Google, η Apple και η Open AI δεν εκπαιδεύουν τα μοντέλα τους με τρόπο ώστε να υπηρετούν τους ανθρώπους αυτούς».

