Νέα ακουστικά που μεταφράζουν με τη βοήθεια της ΑΙ

Νέα ακουστικά που μεταφράζουν με τη βοήθεια της ΑΙ

Τα AirPods Pro 3, που κοστίζουν 250 δολάρια, χρησιμοποιούν τεχνητή νοημοσύνη για ψηφιακή διερμηνεία μέσω της Siri σε πραγματικό χρόνο

3' 6" χρόνος ανάγνωσης

Αυτή την εβδομάδα, συνάντησα έναν παλιό φίλο και μου μίλησε για το καλοκαίρι του. Μαζί με τη σύντροφό του επισκέφθηκαν την οικογένειά του στην Αριζόνα. Η ανιψιά του τον έσυρε να δουν την ταινία «Lilo and Stitch». Δούλευε σκληρά σε μια νέα startup. Μου τα είπε όλα αυτά στα ισπανικά, μια γλώσσα που δεν έχω μάθει ποτέ, αλλά κατάλαβα κάθε λέξη. Και ο λόγος που τον κατάλαβα ήταν επειδή φορούσα τα νέα ακουστικά της Apple, που μόλις κυκλοφόρησαν στα καταστήματα. Τα AirPods Pro 3, που κοστίζουν 250 δολάρια, χρησιμοποιούν τεχνητή νοημοσύνη για να κάνουν μεταφράσεις σε πραγματικό χρόνο. Καθώς ο φίλος μου μιλούσε, η εικονική βοηθός της Apple, η Siri, λειτουργούσε ως διερμηνέας, μιλώντας με ρομποτική φωνή που μετέτρεπε αμέσως τα ισπανικά σε αγγλικά στα αυτιά μου. Αργότερα, εξέτασα μια μεταγραφή της συνομιλίας, που αποθηκεύτηκε αυτομάτως στο iPhone μου, για να επιβεβαιώσω την ακρίβεια της μετάφρασης. Με εξαίρεση μερικά λάθη όπου η Siri μπέρδεψε τις αντωνυμίες (αναφερόμενη στη σύντροφο του φίλου μου ως «αυτός» αντί για «αυτή»), ήταν αξιόπιστη.

Εντυπωσιάστηκα. Αυτό ήταν το πιο σοβαρό παράδειγμα τεχνολογίας τεχνητής νοημοσύνης που λειτουργεί με τρόπο που θα μπορούσε να είναι επωφελής για πολλούς ανθρώπους. Τα παιδιά των μεταναστών που προτιμούν να μιλούν τη μητρική τους γλώσσα μπορεί να έχουν ευκολότερη επικοινωνία. Οι ταξιδιώτες που επισκέπτονται ξένες χώρες μπορούν να κατανοούν καλύτερα τους οδηγούς ταξί, το προσωπικό των ξενοδοχείων και τους υπαλλήλους των αεροπορικών εταιρειών. Θα με βοηθούσε επίσης στην καθημερινή μου ζωή να κατανοήσω έναν εργολάβο ή έναν υπάλληλο απεντόμωσης που δεν μιλάει αγγλικά και προσπαθεί να μου εξηγήσει τι βρήκε κάτω από το σπίτι μου.

Η είσοδος της Apple στον τομέα της γενετικής τεχνητής νοημοσύνης, της τεχνολογίας πίσω από chatbots όπως το ChatGPT της OpenAI και το Gemini της Google, θα χαρακτηριζόταν τουλάχιστον δύσκολη. Η εταιρεία δεν κατάφερε να υλοποιήσει ορισμένες από τις λειτουργίες τεχνητής νοημοσύνης που είχε υποσχεθεί για το iPhone 16 του περασμένου έτους, επειδή δεν λειτουργούσαν αρκετά καλά. Και τα εργαλεία τεχνητής νοημοσύνης της Apple που είναι διαθέσιμα για την επεξεργασία φωτογραφιών και τη σύνοψη άρθρων ήταν απογοητευτικά σε σύγκριση με παρόμοια εργαλεία της Google. Η ισχυρή τεχνολογία μετάφρασης στα AirPods είναι ένα σημάδι ότι η Apple εξακολουθεί να βρίσκεται στον αγώνα της τεχνητής νοημοσύνης, παρά τις αρχικές δυσκολίες της. Οι ψηφιακοί μεταφραστές γλωσσών δεν είναι κάτι καινούργιο, αλλά η ενσωμάτωσή τους στα AirPods αναμένεται να κάνει μεγάλη διαφορά στη συχνότητα με την οποία οι άνθρωποι χρησιμοποιούν την εν λόγω τεχνολογία.

Σε τι διαφέρουν

Για περισσότερο από μία δεκαετία, οι καταναλωτές έχουν δυσκολευτεί με τις εφαρμογές μετάφρασης γλωσσών στα τηλέφωνά τους όπως το Google Translate και το Microsoft Translator. Απαιτούσαν από τους χρήστες να κρατούν το μικρόφωνο του τηλεφώνου τους κοντά στο άτομο που μιλούσε μια ξένη γλώσσα και να περιμένουν να εμφανιστεί η μετάφραση στην οθόνη ή να αναπαραχθεί μέσω των μικροσκοπικών ηχείων του τηλεφώνου. Οι μεταφράσεις ήταν συχνά ανακριβείς. Αντιθέτως, οι χρήστες των AirPods χρειάζεται μόνο να κάνουν μια κίνηση για να ενεργοποιήσουν τον ψηφιακό διερμηνέα. Περίπου ένα δευτερόλεπτο μετά την ομιλία κάποιου, η μετάφραση αναπαράγεται στη γλώσσα που προτιμά ο χρήστης μέσω των ακουστικών.

Η χρήση μεγάλων γλωσσικών μοντέλων, της τεχνολογίας που χρησιμοποιεί πολύπλοκες στατιστικές για να μαντέψει ποιες λέξεις ταιριάζουν μεταξύ τους, κάνει τις μεταφράσεις των Airpods πιο ακριβείς από τις προηγούμενες τεχνολογίες, δήλωσε η Δήμητρα Βεργύρη, διευθύντρια τεχνολογίας ομιλίας στο SRI, το ερευνητικό εργαστήριο που δημιούργησε την αρχική έκδοση της Siri πριν εξαγοραστεί από την Apple. Ορισμένες λέξεις έχουν διαφορετικές σημασίες ανάλογα με το πλαίσιο, και τα μεγάλα γλωσσικά μοντέλα είναι ικανά να αναλύουν το πλήρες εύρος μιας συνομιλίας για να ερμηνεύσουν σωστά αυτό που λένε οι άνθρωποι. Οι παλαιότερες τεχνολογίες μετάφρασης έκαναν αποσπασματικές μεταφράσεις μία πρόταση κάθε φορά, κάτι που μπορούσε να οδηγήσει σε μεγάλα λάθη λόγω έλλειψης πλαισίου.

comment-below Λάβετε μέρος στη συζήτηση 0 Εγγραφείτε για να διαβάσετε τα σχόλια ή
βρείτε τη συνδρομή που σας ταιριάζει για να σχολιάσετε.
Για να σχολιάσετε, επιλέξτε τη συνδρομή που σας ταιριάζει. Παρακαλούμε σχολιάστε με σεβασμό προς την δημοσιογραφική ομάδα και την κοινότητα της «Κ».
Σχολιάζοντας συμφωνείτε με τους όρους χρήσης.
Εγγραφή Συνδρομή

Editor’s Pick

ΤΙ ΔΙΑΒΑΖΟΥΝ ΟΙ ΣΥΝΔΡΟΜΗΤΕΣ

MHT