Μάτι Στανισέφσκι: Η ΑΙ θα αποκτήσει συναισθηματική νοημοσύνη

Μάτι Στανισέφσκι: Η ΑΙ θα αποκτήσει συναισθηματική νοημοσύνη

Σύντομα θα αλληλεπιδρούμε με τους «φωνητικούς πράκτορες» που θα αντιλαμβάνονται τα συναισθήματά μας και θα προσαρμόζουν ανάλογα τη συνομιλία

7' 48" χρόνος ανάγνωσης
Φόρτωση Text-to-Speech...

Πώς θα σας φαινόταν αν ένα ρομπότ μπορούσε να σας μιλήσει κατανοώντας τα συναισθήματά σας; Και ποια θα ήταν η αντίδρασή σας αν μια τηλεφωνική υπηρεσία ψηφιακού βοηθού δεν χρησιμοποιούσε τη μηχανική, «ψυχρή» γλώσσα που έχουμε συνηθίσει;

Για τον 31χρονο Μάτι Στανισέφσκι, που μεγάλωσε παρακολουθώντας ξένες ταινίες με πολωνική μεταγλώττιση, το «dubbing» αποτέλεσε την αφορμή για να δημιουργήσει μία από τις ταχύτερα αναπτυσσόμενες εταιρείες τεχνητής νοημοσύνης παγκοσμίως. Σήμερα η ElevenLabs, η εταιρεία που συνίδρυσε και διευθύνει, μετατρέπει το γραπτό κείμενο σε φυσική φωνητική ομιλία με τη χρήση της «τεχνητής νοημοσύνης», ενώ επενδύει στη «συναισθηματική» επικοινωνία ανθρώπου και μηχανής.

Με αφορμή το φεστιβάλ «Παναθήναια», που πραγματοποιήθηκε στις 27-29 Μαΐου στο Ζάππειο Μέγαρο, και ως μέλος του δικτύου Endeavor Entrepreneurs, ο κ. Στανισέφσκι μίλησε στην «Κ» για το μέλλον της «συνθετικής ομιλίας» και αποκάλυψε τα τρία βασικά στοιχεία από το μνημόνιο συνεργασίας που υπέγραψε με την ελληνική κυβέρνηση.

– Τον Φεβρουάριο του 2026, η ElevenLabs αποτιμήθηκε στα 11 δισ. δολάρια και έχει χαρακτηριστεί μία από τις πιο πολύτιμες και ταχύτερα αναπτυσσόμενες νεοφυείς επιχειρήσεις «τεχνητής νοημοσύνης» (ΑΙ) στην Ευρώπη. Πώς ξεκίνησε η ιδέα της δημιουργίας ρεαλιστικών «συνθετικών φωνών»;

– Το 2022 ιδρύσαμε την εταιρεία μαζί με τον Πιοτρ Νταμπκόφσκι. Η έμπνευση ξεκίνησε από κάτι πολύ χαρακτηριστικό για πολλούς Ευρωπαίους και συγκεκριμένα από την Πολωνία, όπου αν παρακολουθήσετε μια ξένη ταινία όλες οι φωνές, είτε είναι ανδρικές είτε γυναικείες, αποδίδονται συχνά από μόνο έναν αφηγητή, χωρίς συναίσθημα ή ιδιαίτερο τονισμό. Αυτό μας έκανε να αναρωτηθούμε γιατί συμβαίνει και να ερευνήσουμε βαθύτερα το θέμα.

Μέσα από αυτή τη διαδικασία συνειδητοποιήσαμε ότι το μέλλον της επικοινωνίας θα είναι εντελώς διαφορετικό. Το πρόβλημα δεν περιορίζεται μόνο στη μεταγλώττιση (dubbing), αλλά αφορά συνολικά την ικανότητα της τεχνητής νοημοσύνης να επικοινωνεί σε ανθρώπινο επίπεδο.

Ετσι αρχίσαμε να συνδυάζουμε την έρευνα με το προϊόν, γνωρίζοντας ότι για να λυθεί αυτό το πρόβλημα πρέπει να αλλάξει ο τρόπος λειτουργίας των «γλωσσικών μοντέλων», δηλαδή πώς παράγουν «ανθρώπινη» ομιλία, πώς την κατανοούν και πώς την ενορχηστρώνουν. Παράλληλα θέλαμε να δημιουργήσουμε μια πλατφόρμα που θα βοηθάει τις επιχειρήσεις να μεταμορφώσουν τον τρόπο με τον οποίο επικοινωνούν με τον κόσμο γύρω τους.

Ετσι, ενώ οι περισσότεροι επικεντρώνονται στο κομμάτι της «νοημοσύνης» (των μοντέλων), εμείς θέλαμε να επικεντρωθούμε στην «επικοινωνία». Γιατί τελικά η επικοινωνία θα είναι το πραγματικό εμπόδιο στην καθημερινή πρόσβαση των πολιτών στα μοντέλα AI.

– Σήμερα, τα φωνητικά μοντέλα που δημιουργούνται μέσω τεχνητής νοημοσύνης πλησιάζουν με ταχείς ρυθμούς τον ανθρώπινο φωνητικό ρεαλισμό. Ποιο είναι το επόμενο βήμα μετά από αυτό;

– Νομίζω ότι η περήφανη στιγμή για εμάς ήταν η επιτυχία στο «τεστ Τούρινγκ» (σ.σ. η ικανότητα μιας μηχανής να είναι ισοδύναμη ή να ξεπερνάει τον άνθρωπο), όπου μπορούμε να αφηγηθούμε μια ιστορία και να αποδώσουμε τα συναισθήματα σε βαθμό που οι άνθρωποι θα την απολαύσουν και θα τη βρουν ευχάριστη.

Σκεφτόμαστε ότι φέτος θα περάσουμε το τεστ Τούρινγκ για τη συνομιλία του ανθρώπου με τον «φωνητικό πράκτορα (AI Agent)», ώστε να μπορείτε να αλληλεπιδράσετε αποτελεσματικά μαζί του. Και δεν θα έχει μόνο το στοιχείο του IQ, δηλαδή της απλής κατανόησης, αλλά θα κατανοεί και την πλευρά του EQ, ώστε να μπορεί να αντιληφθεί τα συναισθήματα του συνομιλητή του. Ετσι, για παράδειγμα, θα μπορεί να μιλάει πιο αργά και να προσαρμόζει την ταχύτητα ομιλίας σε διαφορετικά άτομα ή θα μπορεί να καταλαβαίνει αν κάποιος είναι αγχωμένος και να δίνει μια καθησυχαστική απάντηση.

Νομίζω ότι η περήφανη στιγμή για εμάς ήταν η επιτυχία στο τεστ Τούρινγκ (σ.σ. η ικανότητα μιας μηχανής να είναι ισοδύναμη ή να ξεπερνάει τον άνθρωπο), όπου μπορούμε να αφηγηθούμε μια ιστορία και να αποδώσουμε τα συναισθήματα σε βαθμό που οι άνθρωποι θα την απολαύσουν και θα τη βρουν ευχάριστη.

– Σας χαρακτηρίζουν επίσης οραματιστή, ενώ έχετε δηλώσει ότι «σε 50 χρόνια θα υπάρχει μια νευρωνική σύνδεση, όπου θα μπορείς να εγκαταστήσεις στον άνθρωπο ένα τσιπ με μια γλώσσα και απλώς να τη μιλάς». Προχωράμε προς πιο «ανθρωποειδείς» εκδοχές του εαυτού μας;

– Πολλοί άνθρωποι χάνουν τη φωνή τους λόγω ALS ή καρκίνου του λαιμού και συνεργαζόμαστε μαζί τους για να αναδημιουργήσουμε την αρχική φωνή τους με βάση παλιές ηχογραφήσεις τους. Αυτό που κάνουμε είναι ότι την εγκαθιστούμε σε τοπικό υπολογιστή, ώστε να μπορούν να επικοινωνούν καθημερινά.

Πέρυσι είχαμε μια βουλευτή που, παρά το γεγονός ότι είχε χάσει τη φωνή της, ήθελε να συνεχίσει να εργάζεται στο Κογκρέσο και της επαναφέραμε τη φωνή. Ενα άλλο άτομο έχασε τη φωνή του πριν προλάβει να παντρευτεί και εργαστήκαμε για να την αποκαταστήσουμε, ώστε να κάνουν τον γάμο και να πουν όλα όσα ήθελαν να πουν όλο αυτόν τον χρόνο.

Επίσης εξετάζουμε πώς αυτή η τεχνολογία μπορεί να ενσωματωθεί στις συσκευές που χρησιμοποιούμε καθημερινά, όχι απαραίτητα μέσω του «Neuralink», αλλά ίσως μέσω ακουστικών, γυαλιών ή ακόμη και μιας νέας εκδοχής κολιέ ή μενταγιόν.

Πολλοί άνθρωποι χάνουν τη φωνή τους λόγω ALS ή καρκίνου του λαιμού και συνεργαζόμαστε μαζί τους για να αναδημιουργήσουμε την αρχική φωνή τους με βάση παλιές ηχογραφήσεις τους. Αυτό που κάνουμε είναι ότι την εγκαθιστούμε σε τοπικό υπολογιστή, ώστε να μπορούν να επικοινωνούν καθημερινά.

Ο βασικός στόχος είναι να μπορούμε να αλληλεπιδρούμε με την τεχνολογία με έναν πιο εύκολο και έξυπνο τρόπο, καταρρίπτοντας τα γλωσσικά εμπόδια. Θα μπορούσα, για παράδειγμα, να ταξιδέψω στην Αθήνα, να μιλήσω την ελληνική γλώσσα και ταυτόχρονα να επικοινωνώ με τους ανθρώπους γύρω μου με έναν εντελώς νέο τρόπο.

Ακόμη φανταστείτε να ταξιδεύετε και να έχετε έναν ειδικό στα ακουστικά σας, που να σας εξηγεί το περιβάλλον γύρω σας σε πραγματικό χρόνο. Θα μπορούσαμε να δώσουμε στους ταξιδιώτες πρόσβαση ακόμη και στα πιο απομακρυσμένα μέρη, συνδυάζοντας την τοπική γνώση και τις διαλέκτους με καθηλωτικές φωνητικές εμπειρίες. Ετσι οι άνθρωποι θα μπορούν να «βυθίζονται» στην ιστορία και στην κουλτούρα διαφορετικών νησιών και τόπων, μαθαίνοντας απευθείας από «ειδικούς» κάθε περιοχής.

– Ενα από τα ζητήματα των ημερών είναι ο ανταγωνισμός ΗΠΑ – Κίνας στην ανάπτυξη μοντέλων τεχνητής νοημοσύνης. Τι λείπει από την Ευρώπη για να ανταγωνιστεί ή ακόμη και να ηγηθεί σε αυτόν τον αγώνα;

– Ξεκινήσαμε την εταιρεία στην Ευρώπη και νομίζω ότι το σημείο που συχνά παραβλέπεται είναι ότι ενώ κάποιος μπορεί να ξεκινήσει από την Ευρώπη, δεν πρέπει να δημιουργεί μόνο για την Ευρώπη, αλλά για την παγκόσμια αγορά και να ανταγωνίζεται σε αυτήν. Γι’ αυτό πιστεύω ότι το πρώτο πράγμα που πρέπει να κάνουν οι εταιρείες σήμερα είναι να απευθύνονται σε αυτό το παγκόσμιο κοινό από την πρώτη στιγμή. Η τεχνητή νοημοσύνη καθιστά αυτό το εγχείρημα πιο εφικτό και μάλιστα νωρίτερα.

Δεύτερον, πιστεύω ότι (στην Ευρώπη) διαθέτουμε μερικά από τα πιο εκπληκτικά ταλέντα στον κόσμο: ανθρώπους φιλόδοξους, παθιασμένους, εξειδικευμένους και μερικά από τα καλύτερα πανεπιστήμια παγκοσμίως. Αυτοί οι άνθρωποι αναζητούν μια μεγάλη πρόκληση και θέλουν να εργαστούν σε μία από τις καλύτερες εταιρείες που υπάρχουν και είναι πρόθυμοι να αναλάβουν τον κίνδυνο.

Από την άλλη υπάρχει φυσικά η πρόκληση να χτιστεί η βάση των μοντέλων τεχνητής νοημοσύνης και εκεί η Ευρώπη σήμερα υστερεί, με εξαίρεση τον τομέα των φωνητικών μοντέλων όπου προηγούμαστε. Ομως υπάρχει επίσης το κομμάτι των εφαρμογών (apps), δηλαδή το πώς φέρνεις ένα μοντέλο στην παραγωγή. Εκεί η ευκαιρία είναι ακόμη μπροστά μας.

Το βασικό ζήτημα για να αξιοποιηθεί αυτή η ευκαιρία είναι αν μπορούμε να δημιουργήσουμε ένα ρυθμιστικό πλαίσιο που να διευκολύνει αυτή την εξέλιξη. Για παράδειγμα θα μπορούσαμε να έχουμε μια ενιαία, πραγματική «ψηφιακή αγορά» στην Ευρώπη, ώστε όταν αναπτύσσεις μια τεχνολογία, να μπορείς να τη φέρεις σε οποιαδήποτε αγορά και να μπορείς να προσλάβεις ανθρώπους με τον ίδιο τρόπο παντού και να έχεις τη διασφάλιση ότι οι νόμοι που πρέπει να ακολουθήσεις θα είναι περίπου οι ίδιοι.

Αντί να πληκτρολογούμε, θα μιλάμε στο e-Gov  

– Ολοκληρώνοντας τη συζήτησή μας, και με αφορμή την επίσκεψή σας στην Αθήνα, πώς βλέπετε το τεχνολογικό οικοσύστημα της Ελλάδας και τι περιέχει το μνημόνιο συνεργασίας (MoU) που υπογράψατε με την ελληνική κυβέρνηση; 

– (Στην εταιρεία) έχουμε μερικούς απίστευτους ανθρώπους από την Ελλάδα που ηγούνται μεγάλων τμημάτων της οργάνωσης. Ο ένας είναι ο Αγγελος που ηγείται της «ερευνητικής μηχανικής (research engineering)» για πολλά από τα μοντέλα μας. Και έχουμε και έναν Ελληνοκύπριο που ηγείται της «μηχανικής ανάπτυξης (deployment engineering)». 

Σχετικά με το μνημόνιο συνεργασίας (MoU) με την ελληνική κυβέρνηση είμαστε πολύ ενθουσιασμένοι που κάνουμε αυτό το βαθύτερο βήμα στην επένδυσή μας στο ελληνικό οικοσύστημα και προσλαμβάνουμε ταλέντα με γρήγορους ρυθμούς. Αλληλεπιδρούμε με τις κυβερνητικές υπηρεσίες σε εβδομαδιαία, μηνιαία και ετήσια βάση και αυτό που κάνουμε είναι ότι προωθούμε δωρεάν υπηρεσίες σε τρεις βασικούς πυλώνες. 

Ο πρώτος είναι οι «ψηφιακές υπηρεσίες». Βοηθάμε στην ενσωμάτωση της φωνητικής τεχνητής νοημοσύνης στην πλατφόρμα «e-Government». Ετσι, οι 2.200 υπηρεσίες με την πάροδο του χρόνου θα έχουν τη δυνατότητα φωνητικής αλληλεπίδρασης. Ετσι, όταν καλείτε και θέλετε να ρωτήσετε για προγράμματα που είναι διαθέσιμα για απασχόληση ή ποια είναι η πολιτική για τις βίζες ώστε να ταξιδέψετε εκτός της χώρας, θα λαμβάνετε άμεσα πληροφορίες. Επίσης θα διεκπεραιώνετε τα ραντεβού σας πιο γρήγορα και θα λαμβάνετε υπενθυμίσεις γι’ αυτά. 

Ο δεύτερος τομέας είναι ο τουρισμός. Βοηθάμε στη βελτίωση μέρους της ψηφιακής τουριστικής υποδομής με τα φωνητικά μοντέλα. Για παράδειγμα, κάποιος στο τηλέφωνό σας θα σας λέει περισσότερα για το πού βρίσκεστε και πώς να ζήσετε την εμπειρία με καλύτερο τρόπο. 

Ο τρίτος είναι η διατήρηση του ελληνικού πολιτισμού. Εχετε αρκετές διαφορετικές γλώσσες και διαλέκτους και υπάρχει μια μεγάλη ποικιλία στο πόσο διαφορετικά μπορεί να ακούγονται. Αυτό που προσπαθούμε να κάνουμε είναι να διασφαλίσουμε ότι δημιουργούμε μοντέλα που το σέβονται αυτό και τα διατηρούν για τους επόμενους αιώνες εργασίας. Και είναι απλά υπέροχο να συνεργάζεσαι με την ομάδα γύρω από την κυβέρνηση, που είναι εξαιρετικά προοδευτική. 

comment-below Λάβετε μέρος στη συζήτηση 0 Εγγραφείτε για να διαβάσετε τα σχόλια ή
βρείτε τη συνδρομή που σας ταιριάζει για να σχολιάσετε.
Για να σχολιάσετε, επιλέξτε τη συνδρομή που σας ταιριάζει. Παρακαλούμε σχολιάστε με σεβασμό προς την δημοσιογραφική ομάδα και την κοινότητα της «Κ».
Σχολιάζοντας συμφωνείτε με τους όρους χρήσης.
Εγγραφή Συνδρομή

Editor’s Pick

ΤΙ ΔΙΑΒΑΖΟΥΝ ΟΙ ΣΥΝΔΡΟΜΗΤΕΣ

MHT