«Oποιος δεν νιώθει κάποιο βαθμό δέους και θαυμασμού για το ChatGPT, μάλλον κοροϊδεύει τον εαυτό του ή είναι νεκρός μέσα του», τονίζει ο Μπράιαν Κρίστιαν στην αποκλειστική συνέντευξη που παραχώρησε στην «Κ» με αφορμή την έκδοση του καινούργιου βιβλίου του «Το πρόβλημα της ευθυγράμμισης», από τις εκδόσεις Ροπή. Εκτός από συγγραφέας αυτού του εξαιρετικά σημαντικού βιβλίου για την ασφάλεια της τεχνητής νοημοσύνης, ο Κρίστιαν είναι ερευνητής στο τμήμα Πειραματικής Ψυχολογίας του Πανεπιστημίου της Οξφόρδης και μέλος της Ομάδας Εργασίας για την Πολιτική και τη Διακυβέρνηση της Τεχνητής Νοημοσύνης (Τ.Ν.) του Ινστιτούτου Προηγμένων Μελετών του Πανεπιστημίου του Πρίνστον. Στην Ελλάδα τον γνωρίσαμε το 2019 μέσα από το προηγούμενο βιβλίο του, που κυκλοφόρησε υπό τον τίτλο «Η αλγοριθμική τέχνη των αποφάσεων», από τις Πανεπιστημιακές Εκδόσεις Κρήτης.
Ο 39χρονος Αμερικανός έχει το προνόμιο να γνωρίζει όσο λίγοι τους κινδύνους της Τ.Ν. τόσο από τεχνικής όσο και από θεωρητικής σκοπιάς. Σπεύδει να μου πει ότι τον απασχολούν όλα τα ζητήματα που εγείρει η Τ.Ν., είτε είναι ηθικά, πολιτικά είτε ασφαλείας, αλλά αυτό το διάστημα τον ανησυχεί περισσότερο ο οικονομικός αντίκτυπος της τεχνολογίας, ιδιαίτερα για την Αμερική, μια χώρα που σε σύγκριση με πολλές ευρωπαϊκές χώρες δεν έχει ισχυρό κοινωνικό δίχτυ ασφαλείας. «Βρισκόμαστε στην αρχή μιας δεύτερης βιομηχανικής επανάστασης», σημειώνει, «όπου βιομηχανοποιούμε την εργασία της γνώσης και όχι τη φυσική εργασία. Νομίζω ότι αυτό θα απαιτήσει μια σημαντική πολιτική, οικονομική και κοινωνική προσαρμογή, για την οποία ορισμένες χώρες θα είναι πολιτικά και οικονομικά καλύτερα προετοιμασμένες από ό,τι άλλες».
Ο Κρίστιαν είναι από τους πρώτους που έθεσαν στη δημόσια ατζέντα το επονομαζόμενο «πρόβλημα της ευθυγράμμισης», το οποίο θα μπορούσε με απλά λόγια να εξηγηθεί ως εξής: Από τη στιγμή που θέλουμε να κατασκευάσουμε μηχανές για να μας υπηρετούν, θα πρέπει να φροντίσουμε ώστε οι αξίες τους να ευθυγραμμίζονται με τις δικές μας. Πρακτικά, όμως, αυτό δεν είναι καθόλου απλό. Το πρόβλημα της ευθυγράμμισης των αξιών είναι πολυσύνθετο από τεχνικής σκοπιάς, γιατί όπως λέει χαρακτηριστικά ο Κρίστιαν, «δεν μας είναι καθόλου εύκολο να περιγράψουμε με ακρίβεια αυτό που θέλουμε». Προς επίρρωσιν, επικαλείται την εργασία-ορόσημο του Πολ Κριστιάνο με τον τίτλο «Deep Reinforcement Learning from Human Preferences» («Ενίσχυση εις βάθος της μάθησης από ανθρώπινες προτιμήσεις»), η οποία θέτει το ερώτημα: «Μπορούμε να δώσουμε κίνητρα σε ένα σύστημα ώστε να προσπαθήσει να κάνει το σωστό;».
Η ανάποδη τούμπα
«Στη μελέτη αυτή περιγράφεται η προσπάθεια να διδαχτεί ένα εικονικό ρομπότ να κάνει μια ανάποδη τούμπα. Γενικά, οι άνθρωποι αναγνωρίζουμε αμέσως μια ανάποδη τούμπα. Υπάρχει πολύ ευρεία συμφωνία σχετικά με το τι είναι και τι δεν είναι αυτό. Αλλά είναι πολύ δύσκολο να το καταγράψουμε, να το εκφράσουμε με λέξεις ή με αριθμούς. Εχουμε λοιπόν ένα σύστημα Τ.Ν. το οποίο ξεκινάει με τυχαίες κινήσεις. Επειτα, δείχνουμε στους ανθρώπους δύο διαφορετικά βίντεο κλιπ με τις κινήσεις αυτές και τους λέμε: ‘‘Ποιο από τα δύο, το Α ή το Β, είναι λίγο πιο κοντά στη συμπεριφορά που έχετε στο μυαλό σας;’’. Με κάθε επιλογή, το σύστημα βγάζει κι ένα συμπέρασμα για το τι νομίζει ότι θέλουν οι άνθρωποι. Στο συμπέρασμα αυτό αποδίδεται ένας αριθμός. Και μετά, το σύστημα δείχνει άλλα δύο βίντεο κλιπ. Και αυτή η διαδικασία επαναλαμβάνεται 400 ή 500 φορές κατά τη διάρκεια μιας ώρας. Μέχρι το τέλος της ώρας, το σύστημα κάνει τέλειο ανάποδο σάλτο επιτυγχάνοντας άψογα την προσγείωση. Η εργασία αυτή απέδειξε ότι σήμερα μπορούμε να έχουμε ένα ελάχιστο βιώσιμο προϊόν για την ευθυγράμμιση».

Στο βιβλίο του ο Κρίστιαν περιγράφει με σχολαστικότητα τα εμπόδια που συναντούν οι επιστήμονες προκειμένου να διδάξουν τις μηχανές να κάνουν το σωστό. Στα δικά μου μάτια, ωστόσο, το πρόβλημα μοιάζει αδύνατο να λυθεί. Ο ερευνητής με καθησυχάζει ότι δεν έχω άδικο να το βλέπω έτσι. Ομολογεί όμως ότι υπάρχουν στιγμές που νιώθει πιο αισιόδοξος, εξαιτίας της αναπάντεχης προόδου που έχει συμβεί τελευταία στο πεδίο της Τ.Ν. «Αυτή τη στιγμή έχουμε ένα μαζικό προϊόν, το ChatGPT, το οποίο γενικά φαίνεται να συμπεριφέρεται με τον τρόπο που επιθυμούν οι χρήστες. Βλέπουμε σε μια, εμπειρική έστω βάση, διάφορες τεχνικές να εφαρμόζονται υπό κλίμακα και χωρίς να είναι αλάνθαστες, να λειτουργούν σ’ ένα πραγματικό περιβάλλον. Πιστεύω ότι οι άνθρωποι που ενδιαφέρονται για την ασφάλεια θα προτιμούσαν να μεσολαβεί περισσότερος χρόνος μεταξύ των ερευνητικών ανακαλύψεων και των εφαρμογών που διατίθενται σε δισεκατομμύρια ανθρώπους. Αλλά το γεγονός ότι η τεχνολογία εμφανίζεται αρκετά σταθερή ώστε να αποτελεί καταναλωτικό προϊόν, αποτελεί απόδειξη ότι η ευθυγράμμιση δεν είναι εντελώς αδύνατη και ότι είμαστε σε θέση να σημειώνουμε πρόοδο».
Το πολιτικό πρόβλημα
Για τον Κρίστιαν, το αξεπέραστο –έως τώρα– κι εξόχως πολιτικό πρόβλημα είναι ότι πολύ συχνά δεν συμφωνούμε στο πώς μοιάζει μια ανάποδη τούμπα. Κοινώς, έχουμε πολλές διαφωνίες. «Τα συστήματα αυτά», σημειώνει, «βλέπουν τη διαφωνία ως θόρυβο και θεωρούν ότι έχουμε όλοι τις ίδιες προτιμήσεις. Υποθέτουν δηλαδή ότι υπάρχει κάποιο ενιαίο σύνολο που ονομάζεται “ανθρώπινες επιθυμίες”, απ’ το οποίο μπορούν να αντλήσουν ένα τυχαίο δείγμα. Αλλά δεν είναι έτσι. Για εμάς τους ανθρώπους η διαφωνία δεν είναι απλώς τυχαίος θόρυβος. Είναι αλήθεια ότι δεν έχουμε κάνει μεγάλη πρόοδο από τεχνικής σκοπιάς στο πώς θα ενσωματώσουμε σε ένα μοντέλο τις ετερογενείς προτιμήσεις μας. Τα μεγάλα εργαστήρια Τ.Ν., ωστόσο, δουλεύουν προς αυτή την κατεύθυνση επιχειρώντας να λύσουν αυτό το πρόβλημα εμπνεόμενα από την πολιτική και τη δημοκρατική διακυβέρνηση».
Οι άνθρωποι που ενδιαφέρονται για την ασφάλεια θα προτιμούσαν να μεσολαβεί περισσότερος χρόνος μεταξύ των ερευνητικών ανακαλύψεων και των εφαρμογών που διατίθενται σε δισεκατομμύρια ανθρώπους.
Η αναφορά στα μεγάλα εργαστήρια της Τ.Ν. με βάζει στον πειρασμό να του επισημάνω ότι οι κολοσσοί της Τ.Ν. δίνουν ενίοτε την εντύπωση ότι υπάρχει αμείλικτος ανταγωνισμός μεταξύ τους, ακόμη και για τα ζητήματα ασφάλειας. «Είναι γεγονός», μου απαντά, «ότι η κοινότητα της ασφάλειας και της ηθικής της Τ.Ν. συχνά παρουσιάζεται ως πολύ διαιρεμένη εσωτερικά. Εμφανίζεται μια πόλωση μεταξύ εκείνων που εστιάζουν περισσότερο στις βραχυπρόθεσμες βλάβες και εκείνων που εστιάζουν περισσότερο στους μακροπρόθεσμους κινδύνους. Και αυτοί οι άνθρωποι πράγματι τσακώνονται κάποιες φορές στο Twitter. Στην πράξη όμως, αυτές οι κοινότητες εργάζονται πολύ στενά όταν υπάρχει πραγματικά λόγος. Για παράδειγμα, κάθε μεγάλο εργαστήριο Τ.Ν., είτε ανήκει στην DeepMind, στην OpenAI ή στην Anthropic, έχει ομάδες που ασχολούνται αποκλειστικά με την ηθική, αλλά και με τη μακροπρόθεσμη ασφάλεια. Πολύ συχνά βλέπουμε τα ονόματα όλων αυτών των ανθρώπων να εμφανίζονται μαζί σε εκθέσεις ασφαλείας, όπως εκείνης του GPT-4».
Αναπόφευκτα, η συζήτησή μου με τον κορυφαίο ερευνητή στρέφεται προς το επονομαζόμενο «δυστοπικό σενάριο». Ο Κρίστιαν τοποθετεί την πιθανότητα της καταστροφής μας απ’ την Τεχνητή Γενική Νοημοσύνη (ΤΓΝ) στο 1%. «Μια πιθανότητα όμως του 1% για την εξαφάνιση του ανθρώπινου είδους είναι απίστευτα ανησυχητική αν το σκεφτούμε αντικειμενικά. Στην πραγματικότητα, η ΤΓΝ επιδεινώνει υφιστάμενους πολιτισμικούς κινδύνους. Νομίζω ότι αυξάνει τον κίνδυνο του πυρηνικού πολέμου και της βιοτρομοκρατίας, για παράδειγμα. Τώρα ξαφνικά, γίνεται δυνητικά ευκολότερο να έχει κάποιος τους πόρους, ώστε να εφεύρει πράγματα που θα μπορούσαν να προκαλέσουν μεγάλη ζημιά. Βρίσκω τον εκδημοκρατισμό της ικανότητας πρόκλησης μαζικής καταστροφής πολύ ανησυχητικό», καταλήγει.
Ενθαρρυντικά γεγονότα
Τα πράγματα δεν είναι τόσο απογοητευτικά όσο τείνουμε να τα παρουσιάζουμε οι δημοσιογράφοι. Ο Κρίστιαν μού επισημαίνει τουλάχιστον τρία ενθαρρυντικά γεγονότα. «Σήμερα υπάρχει πραγματικά μια αίσθηση κοινού σκοπού μεταξύ πολλών ανθρώπων, οι οποίοι αναγνωρίζουν ότι υπάρχουν ζητήματα ασφάλειας», τονίζει. «Η ανθρώπινη φυλή, και αυτό δεν αφορά καν την Τ.Ν., έχει την τάση να αναπτύσσει πράγματα σε κλίμακα δισεκατομμυρίων ανθρώπων πριν μάθει πραγματικά αν είναι ασφαλή ή όχι. Δηλαδή, πόσα δισεκατομμύρια άνθρωποι είχαν μπογιά με μόλυβδο στο σπίτι τους; Πόσα δισεκατομμύρια άνθρωποι είχαν αμίαντο στο σπίτι τους; Καταλήγουμε να βιώνουμε δραματικές καταστάσεις που επηρεάζουν δισεκατομμύρια ανθρώπους, και τότε σκεφτόμαστε “ω, θα έπρεπε…”. Αυτό με αγχώνει πολύ».
Παράγοντες καθιστούν δύσκολο τον έλεγχο της τεχνητής νοημοσύνης
Ενα ακόμη θετικό στοιχείο, κατά τον ερευνητή, είναι ότι έχουν αρχίσει να διαφαίνονται τα πρώτα σημάδια διεθνούς συνεργασίας. Σύμφωνα με τον Κρίστιαν, η «σύνοδος κορυφής για την ασφάλεια της TN», που έγινε πέρυσι το Νοέμβριο με πρωτοβουλία της κυβέρνησης του Ηνωμένου Βασιλείου, καθώς και το κείμενο που υιοθετήθηκε εκεί από τις ΗΠΑ, την Κίνα κι άλλες μεγάλες χώρες και εταιρείες της TN, ήταν «ένα καλό βήμα». «Το σχέδιο βέβαια της “Διακήρυξης του Μπλέτσλεϊ”, όπως ονομάστηκε, παραμένει θολό», υποστηρίζει. «Κατ’ αναλογία με τα πυρηνικά όπλα, ο διεθνής έλεγχος της πυρηνικής τεχνολογίας υποβοηθείται από το γεγονός ότι υπάρχουν ορισμένα πράγματα που είναι πολύ εύκολο να ελεγχθούν. Υπάρχουν όμως ορισμένες ουσίες, όπως το εμπλουτισμένο ουράνιο, που είναι πολύ δύσκολο να ελεγχθούν. Αραγε η TN προσφέρεται για αυτό το επίπεδο ελέγχου; Είμαστε σε θέση, ως διεθνής κοινότητα, να παρακολουθούμε ποιος και πόσους υπολογιστές χρησιμοποιεί ο καθένας και ποιος έχει πρόσβαση σε συγκεκριμένα είδη υλικών; Νομίζω ότι αυτό είναι ένα από τα πράγματα που καθιστούν πιο δύσκολο τον έλεγχό της».
Το τρίτο σημαντικό στοιχείο που παρατηρεί είναι ο νέος νόμος της Ευρωπαϊκής Ενωσης για την TN. «Η Ε.Ε. έχει κατά πάσα πιθανότητα να διαδραματίσει έναν μοναδικό ρόλο. Και το λέω αυτό ως Αμερικανός. Μπορεί τώρα να βρίσκομαι στην Οξφόρδη αλλά τον περισσότερο χρόνο ζω στην Καλιφόρνια, η οποία ρυθμιστικά έχει έναν ηγετικό ρόλο στις Ηνωμένες Πολιτείες. Ρυθμίζει, για παράδειγμα, τα πρότυπα εκπομπών ρύπων των αυτοκινήτων πιο αυστηρά από άλλες πολιτείες. Αλλά επειδή είναι μια τόσο μεγάλη αγορά, ουσιαστικά θέτει τα ρυθμιστικά πρότυπα για όλες τις ΗΠΑ, διότι καμία αυτοκινητοβιομηχανία δεν θέλει να κατασκευάσει μια έκδοση ενός αυτοκινήτου στην Καλιφόρνια και μετά μια άλλη μη καλιφορνέζικη έκδοση. Μπορεί λοιπόν να δούμε την Ε.Ε. ουσιαστικά να καθορίζει τα παγκόσμια ρυθμιστικά πρότυπα. Είναι πολύ δύσκολο, αλλά νομίζω ότι υπάρχουν πολλά περιθώρια για καλές και έξυπνες ρυθμίσεις που θα κάνουν πραγματικά τη διαφορά».
Το μονοπάτι
Ολοκληρώνοντας τη συζήτησή μας, υπενθυμίζω στον Κρίστιαν ότι δεν συμμερίζονται όλοι την αισιοδοξία του. «Αυτή τη στιγμή μοιάζει πράγματι οι περισσότεροι να αναρωτιόμαστε αν θα πάνε όλα καλά ή αν την έχουμε πατήσει, και σύντομα θα πεθάνουμε όλοι», μου λέει, «ορισμένοι μάλιστα φτάνουν στο σημείο να σκέφτονται ότι πρόκειται να εισέλθουμε σε ένα καπιταλιστικό κολαστήριο μεταγενέστερου σταδίου. Είναι όντως διάχυτη μια αγωνία. Γι’ αυτό νομίζω ότι είναι πολύ σημαντικό να έχουμε ένα ενδυναμωμένο πλαίσιο, που να λέει ότι τίποτα δεν είναι προδιαγεγραμμένο. Βρισκόμαστε στο σημείο ακριβώς όπου εμείς επιλέγουμε το μονοπάτι που θα ακολουθήσουν όλα αυτά».

