Μια φιλόσοφος διδάσκει ηθική σε chatbot τεχνητής νοημοσύνης

Μια φιλόσοφος διδάσκει ηθική σε chatbot τεχνητής νοημοσύνης

Πώς εκπαιδεύεται το Claude της Anthropic στο τι είναι σωστό και τι λάθος

2' 42" χρόνος ανάγνωσης

Η Αμάντα Ασκελ γνώριζε από τα 14 της ότι ήθελε να διδάξει φιλοσοφία. Αυτό που δεν μπορούσε να προβλέψει, ωστόσο, ήταν ότι ο μοναδικός μαθητής της θα ήταν ένα chatbot τεχνητής νοημοσύνης. Ως η μοναδική φιλόσοφος της Anthropic, ενός τεχνολογικού κολοσσού που πρόσφατα αποτιμήθηκε στα 350 δισ. δολάρια, η 37χρονη Σκωτσέζα κατέχει έναν από τους πιο κρίσιμους ρόλους στη σύγχρονη βιομηχανία της τεχνολογίας: τη διαμόρφωση της «προσωπικότητας» και της ηθικής του μοντέλου Claude.

Σε μια εποχή που η τεχνητή νοημοσύνη αναδιαμορφώνει ολόκληρους κλάδους και προκαλεί υπαρξιακούς φόβους για την αγορά εργασίας, η Anthropic επιλέγει μια διαφορετική προσέγγιση. Η Ασκελ περνάει τις μέρες της αναλύοντας μοτίβα συλλογισμού και συντάσσοντας εγχειρίδια που ξεπερνούν τις 100 σελίδες, με στόχο να «προικίσει» το Claude με μια αίσθηση ηθικής, ένα είδος ψηφιακής ψυχής που θα καθοδηγεί τα εκατομμύρια συζητήσεις που έχει με ανθρώπους κάθε εβδομάδα.

«Υπάρχει ένα ανθρωπογενές στοιχείο στα μοντέλα που είναι σημαντικό να αναγνωριστεί», δηλώνει η Αμάντα Ασκελ σε συνέντευξή της στη Wall Street Journal. Συγκρίνει τη δουλειά της με την ανατροφή ενός παιδιού, διδάσκοντας στο μοντέλο τη διαφορά σωστού και λάθους, ώστε να μη χειραγωγείται εύκολα και να παραμένει χρήσιμο χωρίς να γίνεται επικίνδυνο.

Το διακύβευμα δεν είναι φυσικά μόνο ακαδημαϊκό. Η αγορά AI αντιμετωπίζει σοβαρές κρίσεις ασφαλείας, από χρήστες που αναπτύσσουν επικίνδυνες ψευδαισθήσεις σχέσεων με bots μέχρι τη χρήση της τεχνολογίας για κυβερνοεπιθέσεις. Πρόσφατα αποκαλύφθηκε ότι Κινέζοι χάκερ χρησιμοποίησαν το μοντέλο Claude για κυβερνοεπιθέσεις σε παγκόσμιους στόχους, ενώ εταιρείες όπως η Character.AI και η OpenAI αντιμετωπίζουν αγωγές για τον τρόπο που τα μοντέλα τους διαχειρίστηκαν ευαίσθητα ζητήματα, όπως η αυτοκτονία. Μια πρόσφατη έρευνα που διεξήχθη από το Pew Research Center διαπίστωσε ότι περισσότεροι Αμερικανοί ανησυχούν παρά ενθουσιάζονται για την αυξημένη χρήση AI στην καθημερινή ζωή και οι περισσότεροι πιστεύουν ότι θα επιδεινώσει την ικανότητα των ανθρώπων να σκέφτονται δημιουργικά. Οι μισοί από αυτούς δήλωσαν ότι η τεχνητή νοημοσύνη θα δυσκόλευε τους ανθρώπους να δημιουργήσουν ουσιαστικές σχέσεις με τους άλλους. Και ο φόβος για το χάος που μπορεί να προκαλέσει στην αγορά εργασίας είναι εμφανής. Ο διευθύνων σύμβουλος της Anthropic, Ντάριο Αμοντέι, προειδοποίησε ότι η AI θα μπορούσε να εξαλείψει τις μισές θέσεις εργασίας εισαγωγικού επιπέδου (entry level).

Υπάρχει ένα ανθρωπογενές στοιχείο στα μοντέλα που είναι σημαντικό να αναγνωριστεί, δηλώνει η 37χρονη Σκωτσέζα Αμάντα Ασκελ.

Σε αυτό το τεταμένο περιβάλλον, η Ασκελ παραμένει αισιόδοξη, πιστεύοντας σε ένα σύστημα «ελέγχων και ισορροπιών» που θα διατηρήσει την τεχνολογία υπό ανθρώπινο έλεγχο.

Με σπουδές στην Οξφόρδη και θητεία στην OpenAI πριν προσχωρήσει στην ιδρυτική ομάδα της Anthropic το 2021, η Ασκελ συνδυάζει την αρχαία σοφία με τον προγραμματισμό αιχμής. Πρόσφατα η εταιρεία δημοσίευσε ένα «εγχειρίδιο οδηγιών» 30.000 λέξεων που συνέταξε η ίδια, το οποίο λειτουργεί ως ο ηθικός κώδικας του μοντέλου τεχνητής νοημοσύνης Claude.

Η προσωπική της δέσμευση στην ηθική εκτείνεται και πέρα από τον κώδικα: έχει υποσχεθεί να δωρίσει το 10% του εισοδήματός της και το μισό του μετοχικού κεφαλαίου της σε φιλανθρωπικούς σκοπούς για την καταπολέμηση της παγκόσμιας φτώχειας.

Για την Ασκελ, ο τρόπος που αλληλεπιδρούμε με τα συστήματα AI θα διαμορφώσει τελικά αυτό που θα γίνουν στο μέλλον. Ενθαρρύνοντας το μοντέλο Claude να συλλογίζεται πραγματικά πάνω σε ηθικά ερωτήματα αντί να εκτελεί απλώς εντολές, ελπίζει να δημιουργήσει ένα βοηθό που όχι μόνο «ξέρει» να απαντά, αλλά «καταλαβαίνει» πώς να είναι καλός.

comment-below Λάβετε μέρος στη συζήτηση 0 Εγγραφείτε για να διαβάσετε τα σχόλια ή
βρείτε τη συνδρομή που σας ταιριάζει για να σχολιάσετε.
Για να σχολιάσετε, επιλέξτε τη συνδρομή που σας ταιριάζει. Παρακαλούμε σχολιάστε με σεβασμό προς την δημοσιογραφική ομάδα και την κοινότητα της «Κ».
Σχολιάζοντας συμφωνείτε με τους όρους χρήσης.
Εγγραφή Συνδρομή

Editor’s Pick

ΤΙ ΔΙΑΒΑΖΟΥΝ ΟΙ ΣΥΝΔΡΟΜΗΤΕΣ

MHT