Η Ελευθερία Σωκράτους σε συνεργασία με τον γλωσσολόγο Σπύρο Αρμοστή και την εικαστικό Αλεξία Αχιλλέως, παρουσιάζει το βιβλίον «ΑΠΟαποικιοΠΟΙΗΣΗ: Γλωσσοπλάσματα που μηχανές τζ̆αι πλάσματα».
Eννιά Κύπριοι/ες λογοτέχνες/ιδες εκπαιδευτήκαν από τον γλωσσολόγο Σπύρο Αρμοστή να γράφουν στην κυπριακή ελληνική με ένα ομοιογενοποιημένο τρόπο. Με τα κείμενα που έγραφαν κάθε εβδομάδα για τέσσερις μήνες, κτίστηκε μια βάση δεδομένων όπου ένα μοντέλο τεχνητής νοημοσύνης επεξεργασίας φυσικής γλώσσας, το πρόγραμμαν GPT-2, εκπαιδεύτηκε στο να μάθει να γράφει με τον ίδιο τρόπο.
Στο τέλος, οι συγγραφείς συνεργαστήκαν με το GPT-2 και συνέγραψαν κείμενα με κοινό σημείο αναφοράς την ερώτηση «Ίνταμπου καθορίζει έναν ανθρώπινον ον;».
Πώς προέκυψε η ιδέα για την έρευνα;
Ελευθερία: Ο σπόρος για τη σύλληψη της ιδέας φυτεύτηκε στο μυαλό μου όταν πρόσφατα διάβασα το Homo Deus του συγγραφέα Yuval Noah Harrari, ένα βιβλίο που εξετάζει το επόμενο είδος ανθρώπων (ανθρώπων θεών) μέσω της σχέσης τους —μεταξύ άλλων— με την τεχνολογία. Την ίδια εποχή, η Αλεξία Αχιλλέως παρουσίασε στο φεστιβάλ «Σύναξη» σε συνεργασία με την περφόρμερ Στυλιάνα Αποστόλου το έργο «Genesis», στο οποίο είχε χρησιμοποιήσει το σύστημα GPT-2 για να παραγάγει το κείμενο της περφόρμανς στα αγγλικά. Μετά την περφόρμανς, την προσέγγισα και συζητήσαμε διεξοδικά το ενδεχόμενο να υλοποιήσουμε ένα καινούργιο πρότζεκτ που να εκπαιδεύει το GPT-2 να μιλά κυπριακά. Έπειτα ξεκίνησε το ψάξιμο για ενδιαφερόμενους συγγραφείς αλλά και για κάποιον/α μέντορα της κυπριακής ελληνικής, αφού η ομοιογένεια της γραφής ήταν απαραίτητη προϋπόθεση. Τον ρόλο αυτόν ανέλαβε ο γλωσσολόγος Σπύρος Αρμοστής, ο οποίος ειδικεύεται σε θέματα γραπτής αποτύπωσης της κυπριακής ελληνικής. Οι συγγραφείς οι οποίοι έλαβαν μέρος στο έργο ήταν ο Μάριος Κωνσταντίνου, η Ράνια Ιακώβου, η Νάγια Τ. Καρακώστα, η Σόνια Χριστοφή, ο Αντώνης Γεωργίου, ο Μιχάλης Βρυωνίδης, η Κωνσταντίνα Ιωαννίδου, η Μαρία Α. Ιωάννου και η Άρτεμις Ευαγόρου. Αν και οι περισσότεροι απ’ αυτούς δεν είχαν εκτενή πείρα στη γραφή της κυπριακής, το ενδεχόμενο αυτό τους ενδιέφερε ιδιαίτερα, ενώ το πρόγραμμά μας αποτέλεσε ένα ασφαλές πλαίσιο να ασχοληθούν με αυτό, αφού θα τους παρείχαμε τη στήριξη και τα εργαλεία.
Γιατί τώρα;
Αλεξία: Η Τεχνητή Νοημοσύνη (TN) είναι ήδη μέρος της καθημερινότητάς μας. Από συστάσεις φίλων στα Μέσα Κοινωνικής Δικτύωσης μέχρι αιτήσεις τραπεζικού δανείου, οι αλγόριθμοι της TN αναλύουν τα δεδομένα μας και λαμβάνουν αποφάσεις για εμάς, κάτι που επιφέρει πολλαπλά οφέλη, για παράδειγμα στον τομέα της ιατρικής. Ωστόσο, η χρήση τέτοιων μοντέλων ΤΝ εγείρει ηθικά ζητήματα, καθώς αυτά αντικατοπτρίζουν την ποιότητα των δεδομένων στα οποία έχουν εκπαιδευτεί: η χρήση σωμάτων κειμένων αλιευμένων από το διαδίκτυο έχει αποδειχθεί πως είναι μεροληπτική, καθώς αναπαράγει τις αξίες και την κοσμοθεωρία που υπάρχει σε αυτό· μη όντας το διαδίκτυο μια δημοκρατική πλατφόρμα ισότητας, αλλά ένας χώρος πατριαρχικών, ηγεμονικών αφηγήσεων με επίκεντρο τις ΗΠΑ, επιδεινώνει υπάρχουσες ανισότητες και περιθωριοποιεί ακόμη περισσότερο μη κυρίαρχες ομάδες. Αυτός είναι ο λόγος για τον οποίο ακόμη και οι τεχνολογίες, όπως το πρόσφατο ChatGPT, έχουν ρατσιστικές και σεξιστικές προκαταλήψεις τις οποίες οι δημιουργοί του εργάζονται σκληρά για να διορθώσουν.
Επιπλέον, καθώς είναι μια τεχνολογία που απαιτεί τεράστιους πόρους και τεχνολογικές δυνατότητες για να αναπτυχθεί, να λειτουργήσει και να διατηρηθεί, συγκεντρώνει ολοένα και περισσότερο την εξουσία στα χέρια μιας μικρής μειοψηφίας και συγκεκριμένα σε υπερδυνάμεις της TN, όπως οι ΗΠΑ αλλά και ιδιωτικές εταιρείες όπως η Google, η Amazon κ.λπ. Ως νέα μορφή αποικιοκρατίας, αντλεί αξία από περιοχές με λιγότερη τεχνολογική υποδομή ή τεχνογνωσία. Μικρές χώρες στην περιφέρεια του οικοσυστήματος ανάπτυξης της TN, όπως η Κύπρος, δεν είναι σε θέση να ανταγωνιστούν και εξαρτώνται από τις τεχνολογίες των υπερδυνάμεων της TN και τις αξίες που είναι ενσωματωμένες σε αυτές, χωρίς να έχουν τη δύναμη να έχουν λόγο. Εκτός από την τεχνολογική εξάρτηση, η τεχνολογική αποικιοκρατία μπορεί επίσης να λάβει τη μορφή συλλογής δεδομένων από πολίτες χωρίς τη συγκατάθεσή τους για κέρδος, αλλά και πολιτικής επιρροής, χρησιμοποιώντας TN για να ασκήσει επιρροή σε άλλες περιοχές (π.χ. ο αντίκτυπος του Facebook στη βρετανική πολιτική και τη γενοκτονία των Ροχίνγκια στη Μιανμάρ).
Καθώς οι τεχνολογίες TN γίνονται ολοένα και περισσότερο μέρος της κυπριακής πραγματικότητας, είναι σημαντικό να αρχίσουμε να συζητάμε για τις κοινωνικές, πολιτικές και πολιτισμικές επιπτώσεις που μπορεί να έχει η τεχνητή νοημοσύνη στην Κύπρο, ενώ ταυτόχρονα να βρούμε τρόπους να αποαποικιοποιήσουμε την τεχνολογία αυτήν προς ενδυνάμωση και δικαιοσύνη σε τοπικό, κυπριακό πλαίσιο.
Τι είναι τα γλωσσοπλάσματα;
Ελευθερία: Η λέξη αυτή προέκυψε όταν οι τρεις μας ως επιμελητές του βιβλίου προσπαθούσαμε να βρούμε υπότιτλο για το βιβλίο, καθώς ο τίτλος «ΑΠΟαποικιοΠΟΙΗΣΗ» δεν ήταν από μόνος του διαφανής ως προς το περιεχόμενο του βιβλίου. Μετά από πολλή ιδεοθύελλα, μας προέκυψε η λέξη «γλωσσοπλάσματα»: τα κείμενα που έπλαθε η ΤΝ αποτελούνταν εν πολλοίς από ανύπαρκτες λέξεις, αφού λειτουργούσε ως γλωσσοπλάστης κάνοντας γλωσσοπλασίες, το αποτέλεσμα των οποίων είναι… γλωσσοπλάσματα, κείμενα δηλαδή γραμμένα από τη μηχανή, αλλά και από άσιλα πλάσματα.
Πώς έγινε η συνεργασία του GPT-2 με τους συγγραφείς;
Αλεξία: Σε αντίθεση με τα «παραδοσιακά» λογισμικά, όπου δίνονται συγκεκριμένες οδηγίες στο πρόγραμμα για την εκτέλεση εργασιών, η ΤΝ «μαθαίνει» αναλύοντας στατιστικά τεράστιες ποσότητες δεδομένων. Το μοντέλο ΤΝ αναλύει στατιστικά τα δεδομένα και βρίσκει μοτίβα, τα οποία στη συνέχεια του επιτρέπουν να δημιουργήσει νέο, συνθετικό κείμενο με βάση το στιλ των δεδομένων που του δόθηκαν. Στην περίπτωσή μας, το GPT-2 (το μοντέλο ΤΝ που χρησιμοποιήσαμε) εκπαιδεύτηκε να δημιουργεί νέο συνθετικό κείμενο στα κυπριακά. Σύμφωνα με την εταιρεία OpenAI, τους δημιουργούς του GPT-2, ο στόχος του μοντέλου είναι να προβλέπει την επόμενη λέξη βάσει όλων των προηγούμενων λέξεων σε κάποιο κείμενο. Έτσι, μόλις εκπαιδεύσαμε το GPT-2, οι συγγραφείς μπόρεσαν να εισαγάγουν κείμενο της επιλογής τους, για να ανταποκριθεί το μοντέλο. Κάθε συγγραφέας ήταν ελεύθερος να αλληλεπιδράσει με το μοντέλο με όποιον τρόπο ήθελε. Για παράδειγμα, κάποιοι έδωσαν στο μοντέλο μια ερώτηση να απαντήσει, άλλοι εισήγαγαν μια λέξη, μια πρόταση ή μέρος μιας πρότασης για να συνεχίσει.
Αξιοσημείωτη είναι και η ίδια η διαδικασία εκπαίδευσης του GPT-2, που έγινε με τη συνεργασία των συγγραφέων. Μια πρόκληση αποτελούσε το γεγονός ότι δεν υπάρχει «επίσημος» ομοιογενής τρόπος γραφής της κυπριακής ελληνικής, γι’ αυτό και όλοι γράφουμε τα κυπριακά με διαφορετικούς τρόπους. Για μια μηχανή που λειτουργεί με στατιστική ανάλυση και μοτίβα, τα «τζαι», «τζ̆αι» και «τζιαι» είναι όλες διαφορετικές λέξεις, κάτι που θα εμπόδιζε τη διαδικασία εκπαίδευσής της. Γι’ αυτό ήταν τόσο σημαντικό η ΤΝ να εκπαιδευτεί με ένα ορθογραφικά ομογενοποιημένο σώμα κειμένων.
Σημαντικά ήταν και τα ηθικά θέματα όσον αφορά τη διαδικασία δημιουργίας δεδομένων για την εκπαίδευση του μοντέλου μας. Για το πρότζεκτ μας, αντί να ακολουθήσουμε την αποικιοκρατική πρακτική αλίευσης διαδικτυακών κειμένων για να εκπαιδεύσουμε το GPT-2, δημιουργήσαμε ένα δικό μας σύνολο δεδομένων ειδικά για τον σκοπό του πρότζεκτ. Για περίοδο τεσσάρων μηνών, καθένας από τους συμμετέχοντες του έργου έγραφε ένα νέο κείμενο στα κυπριακά σε εβδομαδιαία βάση. Τα κείμενα αυτά, μαζί με κείμενα γραμμένα από εθελοντές, συγκεντρώθηκαν στο τέλος και χρησιμοποιήθηκαν ως σύνολο δεδομένων για την εκπαίδευση του GPT-2. Είχαμε τη συγκατάθεση όλων των συγγραφέων να χρησιμοποιήσουμε τα κείμενά τους για αυτόν τον σκοπό. Για να αντιμετωπιστεί το προαναφερθέν ζήτημα των προκαταλήψεων που μπορεί να παρεισφρήσουν στα δεδομένα μας, τα κείμενα έτυχαν επιμέλειας από τους γλωσσολόγους Λίζα Σολωμού και Σπύρο Αρμοστή, τόσο για πιθανή προσβλητική γλώσσα όσο και για ομοιογενή ορθογραφία της κυπριακής ελληνικής. Και τέλος, για να αποφύγουμε την αναπαραγωγή ηγεμονικών αφηγήσεων, εξασφαλίσαμε μια ποικιλία φωνών μέσω της συμμετοχής μιας ποικιλόμορφης ομάδας συμμετεχόντων.
Τι ανακαλύψατε με αυτήν την έρευνα;
Ελευθερία: Εγώ προσωπικά ανακάλυψα πόσος φόβος υπάρχει στο να γράψουμε στα κυπριακά. Φόβος να κάνουμε λάθος, φόβος να μην κριθούμε χίπστερς ή νεοκύπριοι. Και επίσης πόσο μη συνηθισμένοι είμαστε να γράφουμε στα κυπριακά. Εγώ ξεκινώ συνέχεια με «τζ̆αι» και καταλήγω με «και». Επίσης, τώρα που έμαθα το «τζ̆αι» με την κουππούαν, οι άλλες εκδοχές μού φαίνονται λάθος.
Δηλαδή, τώρα με αυτό το εργαλείο θα μπορούμε να γράφουμε στα κυπριακά;
Σπύρος: Στη σελίδα του προγράμματός μας, μπορεί κανείς να βρει χρήσιμα εργαλεία για τη γραφή της κυπριακής, όπως πληκτρολόγια, διορθωτές κ.ά., τα οποία υποστήριξαν τη γραφή στην κυπριακή και που διατίθενται δωρεάν για το κοινό:
https://www.synergeio.org/apoapikiopiisiproject?lang=el
Πόσο διαφορετικοί θα ήταν οι Κύπριοι αν έγραφαν όπως μιλούσαν;
Σπύρος: Οι ελληνόφωνοι στην Κύπρο έχουμε την τύχη να είμαστε ομιλητές δύο μορφών της ελληνικής γλώσσας: της κυπριακής και της κοινής νέας ελληνικής. Ωστόσο, αποκτούμε εγγραμματισμό μόνο σε μια από τις δύο μορφές της ελληνικής, αφού μαθαίνουμε να γράφουμε αποκλειστικά στην κοινή. Αυτό στερεί σε κάποιον βαθμό τη «φωνή» μας, ειδικά αν μιλάμε για δημιουργική έκφραση, όπως στη λογοτεχνία, το θέατρο, το τραγούδι κ.ά. Όπως φάνηκε από τους συμμετέχοντες στο πρόγραμμα, αλλά και από καταξιωμένους Κύπριους λογοτέχνες, η επιλογή να γράφουν όπως μιλούν αποτέλεσε για τους ίδιους μια αποκάλυψη. Ήδη έχουμε μυθιστορήματα γραμμένα (εν μέρει ή εξολοκλήρου) στα κυπριακά που αποσπούν βραβεία σε Κύπρο, Ελλάδα και Ευρωπαϊκή Ένωση. Είναι χαρακτηριστικό μάλιστα πως οι ίδιοι αυτοί οι δημιουργοί έχουν την ανάγκη να γράφουν και να διαβάζουν και στην κοινή νεοελληνική. Οπότε, αν οι Κύπριοι γράφαμε όπως μιλάμε, αυτό δεν θα σήμαινε ότι θα περιορίζαμε την κοινή, ούτε ότι θα την αντικαθιστούσαμε με την κυπριακή. Θα σήμαινε κάτι πολύ σημαντικό: ότι θα είχαμε ακόμη μια επιλογή στο πώς μπορούμε να εκφραστούμε γραπτώς, μια επιλογή που μας μιλά ακόμη πιο κοντά στην καρδιά. Θα σήμαινε πως θα απαλλαγόμασταν από όλα αυτά τα ενοχικά σύνδρομα για τη χρήση του μητρικού μας γλωσσικού κώδικα στη δημόσια σφαίρα —ενοχικά σύνδρομα που οδηγούν εν τέλει και σε κόμπιασμα κατά τη χρήση της ίδιας της κοινής και προβλήματα κατά την εκμάθησή της στο σχολείο. Οι επιστημονικές έρευνες σε Κύπρο, αλλά και παγκόσμια, έχουν δείξει πως όταν το σχολείο αξιοποιεί τη μητρική διάλεκτο των παιδιών ως γλωσσικό κεφάλαιο (αντί να την απαγορεύει), τα παιδιά μαθαίνουν καλύτερα την επίσημη γλώσσα και έχουν καλύτερες ακαδημαϊκές επιδόσεις. Ακόμη και σε γνωσιακό επίπεδο, υποστηρίζεται σε έρευνες πως υπάρχουν πλεονεκτήματα από τη χρήση δύο γλωσσών, ή ακόμα και δύο μορφών της ίδιας γλώσσας. Επομένως, το να μπορούμε να γράφουμε και όπως μιλούμε, αλλά και στην κοινή (και σε άλλες γλώσσες), μόνο πλούτος μπορεί να είναι.
* Η έκδοση θα παρουσιαστεί την Τρίτη 28 Φεβρουαρίου στις 6.30μμ στον Πολυχώρο Συνεργείο, Οδός Ελευθερίας 91β, Λεμεσός. Ομιλητές θα είναι οι Ελευθερία Σωκράτους: Συντονίστρια του έργου, Σπύρος Αρμοστής: Γλωσσολόγος, υπεύθυνος των γλωσσολογικών θεμάτων στην έκδοση. Αλεξία Αχιλλέως: Καλλιτέχνης, υπεύθυνη θεμάτων τεχνητής νοημοσύνης στη έκδοση. Μαρία Α. Ιωάννου: Συγγραφέας συμμετέχουσα στο έργο. Λουκία Ταξιτάρη: Γλωσσολόγος, Πανεπιστήμιον Νεάπολις Πάφος. Περισσότερες πληροφορίες www.synergeio.org.