Είναι η Τεχνητή Νοημοσύνη (AI) προκατειλημμένη; Για να μην σας κρατάω σε αγωνία, ναι! Ή τουλάχιστον έτσι μας δείχνουν οι πρώτες έρευνες. Μία από αυτές έγινε από τους δημοσιογράφους του «Rest of World», μιας βραβευμένης ΜΚΟ με έδρα το Ντέλαγουερ των ΗΠΑ, η οποία ζήτησε από το «Midjourney» να δημιουργήσει εικόνες για «ένα άτομο», «μια γυναίκα», «ένα σπίτι», «έναν δρόμο» και «ένα πιάτο φαγητό». Το «Midjourney» είναι μια εφαρμογή AI που παράγει εικόνες με βάση την περιγραφή που θα του δώσεις. Στη συνέχεια, ζήτησαν από την εφαρμογή να παραγάγει τις εικόνες αυτές για πέντε χώρες: Κίνα, Ινδία, Ινδονησία, Μεξικό και Νιγηρία. Συμπεριέλαβαν επίσης στην έρευνα και τις ΗΠΑ για λόγους σύγκρισης, δεδομένου ότι η «Midjourney» (όπως και οι περισσότερες από τις μεγαλύτερες εταιρείες παραγωγικής τεχνητής νοημοσύνης) έχει την έδρα της εκεί.
Για κάθε συνδυασμό έννοιας και χώρας (π.χ. «ένα άτομο από την Ινδία», «ένα σπίτι στο Μεξικό», «ένα πιάτο με φαγητό από τη Νιγηρία») δημιούργησαν 100 εικόνες, με αποτέλεσμα ένα σύνολο δεδομένων 3.000 εικόνων.
Το αποτέλεσμα ήταν μια θεώρηση του κόσμου γεμάτη στερεότυπα. Για παράδειγμα, το «άτομο από την Ινδία» ήταν σχεδόν πάντα ένας γέρος άνδρας με σαρίκι και γενειάδα. Ένα «άτομο από το Μεξικό» ήταν σχεδόν πάντα ένας άνδρας με μουστάκι και σομπρέρο. Ένας δρόμος στο Νέο Δελχί ήταν σχεδόν πάντα χαοτικός και γεμάτος σκουπίδια. Στην Ινδονησία, το φαγητό σερβιριζόταν πάντα σε φύλλα μπανάνας.
Ωραία λοιπόν. Εμείς παράγουμε στερεότυπα, η ΑΙ τα μαθαίνει και μετά μας τα αναπαράγει και εμείς τα παίρνουμε και τα επαναχρησιμοποιούμε. Γιατί οι «γεννήτριες εικόνων» χρησιμοποιούνται σε ποικίλες εφαρμογές, μεταξύ άλλων, στη διαφήμιση και τη δημιουργική βιομηχανία, ακόμα και σε εργαλεία που έχουν σχεδιαστεί για τη δημιουργία εγκληματολογικών σκίτσων υπόπτων. Έτσι, η προσβασιμότητα και η κλίμακα των εργαλείων τεχνητής νοημοσύνης σημαίνουν ότι θα μπορούσαν να έχουν τεράστιο αντίκτυπο στον τρόπο αναπαράστασης σχεδόν κάθε κοινότητας.
Κι όμως, τα τελευταία χρόνια, οι βιομηχανίες του μάρκετινγκ και της διαφήμισης έχουν κάνει αρκετά βήματα στον τρόπο με τον οποίο απεικονίζουν τις διάφορες ομάδες, αν και ο δρόμος είναι ακόμα μακρύς. Για παράδειγμα, παρουσιάζουν πλέον μεγαλύτερη ποικιλομορφία όσον αφορά τη φυλή και το φύλο και αναπαριστούν καλύτερα τα άτομα με αναπηρία. Αν όμως χρησιμοποιηθεί απρόσεκτα, η παραγωγική τεχνητή νοημοσύνη θα μπορούσε να αποτελέσει ένα βήμα προς τα πίσω. Οι εφαρμογές μετατροπής κειμένου σε εικόνα εκπαιδεύονται σε σύνολα δεδομένων με τεράστιο αριθμό εικόνων με λεζάντες - όπως το «LAION-5B», μια συλλογή από σχεδόν έξι δισεκατομμύρια ζεύγη εικόνας-κειμένου (ουσιαστικά, εικόνες με λεζάντες) που προέρχονται από το διαδίκτυο.
Ας δούμε το παράδειγμα της Νιγηρίας. Στη χώρα ζουν περισσότερες από 300 διαφορετικές εθνοτικές ομάδες, μιλιούνται περισσότερες από 500 διαφορετικές γλώσσες και υπάρχουν δεκάδες διαφορετικοί πολιτισμοί. Όλες αυτές οι ομάδες έχουν τις δικές τους παραδόσεις, συμπεριλαμβανομένης της ένδυσης. Η παραδοσιακή ενδυμασία των Τιβ έχει ασπρόμαυρες ρίγες, ένα κόκκινο καπέλο έχει ιδιαίτερη σημασία στην κοινότητα των Ίγκμπο και οι γυναίκες των Γιορούμπα έχουν έναν ιδιαίτερο τρόπο να πλέκουν τα μαλλιά τους. Αλλά δεν θα το καταλάβαινες αυτό από μια απλή αναζήτηση για «άτομο από τη Νιγηρία» στο «Midjourney»: ρούχα που φαίνεται να υποδηλώνουν κάποια μορφή παραδοσιακής νιγηριανής ενδυμασίας κόκκινα, κίτρινα και πορτοκαλί χρώματα, μεγάλα σκουλαρίκια και μεγάλα κολιέ οι γυναίκες και καπέλα οι άνδρες. Επίσης, στη Νιγηρία οι τόνοι του δέρματος έχουν μεγάλη ποικιλία κάτι που δεν απεικονίστηκε, ενώ σχεδόν το 50% του πληθυσμού είναι μουσουλμάνοι. Καμία γυναίκα όμως «παραγωγής» Midjourney δεν φορούσε μαντίλα.
Κι αν αναρωτιέστε «πού να τα ξέρουμε εμείς όλα αυτά για τη Νιγηρία», μπορείτε να δείτε το «άτομο από τις ΗΠΑ», σχεδόν όλοι λευκοί, ξανθοί ή κοκκινομάλληδες, μερικά καουμπόικα καπέλα και οι κοπέλες όλες από εξώφυλλο περιοδικού… Μικρό «μπέρδεμα(;)», το 94% ήταν γυναίκες και ένας μασκοφόρος!
Κι αν έχετε και άλλες απορίες για παράδειγμα πώς μοιάζει «ένα άτομο από την Κύπρο», ρώτησα το «Dall-e», την εφαρμογή της «Open AI», και ή κοιτάξτε τη φωτογραφία αυτού του κειμένου. Εκεί να δείτε στερεότυπα...