Το καλοκαίρι κοιμάμαι δύσκολα. Και όταν δεν κοιμάμαι κάθομαι στον υπολογιστή και ψάχνω καινούργια πράγματα. Και αυτήν την εβδομάδα έχω να μοιραστώ πολλά μαζί σας.
Τι ήθελα; Να βρω έναν τρόπο να κάνω απομαγνητοφώνηση. Φυσικά και υπάρχουν εξαιρετικές υπηρεσίες speech to text, ιδιαίτερα εξελιγμένες που κάνουν άριστα τη δουλειά τους. Όμως απαιτούν συνδρομή, την οποία δεν ήθελα να πάρω μόνο και μόνο για μερικές φορές που θα τη χρειαστώ.
Ένα disclaimer πρώτα: είμαι φριχτή στον προγραμματισμό. Ξέρω λίγο απ' όλα (ελάχιστο απ' όλα) και είμαι από εκείνους που ξέρουν να «διαβάζουν» κάπως τον κώδικα αλλά σίγουρα όχι να τον γράφουν. Τι σημαίνει αυτό; Ότι, για παράδειγμα, μπορώ να μπω στον κώδικα και ν' αλλάξω το χρώμα των γραμμάτων ενός site. Όχι ότι χρειάζεται πια, γιατί τώρα όλα είναι αυτοματοποιημένα. Αλλά καταλαβαίνετε τι θέλω να πω.
Είχα ακούσει για το Whisper, το εργαλείο της OpenAI, που μας έδωσε το ChatGPT, και είπα να το δοκιμάσω. Έλα όμως που δεν ξέρω ούτε Python, ούτε μπορώ να δώσω «εντολές» στα windows. Καταλαβαίνετε όλοι φαντάζομαι τι έκανα: ζήτησα από το ChatGPT να μου δώσει αναλυτικές οδηγίες. Και κάθε μήνυμα «λάθους» που έπαιρνα, του το έδινα για να με κατευθύνει. Η μία άγρυπνη νύχτα πέρασε, έτσι, με την εγκατάσταση.
Την επόμενη, ξεκίνησα από τα βαθιά, του ζήτησα να απομαγνητοφωνήσει ελληνικό κείμενο. Είχα μια ηχογραφημένη εισαγωγή για την εκπομπή μου στο Πρώτο Πρόγραμμα, γεμάτη λάθη κιόλας. Ξεκίνησε κι αυτό το δόλιο, το οποίο όμως δηλώνει ρητά ότι δουλεύει στα ελληνικά, και μου έβγαλε κάτι που έμοιαζε με το εξής: «Καλοκέρι είναι το ξέρω, είναι πιο δύ πόδο και πέρα, θα βάζουμε και πιο πολύ μουσική, έτσι όσο γίνεται πιο καλοκέρινη μουσική, θα πέξουμε και λίγο έτσι εκεί προς τον άβγου, θα θα πέξουμε και μερικά ελληνικά καλοκέρινά τα κατραγούδια που ξέρω, τ' σας αρέσουν πολύ. Έτσι όσθε να γίνεται όσο πιο ευχάριστε η ώρα αφτή, ελπίζω να μας ακούτε από την παραλία ή από το βουνό».
Δοκίμασα και την πιο «αργή» απομαγνητοφώνηση, τα αποτελέσματα δεν ήταν όμως διαφορετικά. Τζίφος.
Την επόμενη μέρα το πήγα από την αρχή και εκ του ασφαλούς με την απομαγνητοφώνηση, ήταν μια συνέντευξη στα αγγλικά. Για 35 λεπτά συνέντευξης του πήρε περίπου 3,5 ώρες. Τέλεια σχεδόν η απομαγνητοφώνηση, αλλά σε τόση ώρα, μόνη μου θα είχα κάνει και τη μετάφραση στα ελληνικά και θα ήταν στον δρόμο για τυπογραφείο. Δοκίμασα και τη «γρήγορη» απομαγνητοφώνηση, η οποία είχε διάρκεια μόνο μισή ώρα και τ' αποτελέσματα ήταν εξίσου καλά. Νύχτα επίσης επιτυχημένη!
Στη συνέχεια δοκίμασα κάτι διαφορετικό. Να βάλω το «παλαβό» κείμενο στο ChatGPT και να δω τι μπορεί να καταλάβει. Ορίστε το αποτέλεσμα: «Καλοκαίρι είναι - το ξέρω. Οπότε θα το ρίξουμε και λίγο στη μουσική. Θα παίζουμε περισσότερο, πιο καλοκαιρινά τραγούδια, να είναι η ώρα μας όσο πιο ευχάριστη γίνεται. Κι εκεί κοντά στον Αύγουστο, θα βάλουμε και κάποια ωραία ελληνικά καλοκαιρινά - ξέρω ότι τα αγαπάτε ιδιαίτερα. Ελπίζω να μας ακούτε από την παραλία, από το βουνό ή απ' όπου κι αν βρίσκεστε.». Όχι κι άσχημα. Αλλά δεν είναι αυτό που είπα λέξη-λέξη. Και σε μια συνέντευξη αυτό θα μπορούσε να είναι κομβικής σημασίας. Αρκεί όμως ν' ακούσεις τη συνέντευξη άλλη μία φορά και να διορθώσεις τα λάθη του. Θα το κάνει κάποιος όμως; Ή θα το αφήσει στο περίπου του ChatGPT;
Για τα ελληνικά δεν πείστηκα. Για τα αγγλικά δεν το συζητάω, ενθουσιάστηκα. Θα το δοκιμάσω και με γαλλικά και θα σας πω.
Για την τελική συνέντευξη θα τα πούμε την άλλη εβδομάδα γιατί έχει ακόμα πολύ δρόμο μπροστά της μέχρι να ολοκληρωθεί. Αυτό που προσπαθούσα να κάνω είναι να βρω μια «ροή εργασίας», ένα μοντέλο που θα μπορείς να το ακολουθείς κάθε φορά ώστε να κάνεις τη δουλειά γρηγορότερα αλλά σωστά, άρα ήθελα όλες τις εναλλακτικές και τις ορθές πρακτικές, το ορθές βάλτε το με κεφαλαία γιατί του χρόνου θα το διδάξω και στους φοιτητές μου.