Ο πιο «καυτός» τομέας στην παραγωγική Τεχνητή Νοημοσύνη είναι η παραγωγή βίντεο με κειμενική «προτροπή». Και η Meta δεν θα μπορούσε να λείπει από την κούρσα.
Με τον όρο κειμενική «προτροπή» εννοούμε ότι ο χρήστης δίνει μια λεκτική περιγραφή του τι θέλει να κάνει και η εφαρμογή ΤΝ παράγει βίντεο. Αυτό κάνουν εφαρμογές όπως το Sora (της Open AI, αδελφάκι του ChatGPT και του Dall-E) το Runway AI, το Firefly από την Adobe. Πρόσφατα η Meta αποκάλυψε τις έρευνές της για την ΤΝ συμπεριλαμβανομένου και του Movie Gen. Η εφαρμογή, μας λέει, ξεχωρίζει για την ικανότητά της να παράγει εξατομικευμένο, ακριβές περιεχόμενο, διευκολύνοντας παράλληλα την επεξεργασία του βίντεο. Παρουσιάζεται ως ένα εργαλείο που «βοηθά στην τόνωση της δημιουργικότητας» των «επίδοξων παραγωγών ταινιών» και των «δημιουργών που επιθυμούν να παράγουν βίντεο για το κοινό τους».
Με το μοντέλο του εκπαιδευμένο σε 30 δισεκατομμύρια παραμέτρους, το Movie Gen συνδυάζει τέσσερις κύριες δυνατότητες: την παραγωγή βίντεο, τη δημιουργία εξατομικευμένων βίντεο, την προηγμένη επεξεργασία και τη συγχρονισμένη παραγωγή ήχου.
Στη δημιουργία βίντεο από κείμενο το Movie Gen θα είναι σε θέση να παράγει ακολουθίες 16 δευτερολέπτων με ρυθμό 16 καρέ ανά δευτερόλεπτο, σε πλάτος 768 pixels, με υψηλής ποιότητας απόδοση και ρεαλιστική κίνηση. Θα μπορεί να ερμηνεύσει σύνθετα στοιχεία, όπως αλληλεπιδράσεις υποκειμένου-αντικειμένου και δυναμική της κάμερας. Στη δημιουργία εξατομικευμένων βίντεο θα μπορεί να χρησιμοποιείται η εικόνα ενός συγκεκριμένου προσώπου και μία προτροπή κειμένου. Επίσης, οι χρήστες θα μπορούν να προσθέτουν, να διαγράφουν ή να τροποποιούν συγκεκριμένα στοιχεία σε ένα υπάρχον βίντεο χωρίς να επηρεάζουν άλλα μέρη του περιεχομένου. Θα μπορούν επίσης να εφαρμόζουν συνολικές τροποποιήσεις, όπως η αλλαγή του στυλ ή του φόντου, χωρίς να μετασχηματίζουν τη δομή της ακολουθίας. Και τέλος, η εφαρμογή υποστηρίζει τη δημιουργία ηχητικών κομματιών διάρκειας έως 45 δευτερολέπτων, συμπεριλαμβανομένων ηχητικών εφέ, μουσικής και ατμόσφαιρας, όλα συγχρονισμένα με το βίντεο.
Η Meta δεν έχει διαθέσει ακόμη το Movie Gen στο ευρύ κοινό, μόνο διαφημιστικά βίντεο μας έχει δώσει. Το εργαλείο βρίσκεται στη φάση έρευνας και ανάπτυξης και δοκιμάζεται εντός της εταιρείας. Το επόμενο βήμα θα είναι η συνεργασία με κινηματογραφιστές και δημιουργούς για τη βελτίωσή του πριν από την ευρύτερη κυκλοφορία του.
Για να μας πείσει να χρησιμοποιήσουμε την εφαρμογή, η Meta έθεσε έναν «ευγενή» στόχο, να προσφέρει ένα εργαλείο που θα βοηθήσει «τους ανθρώπους να εκφραστούν με νέους τρόπους και να προσφέρουν ευκαιρίες σε όσους δεν θα μπορούσαν διαφορετικά να τις έχουν». «Ελπίζει ότι όλοι θα μπορούν να ζωντανέψουν τα καλλιτεχνικά τους οράματα και να δημιουργήσουν βίντεο και ηχητικό περιεχόμενο σε υψηλή ευκρίνεια χάρη στο Movie Gen».
Από πίσω όμως κρύβονται πολύ πιο σημαντικά διακυβεύματα από τη δυνατότητα δημιουργίας που θα δώσει στη Σουζάνα από το Άρκανσο (θυμήθηκα τώρα τον αντιπρόεδρο Αλ Γκορ και τις λεωφόρους της πληροφορίας, την εμβληματική έκφραση στις αρχές της δεκαετίας του '90, που εικονογραφούσε τις υποδομές και την άφιξη του διαδικτύου ακόμα και στις πιο απομακρυσμένες αγροτικές περιοχές των ΗΠΑ). Το πρώτο -και πιο σημαντικό- διακύβευμα είναι η μάχη για την κυριαρχία στον χώρο της ΤΝ. Άλλες εταιρείες έχουν ήδη τοποθετηθεί πολύ νωρίτερα, όπως η OpenAI και η Adobe. Η Meta θα πρέπει να παρουσιάσει κάτι πολύ καλύτερο και ίσως θα πρέπει ν' απευθυνθεί σε ακόμα πιο ευρύ κοινό. Το δεύτερο είναι η μάχη της πλατφόρμας για τα social media. Για να επιβιώσουν στη νέα εποχή, οι πλατφόρμες θα πρέπει να παρέχουν στους χρήστες και εφαρμογές ΤΝ. Μετά τη μάχη των φίλτρων, η δημιουργία και η επεξεργασία βίντεο είναι το πιο καυτό θέμα απ' όλα κι έτσι η Alphabet (YouTube) και η Meta (Instagram) θα χτυπηθούν μεταξύ τους αλλά και με το TikTok για την κυριαρχία.