Imagen3, Veo και Music AI Sandbox, τα νέα AI εργαλεία παραγωγής εικόνας, video και μουσικής!

Όλα αφορούν το AI στο Google I/O 2024... Συνεχίζοντας τις ενδιαφέρουσες ανακοινώσεις, η Google πέρασε στις νέες μηχανές δημιουργίας πολυμέσων με Τεχνητή Νοημοσύνη. Το Veo, που παράγει υψηλής ποιότητας videos 1080p, και το Imagen 3, το πιο πρόσφατο framework μετατροπής κειμένου σε εικόνα. Κανένα από τα δύο δεν ακούγεται ιδιαίτερα επαναστατικό, αλλά είναι ένας τρόπος για τη Google να συνεχίσει τη μάχη ενάντια στο Sora του OpenAI και το Dall-E 3, ένα εργαλείο που έχει πρακτικά γίνει συνώνυμο με τις εικόνες που δημιουργούνται από AI.

Η Google ισχυρίζεται ότι το Veo διαθέτει "προηγμένη κατανόηση της φυσικής γλώσσας και της οπτικής σημασιολογίας" για να δημιουργήσει ό,τι video έχετε στο μυαλό σας. Τα video που δημιουργούνται από AI μπορούν να διαρκέσουν "περισσότερο από ένα λεπτό". Το Veo είναι επίσης ικανό να κατανοεί κινηματογραφικές και οπτικές τεχνικές, όπως η έννοια του timelapse.

Για να αποδείξει ότι το Veo δεν έχει σκοπό να κλέψει τις δουλειές των καλλιτεχνών, η Google συνεργάστηκε με τον Donald Glover και το Gilga, το δημιουργικό του στούντιο, για να επιδείξει τις δυνατότητες του μοντέλου. Σε ένα πολύ σύντομο διαφημιστικό βίντεο, βλέπουμε τον Glover και το συνεργείο να χρησιμοποιούν κείμενο για να δημιουργήσουν βίντεο με ένα κάμπριο που φτάνει σε ένα ευρωπαϊκό σπίτι και ένα ιστιοφόρο που γλιστρά στον ωκεανό. Σύμφωνα με τη Google, το Veo μπορεί να προσομοιώνει τη Φυσική του πραγματικού κόσμου καλύτερα από τα προηγούμενα μοντέλα του και έχει επίσης βελτιώσει τον τρόπο με τον οποίο αποδίδει υλικό υψηλής ευκρίνειας.

"Όλοι θα γίνουν σκηνοθέτες, και όλοι θα πρέπει να γίνουν σκηνοθέτες", αναφέρει ο Glover στο video. "Στην καρδιά όλων αυτών είναι απλά η αφήγηση ιστοριών. Όσο πιο κοντά είμαστε στο να μπορούμε να λέμε ο ένας στον άλλον τις ιστορίες μας, τόσο περισσότερο θα καταλαβαίνουμε ο ένας τον άλλον".

Το Veo θα είναι διαθέσιμο μέσα στο εργαλείο VideoFX της Google από σήμερα για ορισμένους δημιουργούς και η εταιρεία λέει ότι θα προστεθεί επίσης στο YouTube Shorts και σε άλλα προϊόντα. Αν το Veo καταλήξει να γίνει ενσωματωμένο μέρος του YouTube Shorts, αυτό είναι τουλάχιστον ένα χαρακτηριστικό που η Google μπορεί να κυριαρχήσει έναντι του TikTok.

Σε ό,τι αφορά το Imagen 3, η Google δίνει τις συνήθεις υποσχέσεις: με "απίστευτο επίπεδο λεπτομέρειας" για "φωτορεαλιστικές, ζωντανές εικόνες" και λιγότερα τεχνουργήματα. Η πραγματική δοκιμή, φυσικά, θα είναι να δούμε πώς χειρίζεται τις προτροπές σε σύγκριση με το Dall-E 3. Το Imagen 3 χειρίζεται το κείμενο καλύτερα από πριν, όπως λέει η Google, και είναι επίσης πιο έξυπνο στο χειρισμό λεπτομερειών από μακροσκελείς προτροπές.

Η Google συνεργάζεται επίσης με καλλιτέχνες όπως ο Wyclef Jean και ο Bjorn για να δοκιμάσουν το Music AI Sandbox, ένα σύνολο εργαλείων που μπορούν να βοηθήσουν στη δημιουργία τραγουδιών και beat. Είδαμε μόνο μια σύντομη γεύση από αυτό, αλλά οδήγησε σε μερικά ενδιαφέροντα demo:

Loading