Brain2Music: Το νέο AI εργαλείο της Google διαβάζει τον εγκέφαλο και φτιάχνει μουσική
Δεν είναι νέο για την Google να χρησιμοποιεί τεχνητή νοημοσύνη για τη δημιουργία μουσικής, καθώς τον Ιανουάριο παρουσίασε το εργαλειο MusicLM για την παραγωγή μουσικής από γραπτό κείμενο. Ωστόσο, τώρα η Google έχει ανεβάσει τον πήχη και αξιοποιεί την τεχνητή νοημοσύνη για να διαβάζει τον εγκέφαλό σας, προκειμένου να παράγει ήχο με βάση την εγκεφαλική σας δραστηριότητα.
Σε μια νέα ερευνητική εργασία, το Brain2Music, η Google χρησιμοποιεί την τεχνητή νοημοσύνη για να ανακατασκευάσει μουσική από την εγκεφαλική δραστηριότητα, όπως αυτή φαίνεται μέσα από τα δεδομένα της λειτουργικής απεικόνισης μαγνητικού συντονισμού (fMRI).
Οι ερευνητές μελέτησαν τα δεδομένα fMRI που συλλέχθηκαν από πέντε εξεταζόμενα άτομα τα οποία άκουσαν τα ίδια μουσικά αποσπάσματα διάρκειας 15 δευτερολέπτων από διάφορα είδη μουσικής, όπως μπλουζ, κλασική μουσική, κάντρι, ντίσκο, χιπ-χοπ, τζαζ, μέταλ, ποπ, ρέγκε και ροκ.
Στη συνέχεια χρησιμοποίησαν αυτά τα δεδομένα για να εκπαιδεύσουν ένα νευρωνικό δίκτυο για να κατανοήσουν τη σχέση μεταξύ των μοτίβων της εγκεφαλικής δραστηριότητας και των διαφόρων στοιχείων της μουσικής, όπως ο ρυθμός και το συναίσθημα.
Αφού εκπαιδεύτηκε, το μοντέλο μπορούσε να ανακατασκευάσει τη μουσική από μια μαγνητική τομογραφία χρησιμοποιώντας τη χρήση του MusicLM. Δεδομένου ότι το MusicLM παράγει μουσική από κείμενο, το μοντέλο ήταν προετοιμασμένο να δημιουργεί μουσική παρόμοια με τα αρχικά μουσικά ερεθίσματα σε σημασιολογικό επίπεδο.
Αφού εκπαιδευτεί, το μοντέλο μπορεί να ανακατασκευάσει μουσική από μια μαγνητική τομογραφία με τη χρήση του MusicLM. Δεδομένου ότι το MusicLM παράγει μουσική από κείμενο, ήταν προετοιμασμένο να δημιουργεί μουσική παρόμοια με τα αρχικά μουσικά ερεθίσματα σε σημασιολογικό επίπεδο. Κατά τη δοκιμή, η παραγόμενη μουσική έμοιαζε με τα μουσικά ερεθίσματα που άκουσε αρχικά ο συμμετέχοντας σε χαρακτηριστικά όπως το είδος, η ενορχήστρωση, η διάθεση και άλλα.
Στην ιστοσελίδα της έρευνας, μπορείτε να ακούσετε διάφορα αποσπάσματα των αρχικών μουσικών ερεθισμάτων και να τα συγκρίνετε με τις ανακατασκευές που παρήγαγε το MusicLM, με τα αποτελέσματα να είναι αρκετά εντυπωσιακά.
Για ένα από αυτά τα κλιπ, το ερέθισμα ήταν ένα απόσπασμα 15 δευτερολέπτων από το πασίγνωστο "Oops!...I Did It Again" της Britney Spears. Οι τρεις ανακατασκευές είχαν ποπ και αισιόδοξο χαρακτήρα, όπως και το πρωτότυπο. Ο ήχος, φυσικά, δεν έμοιαζε με αυτόν του πρωτοτύπου, καθώς η μελέτη εστιάζει στα διάφορα στοιχεία της μουσικής και όχι στο στιχουργικό στοιχείο.
Ουσιαστικά, το μοντέλο μπορεί να διαβάσει το μυαλό σας (τεχνικά τα εγκεφαλικά σας μοτίβα) για να παράγει μουσική παρόμοια με αυτή που ακούγατε.