Φανταστείτε να μπορείτε να επιταχύνετε την εξέλιξη - υποθετικά - για να μάθετε ποια γονίδια μπορεί να έχουν επιβλαβή ή ευεργετική επίδραση στην ανθρώπινη υγεία. Φανταστείτε, επιπλέον, να είστε σε θέση να δημιουργήσετε γρήγορα νέες γενετικές αλληλουχίες που θα μπορούσαν να βοηθήσουν στη θεραπεία ασθενειών ή στην επίλυση περιβαλλοντικών προκλήσεων. Τώρα, οι επιστήμονες έχουν αναπτύξει ένα εργαλείο παραγωγικής Τεχνητής Νοημοσύνης που μπορεί να προβλέψει τη μορφή και τη λειτουργία των πρωτεϊνών που κωδικοποιούνται στο DNA όλων των τομέων της ζωής, να εντοπίσει μόρια που θα μπορούσαν να είναι χρήσιμα για τη βιομηχανική και την ιατρική και να επιτρέψει στα εργαστήρια να εκτελέσουν δεκάδες άλλα τυπικά πειράματα με ένα εικονικό ερώτημα - σε λεπτά ή ώρες αντί για χρόνια (ή χιλιετίες).
Το open-source AI εργαλείο, γνωστό ως Evo 2, αναπτύχθηκε από μια πολυ-ιδρυματική ομάδα με συν-επικεφαλής τον Brian Hie του Stanford, επίκουρο καθηγητή χημικής μηχανικής και συνεργάτη του Stanford Data Science. Το Evo 2 εκπαιδεύτηκε σε ένα σύνολο δεδομένων που περιλαμβάνει όλα τα γνωστά ζωντανά είδη, συμπεριλαμβανομένων των ανθρώπων, των φυτών, των βακτηρίων, των αμοιβάδων, ακόμη και μερικών εξαφανισμένων ειδών.
Το Stanford Report μίλησε με τον Hie για τις προηγμένες δυνατότητες του Evo 2, γιατί ο επιστημονικός κόσμος ανυπομονεί τόσο πολύ να πάρει στα χέρια του αυτό το νέο εργαλείο και πώς το Evo 2 θα μπορούσε να αναμορφώσει τις βιολογικές επιστήμες.
Μπορείτε να μας δώσετε την απλή εκδοχή του τρόπου λειτουργίας του Evo 2;
Όλη η ζωή κωδικοποιείται στο DNA χρησιμοποιώντας μόνο τέσσερις χημικές ουσίες, γνωστές ως νουκλεοτίδια. Αυτά τα πολύπλοκα μόρια συντομεύονται με τα γράμματα A, C, G και T. Το ανθρώπινο γονιδίωμα, μήκους 3 δισεκατομμυρίων νουκλεοτιδίων, είναι απλώς μια σειρά από αυτά τα τέσσερα γράμματα. Τώρα, αν φανταστείτε το DNA ως χαρακτήρες σε ένα βιβλίο που έχει μήκος 3 δισεκατομμύρια γράμματα, τα επιμέρους γονίδια είναι οι λέξεις. Γράφονται διαφορετικά. Μερικά έχουν περισσότερα γράμματα από άλλα. Και έχουν διαφορετικούς σκοπούς και σημασίες, δηλαδή έχουν διαφορετικές λειτουργίες.
Με την Τεχνητή Νοημοσύνη, μπορούμε να αναζητήσουμε μοτίβα σε όλο αυτόν τον κώδικα και να τα χρησιμοποιήσουμε για να προβλέψουμε ποιο είναι πιθανό να είναι το επόμενο νουκλεοτίδιο στην αλληλουχία. Με αυτόν τον τρόπο, το Evo 2 είναι σε θέση να δημιουργήσει έναν νέο γενετικό κώδικα που δεν έχει υπάρξει ποτέ πριν. Με το Evo 2, μπορείτε να εισαγάγετε μια ακολουθία έως και 1 εκατομμυρίου νουκλεοτιδίων. Το παράθυρο του ενός εκατομμυρίου νουκλεοτιδίων στη βιολογία είναι σημαντικό, καθώς μας επιτρέπει να διερευνήσουμε αλληλεπιδράσεις μεγάλης κλίμακας μεταξύ δύο ή περισσότερων γονιδίων που μπορεί να μην βρίσκονται φυσικά κοντά το ένα στο άλλο στο μόριο του DNA. Το μεγαλύτερο παράθυρο πλαισίου θα μπορούσε να μας επιτρέψει να εντοπίσουμε συνδέσεις μεταξύ αυτών που δεν θα γνωρίζαμε καν με ένα μικρότερο παράθυρο.
Σε τι διαφέρει το Evo 2 από το Evo 1, το οποίο κυκλοφόρησε μόλις πέρυσι, και πώς εξελίξατε την τεχνολογία τόσο γρήγορα;
Ειλικρινά, το Evo 1 ήταν πιο αποτελεσματικό από ό,τι νομίζαμε ότι θα ήταν. Το Evo 1 εκπαιδεύτηκε σε μόλις 113.000 περίπου γονιδιώματα απλούστερων μορφών ζωής, όπως τα βακτήρια και τα αρχέγονα, γνωστά ως προκαρυώτες.
Το Evo 2, από την άλλη πλευρά, περιλαμβάνει επίσης τα γνωστά γονιδιώματα 15.000 περίπου φυτών και ζώων - των ευκαρυωτικών - στα οποία συμπεριλαμβάνεται και ο άνθρωπος. Το σύνολο των δεδομένων μας έχει πλέον επεκταθεί από περίπου 300 δισεκατομμύρια νουκλεοτίδια σε σχεδόν 9 τρισεκατομμύρια με το Evo 2. Όσον αφορά την ασφάλεια, έχουμε αφήσει εκτός τα γονιδιώματα των ιών για να αποτρέψουμε τη χρήση του Evo 2 για τη δημιουργία νέων ή πιο επικίνδυνων ασθενειών. Είναι σαν ένα αντιπροσωπευτικό στιγμιότυπο όλων των ειδών στη Γη. Επειδή έχει τη δυνατότητα να βελτιώσει τις εργασίες που σχετίζονται με τις ανθρώπινες ασθένειες, αισθανθήκαμε ότι έπρεπε να μοιραστούμε το Evo 2 γρήγορα.
Γιατί το Evo 2 μοιάζει με το ChatGPT;
Σε έναν επεξεργαστή φυσικής γλώσσας, όπως το ChatGPT, μπορείτε να τον προτρέψετε με κάποιο κείμενο και αυτός θα συμπληρώσει αυτόματα την πρόταση με βάση μοτίβα από λέξεις που έχουν γραφτεί προηγουμένως. Το Evo 2 το κάνει αυτό με το DNA. Αν θέλετε να σχεδιάσετε ένα νέο γονίδιο, προτρέπετε το μοντέλο με την αρχή μιας γονιδιακής ακολουθίας ζευγών βάσεων και το Evo 2 θα συμπληρώσει αυτόματα το γονίδιο.
Μερικές φορές αυτή η συμπλήρωση θα μοιάζει ακριβώς με ένα γονίδιο που βρέθηκε στη φύση, αλλά άλλες φορές το μοντέλο θα κάνει κάποιες βελτιώσεις ή θα γράψει το γονίδιο με διαφορετικό τρόπο από ό,τι έχει συμβεί ποτέ στην εξελικτική ιστορία. Στον πραγματικό κόσμο, αυτές οι μεταλλάξεις συμβαίνουν τυχαία. Με το Evo 2, μπορούμε να είμαστε πιο άμεσοι και να κατευθυνόμαστε προς μεταλλάξεις που έχουν χρήσιμες λειτουργίες. Το Evo 2 περιλαμβάνει επίσης μοντέλα μηχανικής μάθησης που θα σας πουν αν η αλληλουχία υπάρχει στη φύση και θα προβλέψουν πώς αυτή η νέα αλληλουχία θα λειτουργήσει στην πραγματική ζωή. Στη συνέχεια πηγαίνουμε στο εργαστήριο και συνθέτουμε το DNA και το εισάγουμε σε ένα ζωντανό κύτταρο για να το δοκιμάσουμε χρησιμοποιώντας μια τεχνολογία γονιδιακής επεξεργασίας όπως το CRISPR. Ουσιαστικά, το Evo 2 επιταχύνει την εξέλιξη, παρέχοντας πολλά υποσχόμενα νέα γενετικά μονοπάτια προς εξερεύνηση.
Πώς ελπίζετε ότι άλλοι επιστήμονες θα χρησιμοποιήσουν το Evo 2;
Ελπίζουμε ότι το Evo 2 θα έχει κάποια στιγμή κλινική σημασία. Είναι πραγματικά αποτελεσματικό στην ανακάλυψη. Το Evo 2 θα μπορούσε να βοηθήσει στην πρόβλεψη των μεταλλάξεων που οδηγούν σε παθογένειες και ασθένειες. Όλοι έχουν τυχαίες μεταλλάξεις στο DNA τους και, ως επί το πλείστον, είναι ακίνδυνες. Αλλά σε σπάνιες περιπτώσεις, θα προκαλέσουν καρκίνο ή άλλη ασθένεια. Το μοντέλο είναι στην πραγματικότητα πολύ καλό στο να διακρίνει ποιες μεταλλάξεις είναι απλώς τυχαίες, ακίνδυνες παραλλαγές και ποιες προκαλούν ασθένειες. Ο τελευταίος τομέας για τον οποίο είμαστε αισιόδοξοι είναι η χρήση του Evo 2 για το σχεδιασμό νέων γενετικών αλληλουχιών με συγκεκριμένες λειτουργίες που μας ενδιαφέρουν. Ένα άλλο σχετικό επόμενο βήμα είναι η ενσωμάτωση αυτών των μοντέλων με μοντέλα συστημικής βιολογίας που θα μας βοηθήσουν να μάθουμε για τις αλληλεπιδράσεις μεταξύ δύο ή περισσότερων γονιδίων που προκαλούν ασθένειες.
Μπορείτε να μιλήσετε για τη συνεργασία που απαιτείται για να πραγματοποιηθεί κάτι σαν το Evo 2;
Κάτι τέτοιας κλίμακας δεν μπορεί να γίνει από ένα μόνο άτομο. Τα τρία μεγάλα ιδρύματα που εμπλέκονται είναι το Stanford, η NVIDIA -η οποία κατασκευάζει τα τσιπ των υπολογιστών τεχνητής νοημοσύνης και το λογισμικό για την εκτέλεσή τους- και το Arc Institute, ένα μη κερδοσκοπικό ίδρυμα βιοϊατρικής έρευνας, το οποίο είναι το ίδιο μια συνεργασία μεταξύ του Stanford, του Πανεπιστημίου της Καλιφόρνιας στο Berkeley και του Πανεπιστημίου της Καλιφόρνιας στο San Francisco.
Όσον αφορά το προσωπικό, είχαμε τρεις υποομάδες. Πρώτον, η ομάδα μηχανικής μάθησης επικεντρώθηκε στην εκπαίδευση του μοντέλου και στη διασφάλιση της αποτελεσματικής λειτουργίας των υπολογιστών. Στη συνέχεια, αφού εκπαιδεύσετε ένα μοντέλο, πρέπει να ξέρετε ότι λειτουργεί πραγματικά όπως προβλέπεται. Έτσι, υπάρχει μια ομάδα βιολόγων - υπολογιστικών, μοριακών, συστημικών, προκαρυωτικών, ευκαρυωτικών βιολόγων - για να βεβαιωθούμε ότι οι πληροφορίες που παίρνουμε πίσω είναι πολύτιμες και χρησιμοποιήσιμες. Και, τέλος, έχουμε μια ομάδα πειραματικής βιολογίας που συνθέτει το νέο DNA, το τοποθετεί σε κύτταρα και δοκιμάζει τα κύτταρα για να βεβαιωθεί ότι αυτό που δημιουργήσαμε λειτουργεί στην πραγματική ζωή. Όλα αυτά είναι πολύ σκληρή δουλειά και είμαι ευγνώμων σε όλους στην ομάδα για τη βοήθειά τους.
*Η κεντρική εικόνα αποτελεί δημιουργία του Imagen 3 για το Techgear.gr

[via]