Project Astra: Λανσάρεται η AI λειτουργία κατανόησης του κόσμου σε πραγματικό χρόνο από τη Google [Video]
Στο πλαίσιο του MWC 2025, η Google επιβεβαίωσε ότι ο πειραματικός βοηθός Project Astra θα κυκλοφορήσει ευρέως τον Μάρτιο. Φαίνεται ότι η λειτουργία έχει αρχίσει να φτάνει στους χρήστες, αν και σταδιακά, ξεκινώντας από τα Android smartphones.
Στο Reddit, ένας χρήστης μοιράστηκε ένα demo video που δείχνει μια νέα επιλογή «Share Screen With Live» όταν καλείται ο Gemini Assistant. Επιπλέον, το περιβάλλον χρήσης του Gemini Live έλαβε επίσης δύο νέες επιλογές για live βίντεο και διαμοιρασμό οθόνης. Η Google επιβεβαίωσε επίσης στην ιστοσελίδα The Verge ότι τα προαναφερθέντα χαρακτηριστικά βρίσκονται πλέον σε φάση ανάπτυξης. Μέχρι στιγμής, το Gemini ήταν ικανό μόνο για επίγνωση πλαισίου στην οθόνη χάρη στη λειτουργία «Ask about screen».
Σε περίπτωση που δεν είστε εξοικειωμένοι, το Project Astra είναι η πιο φουτουριστική εκδοχή μιας AI που μπορεί να κατανοήσει κείμενο, ήχο, εικόνα, βίντεο και ζωντανή ροή κάμερας σε πραγματικό χρόνο. Ο διευθυντής ερευνών του Google Deepmind, Greg Wayne, το παρομοίασε με έναν «μικρό παπαγάλο στον ώμο σας που αράζει μαζί σας και σας μιλάει για τον κόσμο».
Όταν καλείτε το Gemini και ενεργοποιείτε την επιλογή Share Screen With Live σε οποιαδήποτε εφαρμογή, θα αναλύει το περιεχόμενο της οθόνης και θα απαντά σε ερωτήματα με βάση αυτό. Για παράδειγμα, οι χρήστες μπορούν να του ζητήσουν να περιγράψει την τρέχουσα δραστηριότητα που συμβαίνει σε μια εφαρμογή, να αναλύσει ή να συνοψίσει οποιοδήποτε άρθρο που διάβαζαν ή να τους μιλήσει για τη σκηνή κατά την αναπαραγωγή βίντεο.
Η πιο εντυπωσιακή δυνατότητα είναι το σύστημα κατανόησης του κόσμου. Όταν μεταβαίνετε στη λειτουργία Live για το Gemini, εμφανίζει πλέον μια επιλογή τροφοδοσίας βίντεο που ανοίγει την κάμερα. Σε αυτή τη λειτουργία, αν στρέψετε την κάμερα σε οποιοδήποτε αντικείμενο, το Gemini θα είναι σε θέση να δει, να κατανοήσει και να απαντήσει σε ερωτήσεις με βάση αυτό που βλέπει.
Στρέφοντας την κάμερα σε ένα απόσπασμα βιβλίου, ζητώντας από το Gemini να πει περισσότερα για ένα μνημείο, λαμβάνοντας συμβουλές για τη διακόσμηση ή λύνοντας προβλήματα που είναι γραμμένα σε έναν πίνακα ή ένα βιβλίο, η αναβάθμιση Project Astra του Gemini Live μπορεί να τα κάνει όλα. Δεν διαφέρει πολύ από το Visual Intelligence της Apple στα iPhone, ή την εφαρμογή ανοικτού κώδικα HuggingSnap που υπόσχεται μια AI που καταλαβαίνει τον κόσμο εκτός σύνδεσης.
Να σημειωθεί, επίσης, ότι η αναβάθμιση του Project Astra για το Gemini Live περιορίζεται στους συνδρομητές που πληρώνουν για το Gemini Advanced, τουλάχιστον στην παρούσα φάση. Λογικά σε μερικές εβδομάδες θα γίνει διαθέσιμο δωρεάν για όλους, όπως και όλες οι προηγούμενες λειτουργίες του Gemini.
[via]