Gemini 2.0: Επίσημα το νέο AI μοντέλο της Google

Λιγότερο από ένα χρόνο μετά το ντεμπούτο του Gemini 1.5, το τμήμα DeepMind της Google επέστρεψε σήμερα για να αποκαλύψει το νέας γενιάς μοντέλο AI, το Gemini 2.0. Το νέο μοντέλο προσφέρει εγγενή έξοδο εικόνας και ήχου και «θα μας επιτρέψει να δημιουργήσουμε νέους AI agents που θα μας φέρουν πιο κοντά στο όραμά μας για έναν καθολικό βοηθό», έγραψε η εταιρεία στο blog post της ανακοίνωσης.

Από την Τετάρτη, το Gemini 2.0 είναι διαθέσιμο σε όλα τα επίπεδα συνδρομής, συμπεριλαμβανομένου του δωρεάν. Ως η νέα ναυαρχίδα του AI μοντέλου της Google, μπορείτε να περιμένετε να το δείτε να αρχίζει να τροφοδοτεί λειτουργίες AI σε όλο το οικοσύστημα της εταιρείας τους επόμενους μήνες. Όπως και με το μοντέλο o1 του OpenAI, η αρχική έκδοση του Gemini 2.0 δεν είναι η ολοκληρωμένη έκδοση της εταιρείας, αλλά μια μικρότερη, λιγότερο ικανή «πειραματική προεπισκόπηση» που θα αναβαθμιστεί στο Google Gemini τους επόμενους μήνες.

Όπως δήλωσε ο CEO της Google DeepMind, Demis Hassabis,

Αποτελεσματικά είναι τόσο καλό όσο και το τρέχον μοντέλο Pro. Έτσι, μπορείτε να το θεωρήσετε ένα ολόκληρο επίπεδο καλύτερο, για την ίδια αποδοτικότητα κόστους και απόδοσης και ταχύτητα. Είμαστε πραγματικά ευχαριστημένοι με αυτό.

Η Google κυκλοφορεί επίσης μια ελαφριά έκδοση του μοντέλου, με την ονομασία Gemini 2.0 Flash, για προγραμματιστές.

Με την κυκλοφορία ενός πιο ικανού μοντέλου Gemini, η Google προωθεί την ατζέντα της για τους AI agents, η οποία θα προβλέπει μικρότερα, ειδικά κατασκευασμένα μοντέλα που θα αναλαμβάνουν αυτόνομη δράση για λογαριασμό του χρήστη. Το Gemini 2.0 αναμένεται να ενισχύσει σημαντικά τις προσπάθειες της Google να αναπτύξει το Project Astra, το οποίο συνδυάζει τις ικανότητες συνομιλίας του Gemini Live με την ανάλυση βίντεο και εικόνας σε πραγματικό χρόνο για να παρέχει στους χρήστες πληροφορίες για το περιβάλλον τους μέσω μιας διεπαφής έξυπνων γυαλιών.

Η Google ανακοίνωσε επίσης την Τετάρτη την κυκλοφορία του Project Mariner, της απάντησης της εταιρείας στη λειτουργία Computer Control της Anthropic. Αυτή η επέκταση του Chrome είναι ικανή να δίνει εντολές σε έναν υπολογιστή, συμπεριλαμβανομένων των πληκτρολογήσεων και των κλικ του ποντικιού, με τον ίδιο τρόπο που το κάνουν οι άνθρωποι χρήστες. Η εταιρεία κυκλοφορεί επίσης έναν βοηθό κωδικοποίησης τεχνητής νοημοσύνης με την ονομασία Jules που μπορεί να βοηθήσει τους προγραμματιστές να βρουν και να βελτιώσουν τον δύσχρηστο κώδικα, καθώς και μια λειτουργία «Deep Research» που μπορεί να δημιουργήσει λεπτομερείς αναφορές για τα θέματα που της αναθέτετε να αναζητήσει στο Διαδίκτυο.

Το Deep Research, το οποίο φαίνεται να εξυπηρετεί την ίδια λειτουργία με το Perplextiy AI και το ChatGPT Search, είναι προς το παρόν διαθέσιμο στους συνδρομητές Gemini Advanced στην αγγλική γλώσσα. Το σύστημα λειτουργεί δημιουργώντας πρώτα ένα «ερευνητικό σχέδιο πολλαπλών βημάτων», το οποίο υποβάλλει στον χρήστη προς έγκριση πριν το εφαρμόσει.

[via]