Grok 3: Επίσημα η νέα AI του Elon Musk που ξεπερνά τους ανταγωνιστές

Η εταιρεία τεχνητής νοημοσύνης του Elon Musk, xAI, κυκλοφόρησε πριν από λίγη ώρα το Grok 3, το νέο AI μοντέλο της με νέες δυνατότητες για τις εκδόσεις του σε web και iOS.

Το Grok, η απάντηση της xAI σε μοντέλα όπως το GPT-4o της OpenAI και το Gemini της Google, μπορεί να αναλύει εικόνες και να απαντά σε ερωτήσεις, και τροφοδοτεί μια σειρά από λειτουργίες στο κοινωνικό δίκτυο X (πρώην Twitter). Το Grok 3, το οποίο βρισκόταν υπό ανάπτυξη εδώ και αρκετούς μήνες, προοριζόταν να κυκλοφορήσει το 2024, αλλά έχασε αυτή την προθεσμία.

Η xAI έχει χρησιμοποιήσει ένα τεράστιο κέντρο δεδομένων στο Μέμφις με περίπου 200.000 GPU για την εκπαίδευση του Grok 3. Σε μια ανάρτηση στο X, ο Musk ισχυρίστηκε ότι το Grok 3 αναπτύχθηκε με «10 φορές» περισσότερους υπολογιστές από το Grok 2, τον προκάτοχό του, και με ένα διευρυμένο σύνολο δεδομένων εκπαίδευσης που υποτίθεται ότι περιλαμβάνει αρχεία από δικαστικές υποθέσεις.

«Το Grok 3 είναι μια τάξη μεγέθους πιο ικανό από το Grok 2», δήλωσε ο Musk κατά τη διάρκεια της παρουσίαση. «Είναι μια τεχνητή νοημοσύνη που αναζητά στο μέγιστο βαθμό την αλήθεια, ακόμη και αν αυτή η αλήθεια έρχεται μερικές φορές σε αντίθεση με το τι είναι πολιτικά ορθό».

Για να είμαστε ακριβείς, το Grok 3 είναι μια οικογένεια μοντέλων. Μια μικρότερη έκδοση του Grok 3, το Grok 3 mini, απαντά σε ερωτήσεις πιο γρήγορα με κόστος κάποια ακρίβεια. Δεν είναι ακόμη διαθέσιμα όλα τα μοντέλα (και ορισμένα βρίσκονται σε beta), αλλά η διάθεση τους ξεκίνησε ήδη.

Η xAI ισχυρίζεται ότι το Grok 3 ξεπερνά το GPT-4o σε κριτήρια αναφοράς, όπως το AIME, το οποίο αξιολογεί την απόδοση ενός μοντέλου σε ένα δείγμα μαθηματικών ερωτήσεων, και το GPQA, το οποίο αξιολογεί μοντέλα χρησιμοποιώντας προβλήματα φυσικής, βιολογίας και χημείας διδακτορικού επιπέδου. Μια πρώιμη έκδοση του Grok 3 σημείωσε επίσης ανταγωνιστική βαθμολογία στο Chatbot Arena, μια δοκιμασία που βασίζεται σε πλήθος χρηστών, η οποία θέτει διάφορα μοντέλα AI αντιμέτωπα μεταξύ τους και οι χρήστες ψηφίζουν τις προτιμώμενες απαντήσεις, σύμφωνα με την xAI.

Δύο παραλλαγές του Grok 3, το Grok 3 Reasoning και το Grok 3 mini Reasoning, μπορούν να «σκεφτούν» προσεκτικά προβλήματα, παρόμοια με μοντέλα «συλλογισμού» όπως το o3-mini της OpenAI και το R1 της κινεζικής εταιρείας AI DeepSeek. Τα μοντέλα συλλογιστικής ελέγχουν διεξοδικά τα γεγονότα πριν δώσουν αποτελέσματα, γεγονός που τα βοηθά να αποφύγουν ορισμένες από τις παγίδες που συνήθως βάζουν τρικλοποδιά στα μοντέλα.

Η xAI ισχυρίζεται ότι το Grok 3 Reasoning ξεπερνά την καλύτερη έκδοση του o3-mini - το o3-mini-high - σε διάφορα δημοφιλή benchmarks, συμπεριλαμβανομένου ενός νεότερου benchmark μαθηματικών που ονομάζεται AIME 2025. Η πρόσβαση στα μοντέλα συλλογιστικής είναι δυνατή μέσω της εφαρμογής Grok. Οι χρήστες μπορούν να ζητήσουν από το Grok 3 να «σκεφτεί» ή - για πιο δύσκολα ερωτήματα - να αξιοποιήσουν τη λειτουργία «Big Brain» για συλλογιστική που χρησιμοποιεί πρόσθετους υπολογισμούς. Η xAI περιγράφει τα μοντέλα συλλογιστικής ως τα καταλληλότερα για ερωτήσεις που σχετίζονται με τα μαθηματικά, τις επιστήμες και τον προγραμματισμό.

Ο Musk τόνισε ότι στην εφαρμογή Grok ορισμένες από τις «σκέψεις» των μοντέλων συλλογισμού είναι συγκεκαλυμμένες για να αποτραπεί η απόσταξη, μια μέθοδος που χρησιμοποιείται από τους προγραμματιστές μοντέλων Τεχνητής Νοημοσύνης για την απόσπαση γνώσης από ένα άλλο μοντέλο. Πρόσφατα, η DeepSeek κατηγορήθηκε για απόσταξη των μοντέλων της OpenAI για να δημιουργήσει τα δικά της.

Τα μοντέλα συλλογισμού του Grok ενισχύουν ένα νέο χαρακτηριστικό στην εφαρμογή Grok που ονομάζεται DeepSearch, την απάντηση της xAI σε εργαλεία «βαθιάς έρευνας» με AI, όπως το Deep Research του OpenAI. Το DeepSearch σαρώνει το διαδίκτυο και το X για να αναλύσει πληροφορίες και να παραδώσει μια περίληψη ως απάντηση σε μια ερώτηση.

Οι συνδρομητές της βαθμίδας Premium+ του X θα λάβουν πρώτα το Grok 3, ενώ άλλα χαρακτηριστικά βρίσκονται πίσω από ένα νέο πλάνο που η xAI αποκαλεί SuperGrok. Με τιμή 30 δολάρια το μήνα ή 300 δολάρια το χρόνο, το SuperGrok ξεκλειδώνει επιπλέον συλλογισμούς και ερωτήματα DeepSearch, και προσθέτει απεριόριστη παραγωγή εικόνων.

Στο μέλλον (μόλις σε περίπου μία εβδομάδα από τώρα) η εφαρμογή Grok θα αποκτήσει μια «φωνητική λειτουργία», δήλωσε ο Musk, η οποία θα δίνει στα μοντέλα Grok μια συνθετική φωνή. Λίγες εβδομάδες αργότερα, τα μοντέλα Grok 3 θα φτάσουν στο επιχειρηματικό API της xAI, μαζί με τη λειτουργία DeepSearch. Λίγους μήνες μετά από αυτό, η xAI θα ανοίξει τον κώδικα του Grok 2, δήλωσε ο Musk.

«Η γενική μας προσέγγιση είναι ότι θα ανοίξουμε τον κώδικα της τελευταίας έκδοσης του Grok όταν η επόμενη έκδοση θα είναι πλήρως έτοιμη», δήλωσε ο Musk. «Όταν το Grok 3 θα είναι ώριμο και σταθερό, το οποίο είναι πιθανότατα μέσα σε λίγους μήνες, τότε θα ανοίξουμε τον κώδικα του Grok 2».

Όταν ο Musk ανακοίνωσε το Grok πριν από περίπου δύο χρόνια, παρουσίασε την Τεχνητή Νοημοσύνη ως ακραία, αφιλτράριστη και αντι-«woke» - σε γενικές γραμμές, πρόθυμη να απαντήσει σε αμφιλεγόμενες ερωτήσεις που άλλα συστήματα Τεχνητής Νοημοσύνης δεν θα απαντούσαν. Ωστόσο, τα μοντέλα Grok πριν από το Grok 3 αντιστάθηκαν σε πολιτικά θέματα και δεν ξεπερνούν ορισμένα όρια. Στην πραγματικότητα, μια μελέτη διαπίστωσε ότι το Grok έκλινε προς την αριστερή πολιτική κατεύθυνση σε θέματα όπως τα δικαιώματα των τρανσέξουαλ, τα προγράμματα διαφορετικότητας και η ανισότητα.

Ο Musk κατηγόρησε για τη συμπεριφορά αυτή τα δεδομένα εκπαίδευσης του Grok, δηλαδή δημόσιες ιστοσελίδες, και δεσμεύτηκε να «μετατοπίσει το Grok πιο κοντά στην πολιτική ουδετερότητα». Δεν είναι ακόμη σαφές αν η xAI πέτυχε αυτόν τον στόχο.