Η AI της Google «πήρε» το ασημένιο μετάλλιο στη Διεθνή Μαθηματική Ολυμπιάδα
Την περασμένη εβδομάδα, η DeepMind (σ.σ. ανήκει στη Google) ανακοίνωσε ότι τα συστήματα AI που ονομάζονται AlphaProof και AlphaGeometry 2 φέρεται να έλυσαν τέσσερα από τα έξι προβλήματα της φετινής Διεθνούς Μαθηματικής Ολυμπιάδας (IMO), επιτυγχάνοντας βαθμολογία που αντιστοιχεί σε ασημένιο μετάλλιο. Ο τεχνολογικός γίγαντας ισχυρίζεται ότι αυτή είναι η πρώτη φορά που μια Τεχνητή Νοημοσύνη επιτυγχάνει αυτό το επίπεδο επιδόσεων στον περίφημο μαθηματικό διαγωνισμό, αλλά, όπως συνηθίζεται στην Τεχνητή Νοημοσύνη, οι ισχυρισμοί δεν είναι τόσο ξεκάθαροι όσο φαίνονται.
Η Google υποστηρίζει ότι το AlphaProof χρησιμοποιεί ενισχυτική μάθηση για να αποδείξει μαθηματικές προτάσεις στην επίσημη γλώσσα που ονομάζεται Lean. Το σύστημα εκπαιδεύεται δημιουργώντας και επαληθεύοντας εκατομμύρια αποδείξεις, αντιμετωπίζοντας σταδιακά πιο δύσκολα προβλήματα. Εν τω μεταξύ, το AlphaGeometry 2 περιγράφεται ως μια αναβαθμισμένη έκδοση του προηγούμενου τρόπου επίλυσης γεωμετρίας AI της Google, που τώρα τροφοδοτείται από ένα γλωσσικό μοντέλο με βάση το Gemini, το οποίο εκπαιδεύεται σε σημαντικά περισσότερα δεδομένα.
Σύμφωνα με τη Google, οι επιφανείς μαθηματικοί Sir Timothy Gowers και Dr. Joseph Myers βαθμολόγησαν τις λύσεις του μοντέλου AI χρησιμοποιώντας επίσημους κανόνες του IMO. Η εταιρεία αναφέρει ότι το συνδυασμένο σύστημά της κέρδισε 28 από τους 42 δυνατούς βαθμούς, λίγο πριν από το όριο του χρυσού μεταλλίου των 29 βαθμών. Αυτό περιελάμβανε τέλεια βαθμολογία στο δυσκολότερο πρόβλημα του διαγωνισμού, το οποίο η Google ισχυρίζεται ότι μόνο πέντε άνθρωποι διαγωνιζόμενοι έλυσαν φέτος.
Από το 1959, ο ΙΜΟ διεξάγεται κάθε χρόνο και φέρνει αντιμέτωπους επίλεκτους μαθηματικούς προ-κολλεγιακού επιπέδου με εξαιρετικά δύσκολα προβλήματα άλγεβρας, συνδυαστικής, γεωμετρίας και θεωρίας αριθμών. Οι επιδόσεις σε προβλήματα του ΙΜΟ έχουν γίνει αναγνωρισμένο σημείο αναφοράς για την αξιολόγηση των δυνατοτήτων μαθηματικής συλλογιστικής ενός συστήματος AI.
Η Google αναφέρει ότι το AlphaProof έλυσε δύο προβλήματα άλγεβρας και ένα πρόβλημα θεωρίας αριθμών, ενώ το AlphaGeometry 2 αντιμετώπισε το πρόβλημα γεωμετρίας. Το μοντέλο Τεχνητής Νοημοσύνης φέρεται να απέτυχε να λύσει τα δύο προβλήματα συνδυαστικής. Η εταιρεία ισχυρίζεται ότι τα συστήματά της έλυσαν ένα πρόβλημα μέσα σε λίγα λεπτά, ενώ άλλα χρειάστηκαν έως και τρεις ημέρες.
Η Google σημειώνει ότι πρώτα μετέφρασε τα προβλήματα του ΙΜΟ σε επίσημη μαθηματική γλώσσα για να τα επεξεργαστεί το μοντέλο Τεχνητής Νοημοσύνης της. Αυτό το βήμα διαφέρει από τον επίσημο διαγωνισμό, όπου οι άνθρωποι διαγωνιζόμενοι εργάζονται απευθείας με τα προβλήματα κατά τη διάρκεια δύο συνεδριών διάρκειας 4,5 ωρών.
Πριν από τον φετινό διαγωνισμό, το AlphaGeometry 2 μπορούσε να επιλύσει το 83% των ιστορικών προβλημάτων γεωμετρίας IMO των τελευταίων 25 ετών, σε σχέση με το ποσοστό επιτυχίας 53% του προκατόχου του. Η εταιρεία ισχυρίζεται ότι το νέο σύστημα έλυσε το φετινό πρόβλημα γεωμετρίας σε 19 δευτερόλεπτα μετά τη λήψη της επισημοποιημένης έκδοσης.
Παρά τους ισχυρισμούς της Google, ο Sir Timothy Gowers προσέφερε μια πιο διαφοροποιημένη άποψη για τα μοντέλα της DeepMind. Αν και αναγνώρισε το επίτευγμα ως «πολύ πέρα από ό,τι μπορούσαν να κάνουν οι αυτόματοι ελεγκτές θεωρημάτων πριν», ο Gowers επεσήμανε αρκετές βασικές προϋποθέσεις.
Ο κύριος χαρακτηρισμός είναι ότι το πρόγραμμα χρειάστηκε πολύ περισσότερο χρόνο από τους ανθρώπους ανταγωνιστές (για ορισμένα από τα προβλήματα πάνω από 60 ώρες) και φυσικά πολύ μεγαλύτερη ταχύτητα επεξεργασίας από τον ταλαίπωρο ανθρώπινο εγκέφαλο. Αν στους ανθρώπους διαγωνιζόμενους είχε δοθεί τέτοιος χρόνος ανά πρόβλημα, αναμφίβολα θα είχαν σημειώσει υψηλότερη βαθμολογία.
Ο Gowers σημείωσε επίσης ότι οι άνθρωποι μετέφραζαν χειροκίνητα τα προβλήματα στην επίσημη γλώσσα Lean πριν το μοντέλο Τεχνητής Νοημοσύνης αρχίσει να εργάζεται. Τόνισε ότι, ενώ η Τεχνητή Νοημοσύνη εκτελούσε τον βασικό μαθηματικό συλλογισμό, αυτό το βήμα της «αυτόματης τυποποίησης» γινόταν από ανθρώπους.
Όσον αφορά τις ευρύτερες επιπτώσεις για τη μαθηματική έρευνα, ο Gowers εξέφρασε αβεβαιότητα. «Είμαστε κοντά στο σημείο όπου οι μαθηματικοί είναι περιττοί; Είναι δύσκολο να το πούμε. Θα υπέθετα ότι απέχουμε ακόμη μια ή δύο ανακαλύψεις από αυτό», έγραψε. Πρότεινε ότι οι μεγάλοι χρόνοι επεξεργασίας του συστήματος δείχνουν ότι δεν έχει «λύσει τα μαθηματικά», αλλά αναγνώρισε ότι «υπάρχει σαφώς κάτι ενδιαφέρον που συμβαίνει όταν λειτουργεί».
Ακόμη και με αυτούς τους περιορισμούς, ο Gowers υπέθεσε ότι τέτοια συστήματα Τεχνητής Νοημοσύνης θα μπορούσαν να γίνουν πολύτιμα ερευνητικά εργαλεία. «Μπορεί λοιπόν να είμαστε κοντά στο να έχουμε ένα πρόγραμμα που θα επέτρεπε στους μαθηματικούς να παίρνουν απαντήσεις σε ένα ευρύ φάσμα ερωτήσεων, με την προϋπόθεση ότι οι ερωτήσεις αυτές δεν θα ήταν πολύ δύσκολε, το είδος των πραγμάτων που μπορεί κανείς να κάνει σε δύο ώρες. Αυτό θα ήταν μαζικά χρήσιμο ως ερευνητικό εργαλείο, ακόμη και αν το ίδιο δεν ήταν ικανό να λύσει ανοιχτά προβλήματα».
[via]