Η Διεθνής Μαθηματική Ολυμπιάδα (IMO) είναι ένας από τους πιο αναγνωρισμένου κύρους διαγωνισμούς για μαθηματικούς σε όλο τον κόσμο. Σε αυτόν τον διαγωνισμό, κάθε χώρα εκπροσωπείται από έξι μαθητές προπανεπιστημιακής φοίτησης που διαγωνίζονται για να λύσουν έξι εξαιρετικά δύσκολα προβλήματα. Κάθε χρόνο, μόνο περίπου το 8% αυτών λαμβάνει το χρυσό μετάλλιο.
Στο φετινό IMO, τόσο η OpenAI όσο και η Google χρησιμοποίησαν τα πιο πρόσφατα LLM τους για να διαγωνιστούν. Το Σαββατοκύριακο, η OpenAI ισχυρίστηκε ότι το πειραματικό συλλογιστικό LLM πέτυχε απόδοση επιπέδου χρυσού μεταλλίου. Η OpenAI αξιολόγησε τα μοντέλα της στα προβλήματα του IMO 2025 με τους ίδιους κανόνες που ισχύουν και για τους φοιτητές. Τα μοντέλα έπρεπε να λύσουν τα προβλήματα σε δύο συνεδρίες εξετάσεων 4,5 ωρών, χωρίς πρόσβαση σε εργαλεία ή στο διαδίκτυο, και να γράψουν αποδείξεις σε φυσική γλώσσα.
Σήμερα, η Google ισχυρίστηκε ότι μια προηγμένη έκδοση του Gemini Deep Think έλυσε πέντε από τα έξι προβλήματα κατά τη γνώμη μου, επιτυγχάνοντας απόδοση επιπέδου χρυσού μεταλλίου. Αυτή η προηγμένη έκδοση του Gemini Deep Think υποστηρίζεται από μια βελτιωμένη λειτουργία συλλογισμού χρησιμοποιώντας το πιο πρόσφατο ερευνητικό έργο του Google DeepMind, συμπεριλαμβανομένης της παράλληλης σκέψης. Αυτό επέτρεψε στο Gemini να εξερευνήσει πολλαπλές λύσεις ταυτόχρονα αντί να εξερευνά μία μόνο λύση.
Η ομάδα Google DeepMind έγραψε τα εξής σχετικά με αυτήν την προηγμένη έκδοση του Gemini Deep Think:
Η Google θα κυκλοφορήσει αυτήν τη νέα έκδοση του μοντέλου Deep Think σε μια ομάδα έμπιστων δοκιμαστών στο εγγύς μέλλον. Αργότερα, θα είναι επίσης διαθέσιμη στους συνδρομητές του Google AI Ultra .