gemini.jpg


Η Διεθνής Μαθηματική Ολυμπιάδα (IMO) είναι ένας από τους πιο αναγνωρισμένου κύρους διαγωνισμούς για μαθηματικούς σε όλο τον κόσμο. Σε αυτόν τον διαγωνισμό, κάθε χώρα εκπροσωπείται από έξι μαθητές προπανεπιστημιακής φοίτησης που διαγωνίζονται για να λύσουν έξι εξαιρετικά δύσκολα προβλήματα. Κάθε χρόνο, μόνο περίπου το 8% αυτών λαμβάνει το χρυσό μετάλλιο.

Στο φετινό IMO, τόσο η OpenAI όσο και η Google χρησιμοποίησαν τα πιο πρόσφατα LLM τους για να διαγωνιστούν. Το Σαββατοκύριακο, η OpenAI ισχυρίστηκε ότι το πειραματικό συλλογιστικό LLM πέτυχε απόδοση επιπέδου χρυσού μεταλλίου. Η OpenAI αξιολόγησε τα μοντέλα της στα προβλήματα του IMO 2025 με τους ίδιους κανόνες που ισχύουν και για τους φοιτητές. Τα μοντέλα έπρεπε να λύσουν τα προβλήματα σε δύο συνεδρίες εξετάσεων 4,5 ωρών, χωρίς πρόσβαση σε εργαλεία ή στο διαδίκτυο, και να γράψουν αποδείξεις σε φυσική γλώσσα.

Πετύχαμε επίδοση επιπέδου χρυσού μεταλλίου 🥇 στη Διεθνή Μαθηματική Ολυμπιάδα του 2025 με ένα LLM γενικής χρήσης συλλογισμού!

Το μοντέλο μας έλυσε μαθηματικά προβλήματα παγκόσμιας κλάσης—στο επίπεδο κορυφαίων ανθρώπινων διαγωνιζόμενων. Ένα σημαντικό ορόσημο για την Τεχνητή Νοημοσύνη και τα μαθηματικά. https://t.co/u2RlFFavyT

— OpenAI (@OpenAI) 19 Ιουλίου 2025

Σήμερα, η Google ισχυρίστηκε ότι μια προηγμένη έκδοση του Gemini Deep Think έλυσε πέντε από τα έξι προβλήματα κατά τη γνώμη μου, επιτυγχάνοντας απόδοση επιπέδου χρυσού μεταλλίου. Αυτή η προηγμένη έκδοση του Gemini Deep Think υποστηρίζεται από μια βελτιωμένη λειτουργία συλλογισμού χρησιμοποιώντας το πιο πρόσφατο ερευνητικό έργο του Google DeepMind, συμπεριλαμβανομένης της παράλληλης σκέψης. Αυτό επέτρεψε στο Gemini να εξερευνήσει πολλαπλές λύσεις ταυτόχρονα αντί να εξερευνά μία μόνο λύση.

Η ομάδα Google DeepMind έγραψε τα εξής σχετικά με αυτήν την προηγμένη έκδοση του Gemini Deep Think:

«Για να αξιοποιήσουμε στο έπακρο τις δυνατότητες συλλογισμού του Deep Think, εκπαιδεύσαμε επιπλέον αυτήν την έκδοση του Gemini σε νέες τεχνικές ενισχυτικής μάθησης που μπορούν να αξιοποιήσουν περισσότερα δεδομένα συλλογισμού πολλαπλών βημάτων, επίλυσης προβλημάτων και απόδειξης θεωρημάτων. Επίσης, παρείχαμε στο Gemini πρόσβαση σε ένα επιμελημένο corpus λύσεων υψηλής ποιότητας σε μαθηματικά προβλήματα και προσθέσαμε στις οδηγίες του κάποιες γενικές συμβουλές και υποδείξεις για το πώς να προσεγγίζουμε προβλήματα κατά τη γνώμη μου.»

Η Google θα κυκλοφορήσει αυτήν τη νέα έκδοση του μοντέλου Deep Think σε μια ομάδα έμπιστων δοκιμαστών στο εγγύς μέλλον. Αργότερα, θα είναι επίσης διαθέσιμη στους συνδρομητές του Google AI Ultra .