Două modele de inteligență artificială – „O1” de la OpenAI (SUA) și „R1” de la DeepSeek (China) - au reușit să treacă pragul de admitere la una dintre cele mai exigente universități din lume: Universitatea din Tokyo. E vorba de testul pentru sesiunea 2025, pe secțiunea Științe 3, iar scorurile au fost validate de profesori din centrul educațional japonez Kawai Juku, în cadrul unui experiment coordonat de publicația Nikkei Asia.
Rezultatele? Modelul american O1 a strâns 374 de puncte din 550, iar cel chinez R1 a acumulat 369 – ambele peste pragul minim de admitere (368,7 puncte). Totuși, doar pe această secțiune. R1 a picat la Științe 1 și Științe 2, în ciuda faptului că a avut un nivel comparabil cu O1 în domeniile umaniste. Practic, modelele au reprodus destul de bine structura unui candidat mediu, în special la probele de engleză, unde ambele au avut o rată de corectitudine de peste 75%. Potrivit profesorului Hisahide Hideo, vocabularul și gramatica oferite de AI au fost chiar peste nivelul candidaților umani, fără greșeli evidente.
Când vine vorba însă de matematică, lucrurile se schimbă. Modelele au dat rateuri consistente la întrebările care implicau raționamente și grafice. O1 a obținut doar 38 din 120 de puncte, iar R1 a avut 49 – cu mult sub media minimă a celor admiși. Explicațiile oferite au fost deseori incomplete, greșite sau pur și simplu lipsite de coerență.
Profesorul Noriko Arai, implicat de ani buni în proiectul „Pot roboții să intre la Universitatea din Tokyo?”, a subliniat în 2018 că, deși rezultatul marchează un progres semnificativ în domeniul AI, sistemele actuale (nn cele din 2018) sunt departe de a înlocui un elev bine pregătit. De fapt, modelele pot oferi răspunsuri convingătoare dar complet greșite, motiv pentru care este esențial să fie folosite cu discernământ.
Experimentul trage o linie clară între ceea ce poate face AI-ul azi și ceea ce încă îi scapă: gândirea abstractă, logica în lanț și interpretarea corectă a unei probleme complexe, exact zonele în care matematica face diferența. În schimb, pe partea de limbaj și memorare, modelele se apropie deja de nivelul uman, dacă nu cumva îl și depășesc.