Bătălia AI-urilor trece la următorul nivel, Google lansând versiunea Gemini 2.5 Pro pe 25 martie. E în faza experimentală încă şi e promovat drept cel mai inteligent model AI de până acum, fiind deja amplasat pe locul întâi în topul LMArena.
O funcţie cheie a lui Gemini 2.5 Pro este abilitatea sa de a gândi şi raţiona înainte de a răspunde, pentru acurateţe sporită în task-uri complexe. E disponibil doar pentru utilizatorii de Gemini Advanced pe web şi atât, nu pe mobil încă. Are o fereastră de context de 1 milion de tokeni. Faptul că AI-ul gândeşte înainte să răspundă, scade şansele să ne trezim cu răspunsuri halucinante.
Aceste capabilităţi ar urma să fie integrate şi pe versiunile viitoare de modele Google, dar şi în cele actuale. La testele făcute până acum Google Gemini 2.5 Pro a depăşit DeepSeek R1, GPT-4.5, Claude Sonnet 3.7, Grok 3 Beta şi OpenAI o3-mini. La ce? La sarcini legate de editare de cod, matematică, ştiinţă, raţionamente lungi şi multe altele.
A stat puţin mai prost decât unii rivali la generarea de cod şi factualitate. Poate cel mai important test a fost Humanity's Last Exam, un benchmark academic care testează cunoștințele umane într-o gamă largă de domenii.