După o scurtă amânare, Google a prezentat în sfârşit Gemini, răspunsul mult aşteptat la GPT-4 şi o soluţie de AI generativ integrată în chatbot-ul Google Bard. Gemini este un LLM (large language model) şi deocamdată e disponibil în versiunea 1.0.
Reprezintă doar primul dintr-o nouă generaţie de modele AI, inspirate de modul în care oamenii interacţionează cu universul din jur şi modul în care răspund la el. Proiectul vine ca un fruct al colaborării dintre diviziile Google DeepMind şi Google Research. Gemini este un AI integrat multimodal. Google a pre-antrenat Gemini şi l-a tunat pe diferite modalităţi de utilizare şi de înțelegere.
Poate înţelege majoritatea tipurilor de input, de la text la voce şi imagini. Poate programa şi e specializat pe Python, Java, C++ şi Go. O versiune specializată a lui Gemini poate chiar crea cod AlphaCode 2, succesorul lui generativeAI. AlphaCode 2 a rezolvat de 2 ori mai multe întrebări dificile decât predecesorul său.
Gemini e şi flexibil şi poate opera pe data centere uriaşe, dar şi pe telefonul mobil. El vine în 3 variante: Nano, Pro şi Ultra. Nano rulează pe dispozitive şi se ocupă de sarcini locale, Pro e mai versatil şi va fi integrat în curând în produsele Google, inclusiv Bard. Începând de azi Bard va oferi o versiune specială de Pro, care oferă înţelegere, planificare şi raţionament superioare.
Chatbot-ul superior va sosi în 170 de ţări. În 2024 vine Ultra, care va aduce la pachet un Bard Advanced, cu extra funcţii. Google aduce din capabilităţile lui Gemini Pro şi în Ads, Chrome, Duet AI, Căutare, Google Cloud Vertex şi AI Studio. Pe scurt, Gemini pe Pixel 8 Pro poate rezuma ce aude în înregistrări audio şi va oferi răspunsuri sugerate în conversaţiile WhatsApp.
Modelul de bază poate rezolva probleme de matematică la nivel de elev de liceu.