Meta a lansat ImageBind, un model AI revoluționar care analizează și extrage informații pe 6 planuri diferite

Autor: Mihai Gabriel Arsene | Publicat în: Facebook 1.624 ori 10-05-2023

Meta a lansat ImageBind, un model AI revoluționar care analizează și extrage informații pe 6 planuri diferite

Anul 2023 este cu siguranță marcat de evoluția tehnologiilor AI. Se duce o luptă de proporții pe acest segment de piață după ce OpenAI a lansat ChatGPT. Azi Meta a lansat propriul model de Inteligență Artificială. Se numește ImageBind, iar compania spune că este un AI revoluționar, care poate analiza și extrage informații pe 6 planuri diferite: text, imagine, audio, Depth (adânciome), Thermal (temperatură) și Inertial Measurement Units (IMU). Detalii avem mai jos.

ImageBind încorporează mai mulți senzori folosiți pentru extragerea și generarea informațiilor. Reprezintă un salt semnificativ în capabilitățile AI, transcenzând limitările modelelor anterioare instruite individual. Intrările senzoriale încorporate fac ca mașinile / roboții să înțeleagă și să facă legături între diverse aspecte ale informațiilor.

Meta a anunțat opțiunea „Make-A-Scene” pentru acest AI. ImageBind poate genera fotografii / imagini pe baza sunetului, în încercarea de a crea o experiență audio-video captivantă. În plus, ImageBind deschide ușile pentru recunoașterea, moderarea și crearea de conținut precis, inclusiv generare de conținut media fără întreruperi și funcționalități îmbunătățite de căutare multimodală.

Conform comunicatului oficial, ImageBind pune bazele cercetărilor pentru a explora noi frontiere, Meta făcând eforturi ample mentru a dezvolta sisteme AI multimodale. Capacitatea modelului de a combina senzorii 3D și IMU ar putea revoluționa designul și experiența unor lumi virtuale imersive. Totodată, ImageBind oferă o cale de explorare a amintirilor, permițând căutări în diferite modalități, cum ar fi text, audio, imagini și videoclipuri.

Spre deosebire de alte modele AI, ImageBind are un comportament unic de scalare a informațiilor. Învață printr-un sistem autonom și folosește exemple minime de antrenament, prezentând noi capabilități de asoeciere audio și text sau de predicție a profunzimii din imagini.

Odată cu lansarea acestui AI, Meta urmărește să deschidă calea spre o nouă modalitate de învățare a mașinăriilor și a roboților, bazată pe analiză multimodală. Codul sursă al acestui nou AI e disponibil în mod public pe Github, aici.