Google introduce o nouă funcționalitate de partajare a ecranului pentru Gemini Live. Utilizatorii pot include imaginea ecranului în conversațiile cu Gemini, solicitând asistență AI. De asemenea, pot activa accesul la cameră, permițând lui Gemini să analizeze mediul înconjurător pentru răspunsuri mai relevante.
Gemini poate utiliza partajarea ecranului pentru a descrie conținutul pentru utilizatorii nevăzători, generând descrieri audio mai detaliate ale imaginilor. Această funcție este disponibilă și pentru imagini din mesaje sau întâlnite online. Persoanele cu deficiențe de vedere pot folosi camera pentru a obține descrieri audio detaliate ale obiectelor și mediului din jur, prin intermediul inteligenței artificiale.
Pentru utilizatorii obișnuiți, partajarea ecranului îmbunătățește contextul conversației, permițând chatbot-ului să acționeze ca un asistent intuitiv, ghidându-i în sarcini complexe sau simple pe telefon sau tabletă.
Demonstrate pentru prima dată la expoziția MWC 2025, noile capabilități Gemini Live fac parte din proiectul Astra al Google. Această inițiativă urmărește dezvoltarea abilităților de înțelegere ale modelelor AI prin metode mai avansate de analiză în timp real.
Conform unei demonstrații, Gemini poate memora detalii din conversație, inclusiv obiecte afișate anterior pe ecran. Totuși, observația nu este în timp real, sistemul înghețând imaginea pentru a realiza capturi de ecran ce sunt procesate ulterior în cloud. Aceasta poate limita înțelegerea situațiilor dinamice din video. Cu toate acestea, posibilitatea ca Gemini să vadă prin camera telefonului și să răspundă prompt la întrebări reprezintă un progres semnificativ pentru chatbot-ul Google, fiind util pentru mulți utilizatori.
Aurelian Mihai
Sunt pasionat de tehnologie și inovație. În afara scrierii articolelor pentru Zona IT, îmi place să urmăresc seriale științifico-fantastice, documentare și să explorez ultimele noutăți. În weekend, îți poți găsi cu bicicleta în parc sau în excursii cu familia.