Esplora i grafici ed il set di indici statistici basati sulla collezione di immagini da noi raccolta negli scorsi giorni.
Gemini, sviluppato da Google DeepMind, è una famiglia di modelli multimodali annunciata nel dicembre 2023 come evoluzione dei modelli PaLM. Gemini è stato progettato fin dall'inizio per gestire testo, immagini, audio e video, con un'integrazione nativa tra i diversi tipi di dati. A differenza di modelli addestrati separatamente per ogni tipo di input, Gemini è addestrato in modo multimodale, cioè elabora e collega parole, pixel e suoni nello stesso spazio di rappresentazione. Questo gli consente di generare, descrivere e analizzare immagini in modo fluido e coerente.
Gemini AI rivela evidenti bias di genere nella rappresentazione visiva di diverse professioni. I ruoli associati a prestigio, autorità o ambito tecnico (come ingegnere, medico, politico) sono raffigurati prevalentemente da figure maschili, mentre le professioni legate alla cura o al lavoro domestico (insegnante, cassiera, domestica) sono dominate da figure femminili. Alcuni ruoli mostrano addirittura una totale assenza di rappresentanza di un genere, sottolineando la persistenza di stereotipi nei dati usati per addestrare i modelli generativi.
Un'analisi del dataset di 173 immagini generate da Gemini AI rivela un'evidente prevalenza di espressioni neutre, con oltre il 72% dei volti classificati come tali. Le emozioni positive come "sorridente" e "felice" sono nettamente meno rappresentate, mentre le espressioni negative o serie sono quasi assenti. Questa distribuzione suggerisce un forte bias verso l’emozione neutra, probabilmente legato a una tendenza dei modelli generativi a minimizzare le espressioni emotive, forse per ragioni di generalizzazione o "sicurezza visiva".
In oltre il 70% delle immagini analizzate, l'intelligenza artificiale di Gemini genera volti con espressione neutra. Questo dato suggerisce una tendenza marcata verso la neutralità emozionale, probabilmente scelta dal modello per garantire sicurezza, ambiguità controllata o una forma di universalità estetica.
Quando Gemini “osa” mostrare emozione, privilegia quella positiva, anche se non è ancora capace di riflettere pienamente la complessità affettiva del volto umano.
Le immagini generate da AI mostrano una forte predominanza di volti “occidentali” e “orientali” in molte professioni, con scarsissima presenza di persone afrodiscendenti. Questo squilibrio riflette una rappresentazione etnicamente non inclusiva.
Gemini non migliora affatto rispetto agli altri modelli. La concentrazione etnica nei diversi lavori non solo è impari, bensì nettamente polarizzata. Si può dunque dire che è razzista?
Su un campione di 172 immagini generate da Gemini AI, emerge una forte sproporzione nella rappresentazione delle tonalità di pelle: oltre l’80% dei volti ha tonalità molto chiare (tipi I–III), mentre solo il 2.31% è rappresentato da tonalità molto scure (tipi V–VI). Il tipo II, associato a carnagioni chiare europee, domina con un 50.29%, seguito dal IV (mediterraneo/intermedio) al 23.12%. Le tonalità più scure, V e VI, sono quasi assenti con appena 4 immagini su 172. Nonostante ciò, Gemini risulta distribuire maggiormente le percentuali non concentrandole solo su quella predominante, rispetto al resto delle AI.