Valentina Di Paola

La sociolinguistica potrebbe rendere l’Ia più inclusiva

(13 Gennaio 2025)

Roma – La sociolinguistica potrebbe migliorare i modelli generativi, riducendo il rischio di pregiudizi, bias e stereotipi nell’intelligenza artificiale. Questo curioso risultato emerge da uno studio, pubblicato sulla rivista Frontiers in Artificial Intelligence, condotto dagli scienziati dell’Università di Birmingham. Il team, guidato da Jack Grieve, ha sviluppato un nuovo quadro per comprendere meglio i grandi modelli linguistici (LLM) integrando i principi della sociolinguistica, ovvero lo studio della variazione e del cambiamento linguistico. I motori linguistici che alimentano l’intelligenza artificiale generativa, spiegano gli esperti, sono associati a una vasta gamma di problemi che possono danneggiare la società, in particolare attraverso la diffusione di disinformazione e contenuti discriminatori, come stereotipi razzisti e sessisti. In gran parte, queste carenze dipendono dai database su cui vengono addestrati. Il gruppo di ricerca sostiene che rappresentando accuratamente diverse varietà di linguaggio, le prestazioni dei sistemi di intelligenza artificiale potrebbero essere notevolmente migliorate, riducendo il rischio di pregiudizi sociali, disinformazione, adattamento di dominio e allineamento con i valori sociali. Gli autori sottolineano pertanto l’importanza di utilizzare principi sociolinguistici per addestrare gli LLM a rappresentare meglio i diversi dialetti, registri e periodi di cui è composta una lingua, aprendo nuove strade allo sviluppo di sistemi di intelligenza artificiale più accurati e affidabili, nonché più etici e socialmente consapevoli. “Le Ia generative come ChatGPT – afferma Grieve – potrebbero essere più propense a produrre rappresentazioni negative su determinate etnie e generi, ma la nostra ricerca offre soluzioni su come addestrare meglio i modelli e mitigare i pregiudizi sociali. Se il corpus iniziale contiene espressioni relativamente frequenti di contenuti potenzialmente controversi, è inevitabile che gli LLM li incorporeranno”. Questi risultati, riportano gli esperti, suggeriscono che la sociolinguistica potrebbe migliorare il valore sociale delle intelligenze artificiali di tipo generativo. “Aumentare diversità sociolinguistica dei dati di formazione– ribadisce Grieve – è molto più importante che espanderne la scala. Emerge pertanto una chiara e urgente necessità di approfondimenti sociolinguistici nella progettazione e valutazione di modelli linguistici. Incorporare intuizioni provenienti dalle discipline umanistiche e dalle scienze sociali è fondamentale per sviluppare sistemi di intelligenza artificiale che servano meglio l’umanità”. (30Science.com)

Valentina Di Paola
Classe ’94, cresciuta a pane e fantascienza, laureata in Scienze della comunicazione, amante dei libri, dei gatti, del buon cibo, dei giochi da tavola e della maggior parte di ciò che è anche solo vagamente associato all’immaginario nerd. Collaboro con 30science dal gennaio 2020 e nel settembre 2021 ho ottenuto un assegno di ricerca presso l’ufficio stampa dell’Istituto di ricerca sugli ecosistemi terrestri del Consiglio nazionale delle ricerche. Se dovessi descrivermi con un aggettivo userei la parola ‘tenace’, che risulta un po’ più elegante della testardaggine che mi caratterizza da prima che imparassi a usare la voce per dar senso ai miei pensieri. Amo scrivere e disegnare, non riesco a essere ordinata, ma mi piace pensare che la mia famiglia e il mio principe azzurro abbiano imparato ad accettarlo. La top 3 dei miei sogni nel cassetto: imparare almeno una lingua straniera (il Klingon), guardare le stelle più da vicino (dal Tardis), pilotare un velivolo (il Millennium Falcon).