Valentina Arcovio

L’Intelligenza artificiale comprende le frasi dalle vibrazioni della gola

(7 Gennaio 2025)

Roma – Le persone che hanno difficoltà a parlare a causa di un ictus o del Parkinson potrebbero comunicare più facilmente con l’aiuto dell’Intelligenza artificiale (Ia). Un nuovo modello di Ia costruisce ciò che una persona sta cercando di dire basandosi su piccole vibrazioni nella sua gola, ma tiene anche conto di altri fattori, come l’ora e le emozioni che potrebbe provare. A dimostrarlo è stato uno studio condotto dall’Università di Cambridge, dall’University College di Londra e dall’Università Beihang di Pechino. I risultati sono stati pubblicati sul server arXiv. Alcune condizioni neurologiche possono causare disartria, cioè la perdita del controllo preciso sulla laringe, sulla mascella o sulla lingua. Le soluzioni precedenti che utilizzavano interfacce cervello-computer hanno prodotto risultati promettenti, ma gli utenti hanno dovuto ricorrere a un intervento chirurgico invasivo per posizionare gli elettrodi sul o nel cervello. Nel nuovo studio i ricercatori hanno utilizzato sensori di deformazione tessile per misurare il movimento dei muscoli della gola, tramite vibrazioni, nonché la pulsazione nelle arterie carotidi, per far luce sullo stato emotivo di un utente, se neutro, sollevato o frustrato. Questi dati sono stati poi immessi in due grandi modelli linguistici, ciascuno basato su GPT-4o-mini, il modello alla base di ChatGPT. Il primo, noto come “token synthesis agent” (TSA), mira a estrarre le parole pronunciate intenzionalmente dall’utente e a raggrupparle in frasi. Il secondo, l’agente di espansione della frase, prende le frasi dalla TSA e usa informazioni contestuali come l’ora e il meteo, così come i dati emotivi dell’utente, per espandere le frasi in quelle che i ricercatori descrivono come “espressioni personalizzate e logicamente coerenti che catturano meglio il vero intento del paziente”, rispetto a quando le frasi vengono create senza indizi contestuali ed emotivi. I ricercatori hanno riportato che nei test condotti su cinque persone con disartria a seguito di un ictus, il loro sistema ha raggiunto tassi di errore nelle frasi bassi come il 2,9 per cento. Gli scienziati hanno anche scoperto che l’uso di indizi emotivi e contestuali da aggiungere alle frasi ha aumentato del 55 per cento la soddisfazione dell’utente rispetto alla semplice ricostruzione delle frasi. (30Science.com)

Valentina Arcovio