30Science.com

Nuovo algoritmo legge sarcasmo nelle registrazioni audio

(16 Maggio 2024)

Roma – Oscar Wilde una volta disse che il sarcasmo è la forma più bassa di ingegno, ma la forma più alta di intelligenza. Forse ciò è dovuto alla difficoltà di utilizzo e comprensione. Il sarcasmo è notoriamente difficile da trasmettere attraverso il testo: anche di persona può essere facilmente frainteso. I sottili cambiamenti di tono che trasmettono sarcasmo spesso confondono anche gli algoritmi informatici, limitando gli assistenti virtuali e gli strumenti di analisi dei contenuti.

Xiyuan Gao, Shekhar Nayak e Matt Coler del Speech Technology Lab presso l’Università di Groningen, Campus Fryslân hanno sviluppato un algoritmo multimodale per un migliore rilevamento del sarcasmo che esamina molteplici aspetti delle registrazioni audio per una maggiore precisione. Gao presenterà il proprio lavoro come parte di un incontro congiunto della Acoustical Society of America e della Canadian Acoustical Association, cin corso presso lo Shaw Center situato nel centro di Ottawa, Ontario, Canada.

Gli algoritmi tradizionali di rilevamento del sarcasmo spesso si basano su un singolo parametro per produrre i loro risultati, che è la ragione principale per cui spesso non sono all’altezza. Gao, Nayak e Coler hanno invece utilizzato due approcci complementari: l’analisi del sentiment utilizzando il testo e il riconoscimento delle emozioni tramite l’audio – per un quadro più completo.

“Abbiamo estratto parametri acustici come tono, velocità di pronuncia ed energia dal parlato, quindi abbiamo utilizzato il riconoscimento vocale automatico per trascrivere il discorso in testo per l’analisi del sentimento”, ha affermato Gao. “Successivamente, abbiamo assegnato delle emoticon a ciascun segmento del discorso, riflettendone il contenuto emotivo. Integrando questi segnali multimodali in un algoritmo di apprendimento automatico, il nostro approccio sfrutta i punti di forza combinati delle informazioni uditive e testuali insieme alle emoticon per un’analisi completa”.

Il team è ottimista riguardo alle prestazioni del proprio algoritmo, ma sta già cercando modi per migliorarlo ulteriormente.

“Esistono una serie di espressioni e gesti che le persone usano per evidenziare elementi sarcastici nel discorso”, ha detto Gao. “Questi devono essere meglio integrati nel nostro progetto. Inoltre, vorremmo includere più lingue e adottare tecniche di riconoscimento del sarcasmo in via di sviluppo”.

Questo approccio può essere utilizzato per qualcosa di più che identificare uno spirito secco. I ricercatori evidenziano che questa tecnica può essere ampiamente applicata in molti campi.

“Lo sviluppo della tecnologia di riconoscimento del sarcasmo può avvantaggiare altri ambiti di ricerca utilizzando l’analisi dei sentimenti e il riconoscimento delle emozioni”, ha affermato Gao. “Tradizionalmente, l’analisi del sentiment si concentra principalmente sul testo ed è sviluppata per applicazioni come il rilevamento dell’incitamento all’odio online e l’estrazione delle opinioni dei clienti. Il riconoscimento delle emozioni basato sul parlato può essere applicato all’assistenza sanitaria assistita dall’intelligenza artificiale. La tecnologia di riconoscimento del sarcasmo che applica un approccio multimodale è utile per questi ambiti di ricerca”.(30Science.com)

30Science.com
Agenzia di stampa quotidiana specializzata su temi di scienza, ambiente, natura, salute, società, mobilità e tecnologia. Ogni giorno produciamo una rassegna stampa delle principali riviste scientifiche internazionali e quattro notiziari tematici: Scienza, Clima & Natura, Salute, Nuova Mobilità e Ricerca Italiana contatti: redazione@30science.com + 39 3492419582