Valentina Di Paola

L’IA riesce ora a generare filigrane per il testo

(24 Ottobre 2024)

Roma – Si chiama SynthID-Text, è uno strumento di intelligenza artificiale in grado di aggiungere una filigrana al testo generato da grandi modelli linguistici, migliorando così la capacità di identificare e tracciare il contenuto sintetico. Descritto sulla rivista Nature, questo risultato è stato raggiunto dagli scienziati di Google DeepMind. Il team, guidato da Sumanth Dathathri e Pushmeet Kohli, ha realizzato uno schema che utilizza un nuovo algoritmo di campionamento per applicare filigrane al testo generato dall’intelligenza artificiale. I Large Language Model (LLM), spiegano gli esperti, sono strumenti di intelligenza artificiale ampiamente utilizzati che possono generare testo per chatbot, supporto alla scrittura e altri scopi. Tuttavia, può essere difficile identificare e attribuire il testo generato dall’AI a una fonte specifica, il che può mettere in discussione l’affidabilità delle informazioni fornite. Come possibile soluzione a questo limite, sono state proposte le filigrane, che però non sono state implementate su larga scala a causa dei severi requisiti di qualità ed efficienza computazionale nei sistemi di produzione. SynthID-Text utilizza un algoritmo di campionamento per influenzare in modo sottile la scelta delle parole dell’LLM, inserendo una firma che può essere riconosciuta dal software di rilevamento associato. L’applicazione della filigrana può avvenire in modo “distorsivo”, che compromette leggermente la qualità delle risposte, o “non distorsivo”, attraverso un processo che non altera il testo di output. La rilevabilità di queste filigrane è stata valutata su diversi modelli. Stando a quanto emerge dall’indagine, SynthID-Text è associato a una rilevabilità migliorata rispetto agli approcci esistenti. La qualità del testo è stata valutata anche utilizzando quasi 20 milioni di risposte da interazioni di chat live utilizzando Gemini LLM. I dati confermano che la modalità non distorsiva non alterava la qualità del testo. Infine, l’uso di SynthID-Text ha un impatto trascurabile sulla potenza di calcolo necessaria per eseguire LLM, riducendo la barriera all’implementazione. Gli autori precisano che le filigrane di testo possono essere aggirate modificando o parafrasando l’output. Tuttavia, concludono gli scienziati, questo lavoro mostra la fattibilità di uno strumento in grado di produrre filigrane di testo per contenuti generati dall’intelligenza artificiale, in un ulteriore passo verso il miglioramento della responsabilità e della trasparenza dell’uso responsabile dei LLM. (30Science.com)

Valentina Di Paola
Classe ’94, cresciuta a pane e fantascienza, laureata in Scienze della comunicazione, amante dei libri, dei gatti, del buon cibo, dei giochi da tavola e della maggior parte di ciò che è anche solo vagamente associato all’immaginario nerd. Collaboro con 30science dal gennaio 2020 e nel settembre 2021 ho ottenuto un assegno di ricerca presso l’ufficio stampa dell’Istituto di ricerca sugli ecosistemi terrestri del Consiglio nazionale delle ricerche. Se dovessi descrivermi con un aggettivo userei la parola ‘tenace’, che risulta un po’ più elegante della testardaggine che mi caratterizza da prima che imparassi a usare la voce per dar senso ai miei pensieri. Amo scrivere e disegnare, non riesco a essere ordinata, ma mi piace pensare che la mia famiglia e il mio principe azzurro abbiano imparato ad accettarlo. La top 3 dei miei sogni nel cassetto: imparare almeno una lingua straniera (il Klingon), guardare le stelle più da vicino (dal Tardis), pilotare un velivolo (il Millennium Falcon).