Roma – Nuovo strumento di tracciamento mira a catalogare gli accordi conclusi fra editori accademici e aziende tecnologiche che hanno come oggetto l’addestramento dell’dell’intelligenza artificiale generativa, IA. Lanciato a ottobre, sviluppato da un gruppo di ricerca internazionale, tra cui Roger Schonfeld, vicepresidente di biblioteche, comunicazione accademica e musei presso Ithaka S+R, una società di consulenza per l’istruzione superiore di New York City, il Generative AI Licensing Agreement Tracker include informazioni sugli accordi di licenza, confermati e futuri, tra aziende tecnologiche e sei importanti editori accademici, tra cui Wiley, Sage e Taylor & Francis. La decisione di creare uno strumento di mappatura degli accordi tra editorie aziende è sorta a seguito dell’esplosione di popolarità dell’intelligenza artificiale, che ha visto diversi editori accademici stringere accordi con aziende tecnologiche che cercano di utilizzare i contenuti per addestrare i grandi modelli linguistici, LLM, che stanno alla base dei loro strumenti di IA. “Stavamo assistendo agli annunci di questi accordi e abbiamo iniziato a pensare che questo stesse iniziando a diventare un modello”, ha detto Schonfeld. “Volevamo fare luce non solo sui singoli accordi, ma anche su come stava iniziando a delinearsi il modello generale, e fornire una fonte per la comunità”, ha continuato Schonfeld, che ha precisato che l’elenco documenta solo accordi pubblici e che probabilmente ce ne sono molti altri che rimangono non divulgati. “Molti editori stanno prendendo in considerazione questioni come il modo in cui la concessione in licenza, o meno, di contenuti alle aziende di IA generativa inciderà sui ricavi e i rischi o i benefici di essere tra i primi ad agire in questo spazio”, ha affermato Schonfeld. “Ogni editore di una certa scala e oltre è assolutamente alle prese con questo problema”, ha proseguito Schonfeld. Diversi grandi editori hanno incassato i soldi degli accordi di licenza AI quest’anno. A maggio, Informa, la società madre dell’editore accademico britannico Taylor & Francis, ha annunciato di aver concluso un accordo da dieci milioni di dollari per la licenza di contenuti a Microsoft. Il mese successivo, l’editore accademico statunitense Wiley ha annunciato ai suoi investitori di aver guadagnato 23 milioni di dollari da un accordo con un’azienda senza nome che sviluppa modelli di AI generativa. A settembre, la società ha affermato che si aspettava di guadagnare altri 21 milioni di dollari da tali accordi quest’anno finanziario. Nature ha contattato diversi altri editori, tra cui Elsevier e Springer Nature, l’editore di Nature, per sapere se avessero in programma accordi di licenza, ma non ha ricevuto alcun commento. “Stiamo fornendo dati e contenuti su licenza per scopi di formazione dell’IA, come LLM, in modo che tali modelli diventino più accurati e pertinenti a beneficio di tutti coloro che li utilizzano”, ha dichiarato un portavoce di Taylor & Francis in una dichiarazione. “Le attività di licenza come questa sono una responsabilità fondamentale per gli editori di ricerca e fanno parte del nostro impegno continuo per garantire che le idee degli autori diano il massimo contributo possibile”, ha continuato l’editore. Un portavoce di Wiley ha dichiarato che le royalty saranno pagate agli autori di libri e ad altri partner editoriali e che sta monitorando gli sviluppatori di modelli di intelligenza artificiale per l’uso di materiale protetto da copyright senza autorizzazione. Molti degli editori contattati da Nature hanno affermato di aver adottato misure per impedire agli strumenti di intelligenza artificiale di estrarre i loro contenuti dal web senza autorizzazione. Alcuni editori non hanno ancora stipulato alcun accordo, tra cui l’American Association for the Advancement of Science, AAAS, un editore accademico senza scopo di lucro che pubblica Science. Meagan Phelan, direttore delle comunicazioni per la famiglia di riviste Science a Washington DC, ha dichiarato che l’AAAS potrebbe prendere in considerazione la possibilità di concedere in licenza i suoi contenuti ad aziende tecnologiche in futuro, se soddisfano determinati criteri; tra questi, la valutazione dell’affidabilità di un’azienda e l’utilità degli strumenti che saranno creati con i contenuti. Ci sono segnali che gli editori non considerano questi accordi come un evento isolato. A ottobre, Wiley ha lanciato un programma denominato Wiley AI Partnerships, mirato a collaborare con aziende tecnologiche per sviluppare applicazioni di intelligenza artificiale. “Questo viene preso molto sul serio”, ha osservato Maya Dayan, co-creatrice del tracker e responsabile del programma per la ricerca strategica e l’analisi di mercato presso ITHAKA, la società madre di Ithaka S&R. “Stiamo assistendo alla creazione di nuove posizioni e dipartimenti, alla definizione di nuove priorità: questi non sono accordi isolati”, ha aggiunto Dayan. Alcuni studiosi hanno mostrato preoccupazione per gli accordi conclusi senza la conoscenza dei contenuti. Per affrontare questo problema, alcuni editori hanno preso misure per coinvolgere gli autori nel processo. La casa editrice accademica berlinese, De Gruyter Brill, ha creato una pagina informativa per gli autori, in cui spiega i suoi piani per stipulare accordi formali con gli sviluppatori di intelligenza artificiale generativa. “Mentre molti autori ci hanno dato il loro consenso esplicito per usare i loro titoli, comprendiamo pienamente che altri rimangano scettici o preoccupati per l’impatto sociale complessivo dell’IA e per i nostri recenti annunci”, ha notato Pablo Dominguez Andersen, direttore delle comunicazioni presso De Gruyter Brill. “Stiamo attualmente interagendo direttamente con molti di questi autori, per comprendere le loro preoccupazioni e spiegare il nostro approccio e perché crediamo che stipulare accordi formali sia l’unica via da seguire”, ha commentato Dominguez Andersen. Cambridge University Press & Assessment, CUPA, sta adottando un approccio opt-in: l’editore del Regno Unito ha contattato 20.000 autori per ottenere il permesso di concedere in licenza i propri contenuti alle aziende tecnologiche che sviluppano LLM. “Volevamo chiedere agli autori, non perché pensiamo che non dovrebbero volere che i loro contenuti finiscano lì, ma perché vogliamo essere in grado di dire loro perché questa è una buona cosa”, ha sottolineato Mandy Hill, amministratore delegato di CUPA, a The Bookseller in ottobre. Secondo Hill, solo pochi autori hanno rifiutato di concedere in licenza i propri contenuti. “È stato interessante vedere i diversi approcci al modo in cui gli autori vengono coinvolti”, ha precisato Dayan. “Ho iniziato a vedere una tendenza a comunicare in modo molto diretto con gli autori fin dall’inizio, piuttosto che annunciare un accordo e poi interagire con gli autori”, ha concluso Dayan.(30Science.com)
Lucrezia Parpaglioni
Mappati gli accordi di vendita tra editori e aziende per addestrare l’IA
(12 Dicembre 2024)
Lucrezia Parpaglioni
Sono nata nel 1992. Sono laureata in Media Comunicazione digitale e Giornalismo presso l'Università Sapienza di Roma. Durante il mio percorso di studi ho svolto un'attività di tirocinio presso l'ufficio stampa del Consiglio Nazionale delle Ricerche (CNR). Qui ho potuto confrontarmi con il mondo della scienza fatto di prove, scoperte e ricercatori. E devo ammettere che la cosa mi è piaciuta. D'altronde era prevedibile che chi ha da sempre come idolo Margherita Hack e Sheldon Cooper come spirito guida si appassionasse a questa realtà. Da qui la mia voglia di scrivere di scienza, di fare divulgazione e perché no? Dimostrare che la scienza può essere anche divertente.