Quaderni dei Georgofili

Archivi fotografici e testuali e intelligenza artificiale tra Accademia dei Georgofili e Archivio Elio Conti. Casi di studio

Simone Fagioli

Accademia dei Georgofili
Pagine: 12
Collana: Quaderni dei Georgofili
Contenuto in: Le applicazioni dell’Intelligenza Artificiale per la storia dell’agricoltura e del paesaggio

Copyright 2024 Accademia dei Georgofili

Lo sviluppo di algoritmi di intelligenza artificiale (IA), addestrati all’analisi di testi e fotografie con l’ulteriore possibilità di generazione di immagini “reali”, ci pone di fronte alla possibilità di utilizzo di questi strumenti per la ricerca storica, sociale, antropologica, stante l’opportunità di processare previo addestramento rilevanti quantitativi di dati sovente “dormienti” in archivi e biblioteche. La gestione analitica di archivi fotografici di migliaia o anche di milioni di immagini necessita di strumenti aggressivi, in grado di muoversi in profondità e restituire in brevissimo tempo e con l’uso del linguaggio naturale le informazioni richieste. In un archivio fotografico un’IA addestrata può essere utilizzata per la descrizione automatizzata delle immagini, con la restituzione di #tag complessi, poi analizzati da una ulteriore IA interfacciata con gli utenti per l’estrazione delle informazioni. Lo stesso vale per archivi testuali, sia a stampa sia manoscritti, dove l’IA può essere utilizzata per una lettura automatica e per la costruzione di modelli (Large language model, LLM) in grado di restituire nel modo più ampio possibile le informazioni apprese nell’addestramento.

Abstract

The development of Artificial Intelligence (AI) algorithms, trained to analyze texts and photographs with the additional possibility of generating “real” images, confronts us with the challenge of using these tools for historical, social, anthropological research, giving the opportunity to process significant amounts of data after training, often “dormant” in archives and libraries. The analytical management of photographic archives of thousands or even millions of images requires aggressive tools, capable of deep moving and returning the required information in a very short time and with the use of natural language. In a photo archive, a trained AI can be used for the automated description of images, giving back complex #tag, then analyzed by an additional AI interfaced with users for information extraction. The same applies to textual archives, printed as well as manuscript, where AI can be used for automatic reading and for the construction of models (Large language models, LLMs) capable of returning the information learned in the training as widely as possible.