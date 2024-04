L'intelligenza artificiale made in Italy corre veloce e si moltiplica. Solo negli ultimi sette giorni, infatti, sono stati annunciati due progetti importanti per lo sviluppo di modelli linguistici di grandi dimensioni (LLM, Large Language Model) nella nostra lingua. Non è il primo caso in assoluto, dopo il lancio di iGenius dello scorso gennaio, che entro l'estate rilascerà Modello Italia, applicazione di intelligenza artificiale con licenza open source e limiti alle allucinazioni dei LLM che portano fuori strada e fanno dubitare sulla loro reale efficacia.

Sono tante le speranze e le ambizioni riposte su Minerva, modello linguistico addestrato su un vasto elenco di fonti italiane e in lingua inglese, che nel complesso superano le 500 miliardi di parole. Al futuro ChatGPT in salsa tricolore toccherà agevolare il lavoro dei ricercatori, poiché il sistema è stato concepito per aggiungersi agli strumenti di sviluppo fruibili dalla comunità accademica. La novità di rilievo è che a differenza dei modelli linguistici in italiano già esistenti, qui l'addestramento sin dal primo momento è stato effettuato su testi aperti ed accessibili, mentre negli altri casi ci si è basati sui dati di modelli noti come LLaMA di Meta e Mistral, l'AI francese fondata da ex dipendenti di Google DeepMind e della stessa Meta, che sono entrambi open source ma non hanno mai rivelato in che modo e tramite quali fonti hanno sviluppato i rispettivi modelli. “Minerva è un insieme di modelli linguistici di varie dimensioni e che cresceranno nel tempo, che saranno a disposizione dei ricercatori”, ha spiegato Roberto Navigli, Professore Ordinario all'Università La Sapienza e tra i massimi esperti italiani di elaborazione del linguaggio naturale. Minerva è il prodotto delle ricerche effettuate dal gruppo di ricerca Natural Language Processing (NLP) dello stesso ateneo, all'interno di Fair (Future Artificial Intelligence Research) e grazie alla potenza del supercomputer Leonardo (il sesto più potente al mondo e il secondo in Europa) del Cineca, consorzio interuniversitario che raggruppa 70 università italiane, 2 ministeri e 46 istituzioni pubbliche nazionali. Minerva racchiude diversi modelli come quelli utilizzati da OpenAI per lo sviluppo di ChatGPT, è supportato da investimenti legati al Pnrr e i primi esempi della sua qualità si potranno saggiare dopo il rilascio della versione con chat, che avverrà entro i prossimi due mesi e permetterà di interagire in maniera rapida e semplice con l'IA.









Valeria Sandei, AD Almawave, e Francesco Ubertini, Presidente Cineca, firmano l'accordo per Velvet





Velvet è un altro modello IA in italiano, open source e multimodale, ed è stato ideato da Almawave, azienda attiva in ambito Data & Artificial Intelligence e parte del gruppo Almaviva. L'iniziativa è frutto della partnership con Cineca e punta a sviluppare un modello linguistico di grandi dimensioni di tipo fondazionale, che farà da base per lo sviluppo dei modelli successivi. Testi, video e audio saranno utilizzati per l'addestramento multimodale di Velvet mediante l'infrastruttura di calcolo del Cineca, affinché possa poi essere applicato in diversi settori per facilitare molteplici compiti in settori che spaziano dai trasporti alla sanità, dalla pubblica amministrazione al turismo. La prima versione sarà rilasciata entro l'ultimo trimestre dell'anno e potrà essere testata a livello pubblico su piattaforme open source. L'italiano sarà la sua lingua primaria ma il modello sarà disponibile anche in inglese e altri idiomi europei, ma pure in portoghese brasiliano e swahili, per favorire l'adozione a livello internazionale e perché l'America Latina e l'Africa sono aree importanti per il presente e il futuro di Almawave. Nei piani della società quotata sul mercato Euronext Growth Milan, Velvet dovrà diventare uno strumento in grado di adattarsi nel tempo alle trasformazioni di settori industriali e dei mercati generate dall'evoluzione tecnologica, per assicurare risultati efficaci sul piano quantitativo e qualitativo senza rinunciare alla corretta gestione dei dati in termini di privacy. La sfida è quindi notevole ma le carte in tavola per portare l'Italia al tavolo dei potenti dell'IA sembrano esserci.