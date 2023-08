Tra pochi giorni avrà inizio la 31esima edizione del Defcon, probabilmente la più grande convention di hacker etici del mondo e l’intelligenza artificiale ha guadagnato il centro del palcoscenico con la complicità della Casa Bianca, che ha dato pieno sostegno all’AI Village. Accade così che l’area del Defcon dedicata all’intelligenza artificiale ospiterà il più grande evento di penetration testing pubblico volto a valutare i livelli di sicurezza delle principali piattaforme IA, tra cui quelle di Google e OpenAI. In altre parole, centinaia di esperti verificheranno se e in che misura sia possibile sabotare la tecnologia del momento.

A questo proposito sarà estremamente interessante vedere quali saranno i risultati finali, ma sarà decisamente curioso capire come verrà approcciato il tema e quali si riveleranno le capacità più utili per verificare la sicurezza delle IA. Nell’immaginario collettivo l’hacker è qualcuno che “spacca il bit in quattro”, ma i più sofisticati sanno bene che le tecniche di hacking più efficaci sono quelle di social engineering che puntano a manipolare le persone.

La domanda è: saranno più bravi gli artisti del codice o quelli dell’inganno? In definitiva l’attacco più clamoroso a ChatGPT è stato perpetrato proprio attraverso un messaggio in linguaggio naturale che ha spinto il chatbot ad abbandonare i suoi vincoli etici (di questo ne ho scritto qui). E’ altrettanto vero, però, che negli anni si sono rivelate efficaci anche aggressioni molto più tecniche che hanno di volta in volta compromesso le basi dati di addestramento, gli algoritmi stessi e via dicendo. Forse il vero problema in termini di sicurezza è proprio questo: l’intelligenza artificiale si dimostra sensibile ad entrambe le forme di attacco. Ancora una volta siamo invitati a rammentarci come questi straordinari strumenti siano terribilmente fragili e sono ragionevolmente certo che l’evento del Defcon fornirà un’ulteriore conferma.