1. DeepFake e Detection
Nel 2021 modificare un’immagine o un video è diventato qualcosa di molto semplice.
Da Photoshop a Gimp per le immagini e, grazie all’intelligenza artificiale (deeplearning) per i video, è possibile creare manipolazioni estremamente realistiche. E qui sta il problema, essendo le falsificazioni sempre più sofisticate, così come le tecniche per nascondere le falsificazioni, anche l’occhio più allenato non riesce a distinguere più il vero dal falso.
Era il 2017 quando su Reddit è apparso il primo videofake, che presentava al mondo di internet una nuova dimensione, ricca di opportunità ma purtroppo anche di notevoli pericoli. È per questo che negli ultimi 15 anni la comunità scientifica e la MultiMedia Forensics hanno intensificato gli sforzi e prodotto molte tecniche per la rivelazione automatica delle manipolazioni sia di immagini che di video, ma la battaglia e lungi dall’essere vinta.
In tutto questo si aggiunge il fenomeno delle condivisioni tramite i canali social, che ad ogni re-invio modifica, generalmente comprimendo, il file originale, rendendo sempre più difficile se non impossibile riuscire a rilevare le manipolazioni.
2. I DeepFake
Questo scenario è ulteriormente peggiorato con l’avvento del “deep learning”, una branca dell’intelligenza artificiale, e in particolare con l’uso delle reti neurali convoluzionali (CNN), ne abbiamo parlato nel progetto precedente.
Nato per risolvere svariati problemi complessi che vanno dall’analisi dei big data alla computer-vision e molto altro, ha purtroppo visto enormi progressi anche nella sviluppo di software che possono causare minacce alla privacy, alla democrazia e alla sicurezza nazionale, i deepfake appunto.
Con questa nuova tecnologia è possibile effettuare manipolazioni estremamente sofisticate non solo di immagini, ma anche di video. Su internet è già possibile trovare app scaricabili anche gratuitamente, come DeepFake, che permettono di generare contenuti manipolati molto realistici. L’unico requisito è avere elevate quantità di dati a disposizione (i cosiddetti dataset) per addestrare correttamente la rete neurale.
La vera rivoluzione è che queste nuove metodologie richiedono poca a nessuna abilità da parte dell’utente. Infatti, non bisogna modificare manualmente l’illuminazione, ruotare il volto, o perdere ore e ore per rendere la contraffazione quanto più realistica possibile. La rete neurale è in grado di apprendere da sola cosa fare a partire dai dati disponibili. E’ chiaro quindi perché questa tecnologia spaventi così tanto: ha messo alla portata di tutti manipolazioni che prima richiedevano un elevato livello di competenza o un attrezzato set cinematografico.
In particolare, le manipolazioni ai volti sono quelle che hanno una maggiore impatto visivo. E’ possibile infatti sostituire il volto di una persona a quello di un’altra, oppure modificare l’espressione del volto di qualcuno, magari un politico, e con esso anche le parole che sta pronunciando. Tra l’altro, non solo è possibile realizzare manipolazioni localizzate, ma anche generare immagini completamente sintetiche, o modificare gli attributi di immagini vere. Il livello di realismo e di sofisticazione in quest’ultimo caso è dovuto ad una tecnologia molto potente che si basa sulle reti generative avversarie (GAN).