Il GDPR stabilisce che i dati personali devono essere: trattati in modo lecito, corretto e trasparente nei confronti dell'interessato, nel rispetto del principio di liceità, correttezza e trasparenza; raccolti per finalità determinate, esplicite e legittime, e successivamente trattati in modo che non sia incompatibile con tali finalità, in virtù del principio della limitazione della finalità; adeguati, pertinenti e limitati a quanto necessario rispetto alle finalità per le quali sono trattati, in virtù del principio di minimizzazione dei dati; esatti e, se necessario, aggiornati, con adozione di tutte le misure ragionevoli per cancellare o rettificare tempestivamente i dati inesatti rispetto alle finalità per le quali sono trattati, alla luce del principio di esattezza; conservati in una forma che consenta l'identificazione degli interessati per un arco di tempo non superiore al conseguimento delle finalità per le quali sono trattati, in virtù del principio della limitazione della conservazione; trattati in maniera da garantire un'adeguata sicurezza dei dati personali, compresa la protezione, mediante misure tecniche e organizzative adeguate, da trattamenti non autorizzati o illeciti e dalla perdita, dalla distruzione o dal danno accidentali, secondo il principio di integrità e riservatezza.
Secondo l'articolo 9 del GDPR è vietato trattare dati personali relativi alla salute di una persona, salvo i seguenti casi:
- il soggetto ha prestato il consenso esplicito al trattamento di questi dati, per una o più finalità specifiche,
- il trattamento è necessario per assolvere obblighi e esercitare diritti specifici del titolare del trattamento o dell'interessato in materia di diritto del lavoro, della sicurezza sociale e protezione sociale,
- il trattamento di questi dati è necessario per tutelare un interesse vitale dell'interessato o di un'altra persona fisica, nell'ipotesi in cui l'interessato si trovi nell'incapacità (fisica o giuridica) di prestare il proprio consenso,
- il trattamento è effettuato da una fondazione, associazione o altro organismo senza scopo di lucro che persegua finalità politiche, filosofiche, religiose o sindacali, a condizione che riguardi solo i membri, gli ex membri o le persone che hanno regolari contatti con tali soggetti e che comunque i dati non siano comunicati all'esterno senza il previo consenso dell'interessato,
- i dati sono stati resi pubblici in maniera manifesta dall'interessato,
- il trattamento è necessario per accertare, esercitare o difendere un diritto in giudizio,
- sussistono motivi di interesse pubblico,
- il trattamento si rende necessario per finalità di medicina preventiva o del lavoro, ovvero per valutare la capacità lavorativa del dipendente, per diagnosi, assistenza o terapia sanitaria o sociale,
- sussistono motivi di interesse pubblico nel settore della sanità pubblica, come la protezione da gravi minacce per la salute a carattere transfrontaliero,
- il trattamento è necessario ai fini di archiviazione nel pubblico interesse, di ricerca scientifica o storica o statistica.
Il Garante Privacy italiano, giustamente, pretende che i suddetti principi costituiscano la base per la progettazione e il funzionamento delle tecnologie di intelligenza artificiale generativa, soprattutto quelle che vengono utilizzate in campo sanitario, oramai sempre più diffuse per le attività di diagnosi e cura dei pazienti.
Federated learning: che cos’è
Il federated learning (apprendimento federato) è un metodo di addestramento dei modelli di apprendimento automatico, come l’intelligenza artificiale.
In parole molto semplici, attraverso il federated learning l’intelligenza artificiale non viene istruita attraverso i dati su cui si sta allenando il modello di intelligenza artificiale, bensì sui parametri appresi dai modelli allenati sui dati posseduti dai singoli soggetti.
In questo modo i dati rimangono all’interno delle organizzazioni che li possiedono e non rischiano di fuoriuscirne.
I protagonisti del federate learning sono di due tipi:
- I client, cioè i siti che posseggono i dati,
- Il server, attraverso cui i dati vengono inizializzati tramutati in un modello federato, che poi verrà trasmesso tramite ai client connessi, che possono essere altri server, dispositivi (ad esempio tablet o smartphone) o dispositivi Internet of Things.
Una volta ricevuto il modello globale ogni nodo client inizia ad allenarlo con i dati locali, per poi restituirlo al server una volta ultimato l’addestramento.
In questo modo, i dati rimangono sempre all’interno della rete e non possono fuoriuscirne perché non vengono scambiati con soggetti esterni.
Va precisato, però, che il modello che i client condividono con l’aggregatore una volta terminato l’addestramento (con i dati interni) è comunque vulnerabile ad attacchi esterni, in quanto contiene dei dati (pur interni): per questo motivo al federate learning vengono affiancate specifiche crittografie dei dati, che però possono influire sulla qualità dell’apprendimento dell’intelligenza artificiale o sull’efficienza del protocollo.
Leggi anche
Federated continual learning: perché usarlo in sanità
Uno studio pubblicato nel 2022 sulla rivista Cluster Computing conferma l’utilità, nel sistema sanitario, di combinare il federated learning con i sistemi di intelligenza artificiale per ridurre i problemi legati a sicurezza, privacy, stabilità e affidabilità in campo sanitario.
Uno studio del 2022 supportato dalla Regione Lazio nel progetto FedMedAI (POR FESR Lazio 2014-2020) ha evidenziato l’utilità del federated learning per creare una rete tra gli ospedali ad utilizzare per il rilevamento del COVID-19.
Il federate learning può essere utilizzato in campo sanitario per fare in modo che i dati dei pazienti rimangano all’interno delle singole istituzioni (l’ospedale, la clinica, il centro medico), senza uscire all’esterno.
Decidere di istruire un modello di intelligenza artificiale che debba operare in campo sanitario tramite federated learning permette di:
- Decentralizzare i dati, che rimangono sui client (i dispositivi dei singoli utenti) e non vengono ceduti a terzi, perché il modello viene istruito sul client del singolo utente (ad esempio l’ospedale) e poi viene reinviato al server solo quando ha appreso tutto, senza inoltrare anche i dati dei pazienti,
- Limitata condivisione delle informazioni, perché non vengono scambiate tra più pc, ad esempio, le immagini diagnostiche dei pazienti; queste, infatti, vengono utilizzate sul client del singolo utente per istruire il modello di intelligenza artificiale, che apprende quanto è necessario e poi viene inviato al server centrale già istruito,
- Miglioramento della privacy, perché i dati sanitari non lasciano mai il client dell’istituzione di riferimento (ad esempio, l’ospedale), perciò non vengono trasmessi a terzi, ma sono solo utilizzati per istruire il modello di intelligenza artificiale.
Per fare un esempio pratico, se gli ospedali di tutta Italia decidono di creare un modello di intelligenza artificiale che prevenga i fenomeni di trombosi venosa profonda, possono istruire, ognuno sul proprio PC, il modello principale con i dati contenuti nei propri archivi (previo consenso informato dei pazienti). Una volta terminato l’apprendimento, i dati sanitari di ciascun paziente rimarranno ben custoditi presso la singola struttura ospedaliera, mentre il modello di intelligenza artificiale sarà trasmesso al server centrale e andrà ad integrarsi con i modelli istruiti da tutti gli altri ospedali.
Così facendo, i dati non si muovono dal luogo digitale in cui sono custoditi, ma le strutture sanitarie, utilizzandoli, riusciranno a creare un modello di intelligenza artificiale completo, istruito con dati reali e aggiornati.
Le nuove tecnologie si evolvono velocemente, e la salute dei cittadini può essere affidata nelle sapienti mani dei medici che, unitamente agli ingegneri informatici, possono rivoluzionare il modo in cui diagnosi e cura vengono erogati ai pazienti.