data Protection

Ricerca (sint)etica: la protezione dei dati e l’essere umano restino al centro dell’innovazione artificiale



Indirizzo copiato

La sintetizzazione dei dati è un fenomeno che va osservato e sul quale riflettere ad ampio spettro. Ecco gli aspetti che potrebbero essere sottoposti al regolatore o al legislatore per eventuali futuri interventi volti a rendere questa tecnologia più comprensibile e sicura per il grande pubblico

Pubblicato il 6 feb 2026

Maria Rita Sechi

Responsabile della Protezione dei Dati (DPO) Fondazione Policlinico Universitario Campus Bio-Medico di Roma



dati sintetici nella ricerca medica e protezione dei dati

Stiamo assistendo, già da tempo, ad una inedita e profonda trasformazione del settore della ricerca scientifica.

Questa, oggi persegue il suo grande obiettivo di “accrescere la conoscenza umana, risolvere problemi e migliorare la società attraverso l’esplorazione, la formulazione e la verifica di ipotesi” con strumenti e modalità sempre più innovativi.

Artificializzazione della ricerca e rischio de-umanizzazione

Si accede con più facilità alle informazioni e le informazioni disponibili sono potenzialmente tante (Big Data) e di alta qualità.

Le modalità di elaborazione delle informazioni sono facilitate dalle nuove tecnologie che, se da una parte sprigionano grandi potenzialità di calcolo e di elaborazione, dall’altra prospettano dubbi di attendibilità e di replicabilità dei risultati raggiunti.

Questa importante artificializzazione della ricerca rischia, tuttavia, di ridurre la ricerca scientifica ad una mera raccolta di dati e, di conseguenza, ne determina una de-umanizzazione. Solo con il metodo scientifico e la perizia dello studioso la ricerca può trovare le relazioni causali e non limitarsi all’individuazione delle co-relazioni tra dati.

Il confine tra ricerca scientifica e sviluppo tecnologico

È innegabile, però, che i fornitori di tecnologia stiano acquisendo un ruolo importante nell’ambito della ricerca qualificandosi sempre più spesso come importanti partner o addirittura come sponsor nei progetti di ricerca scientifica.

Tutto questo determina una grande velocità della ricerca quale precondizione per lo sviluppo tecnologico al punto che diventa inevitabile chiedersi se siano due cose diverse o meno. In effetti, in questo contesto, tracciare il confine di demarcazione tra ricerca scientifica e sviluppo tecnologico diventa sempre più arduo tanto nella prassi quanto sul piano normativo.

Dati sintetici nella ricerca medica e ruolo dei Comitati Etici

L’utilizzo dei dati sintetici nella ricerca scientifica ed in particolare nella ricerca medica, biomedica ed epidemiologica solleva numerosi quesiti, soprattutto in questo momento nel quale sono ancora poche le evidenze scientifiche perché minima è la quantità di studi avviati e sottoposti alla valutazione dei Comitati Etici Territoriali o di quelli Nazionali (CET e CEN).

I Comitati Etici sono chiamati a valutare la scientificità e l’impatto dell’uso dei dati sintetici all’interno di un progetto di ricerca scientifica dovendo analizzare diversi aspetti.

In primis, il modello scelto di creazione dei dati sintetici che dipenderà non soltanto dallo scopo (per esempio, aumentare il numero di dati disponibili se si vuole studiare una malattia rara), ma anche dal contesto e, quindi, dal tipo di dato che si vuole analizzare al fine di mantenere le relazioni tra i dati reali di partenza e i dati sintetici ottenuti. Si capisce, quindi, che la sintetizzazione è un’attività che non richiede solo competenze tecniche, ma anche di contestoe, nella sua valutazione, non si potrà fare a meno di ricorrere ad expertise di dominio.

Il Comitato Etico dovrà poi valutare il sistema di Intelligenza Artificiale utilizzato e la sua conformità rispetto alla normativa di riferimento e alle sue evoluzioni.

Poi, dovrà valutare il setdi dati reali di partenza identificato considerando i profili etici e l’idoneità della rappresentatività al fine di mitigare possibili bias.

Infine, si dovrà verificare che i dati sintetici così ottenuti siano realmente dati impersonali e sicuri sul piano della privacy. Si dovrà quindi accertare che il dato sintetizzato sia realmente un dato nuovo rispetto al set di dati reali di partenza e non semplicemente una “perturbazione” del dato originario.

Le insidie che si nascondono nei dati sintetici

Da quanto osservato, derivano alcune importanti considerazioni.

La prima è che il dato sintetico non è sempre, ipso facto, un dato anonimo o impersonale e, quindi, idoneo a superare l’applicazione della protezione dei dati personali, perché non tutte le tecniche di sintetizzazione si equivalgono.

La seconda è che la sintetizzazione quale processo di creazione di dati fittizi, generati artificialmente, non basta ad assicurare la privacy, se essa non viene accompagnata con continuità da opportune misure di anonimizzazione (per esempio la randomizzazione, la generalizzazione, il rumore statistico, ecc.). Tuttavia, anche l’inserimento delle misure di anonimizzazione deve essere ponderato al fine di garantire che i dati sintetizzati risultino attendibili, cioè fedeli al set di dati reali di partenza e utili rispetto allo scopo originario.
Troppo “rumore statistico” potrebbe camuffare a tal punto il dato sintetico da renderlo altra cosa rispetto a quanto atteso.

Ne consegue la necessità di valutare puntualmente il singolo processo di anonimizzazione utilizzato, non solo al fine di essere certi che il dato ottenuto non sia più personale, ma anche che sia bassa la verosimiglianza di poterlo, in futuro, re-identificare (anonimizzazione pro-futuro).

In aggiunta, servirà validare i dati sintetici rispetto allo scopo iniziale e al caso d’uso al fine di verificarne l’utilizzabilità rispetto all’obiettivo.

I Comitati Etici hanno al loro interno tutte le competenze che servono?

Accanto a tutto quanto appena visto, e avendo sempre come sfondo la valutazione della scientificità dello studio, i Comitati Etici dovrebbero anche analizzare tutti gli aspetti più squisitamente etici come l’equità della ricerca clinica, il contesto applicativo complessivo – e non solo il singolo trial- e se sia davvero giustificato per il bene del paziente usare i dati sintetici piuttosto che quelli reali.

La domanda che inevitabilmente ci si pone è se i Comitati Etici abbiano al loro interno le competenze adeguate per affrontare e gestire tutti i passaggi sopra descritti, i quali richiedono una conoscenza specifica della normativa sulla protezione e regolazione dei dati, sulla sua applicazione nel contesto sanitario e della ricerca scientifica in campo medico, biomedico ed epidemiologico nonché degli impatti dell’uso delle nuove tecnologie che di dati personali si alimentano, per i diritti e le libertà delle persone.

Esperto di protezione dei dati: perché è fondamentale e in quali fasi interviene

La mancanza di un esperto di protezione dei dati quale membro di diritto nella composizione dei Comitati Etici non deve essere visto soltanto come un tema organizzativo, ma piuttosto come un fatto che determina un approccio distorto rispetto al ruolo che la protezione dei dati e l’uso delle nuove tecnologie giocano all’interno della ricerca scientifica. Troppo spesso si sente dire che la privacy ostacola la ricerca e, di conseguenza, l’innovazione. Così come si sente associare la parola privacy alla parola “problema”, come fossero un’endiadi.

Un rapporto muscolare tra ricerca scientifica e protezione dei dati personali non solo non è di alcuna utilità, ma mette a rischio la dignità della persona umana che entrambe, invece, dichiarano di voler tutelare.

Quindi, la protezione dei dati non solo non va rimossa, come fosse il peggiore dei mali, ma va integrata nel processo di analisi e valutazione complessivo sul singolo progetto di ricerca che il Comitato Etico è chiamato a svolgere. Solo un approccio interdisciplinare e multispecialistico consentirà di affrontare e vincere le sfide che l’innovazione tecnologica continuamente porrà davanti.

Nella valutazione e approvazione di uno studio che prevede l’uso di dati sintetici, l’esperto di protezione dei dati, DPO, manager o consulente, interviene in almeno due fasi su tre.

La prima fase è quella precedente alla sintetizzazione e che si incentra prevalentemente sull’analisi del percorso che porta dal real word data alla sintetizzazione. È una fase nella quale anche un minimo errore di individuazione della base giuridica o di verifica delle misure di anonimizzazione utilizzate può comportare dei rischi per i diritti e le libertà degli interessati. Per tali ragioni, è una fase da considerare come il cuoredel lavoro dell’esperto di privacy e che solo lui può svolgere.

La seconda fase, temporalmente più circoscritta, inizia subito dopo la sintetizzazione. In questa fase, si concentrano valutazioni più propriamente etiche di pertinenza del bioeticista e di altre figure professionali presenti all’interno del Comitato Etico.

Infine, c’è la terza fase, che si potrebbe chiamare di “sorveglianza e monitoraggio”, sulla falsariga delle sperimentazioni cliniche di farmaci. In questa fase, l’esperto di privacy dovrebbe sorvegliare il dato sintetico ed il suo uso al fine di verificare che:

a) non ci siano distorsioni su trattamenti di dati ancora personali, a causa della loro combinazione con trattamenti di dati sintetici;

b) non si verifichino condizioni che rendano possibile una ripersonalizzazione del dato sintetico, magari in considerazione del nuovo contesto e/o dell’evoluzione tecnologica.

Uso secondario dei dati sintetici e Comitati Etici

L’esistenza della possibilità che, nel tempo, il dato sintetico possa essere ripersonalizzato porta a considerare con attenzione anche il tema dell’uso secondario dei dati sinteticie del ruolo che i Comitati Etici potrebbero avere in progetti che riutilizzano dati sintetici usati in precedenti studi.

Come noto, l’art. 8 della legge italiana sull’AI (l. 132/2025), al comma 3, identifica una base giuridica ad hoc per i trattamenti di anonimizzazione, pseudonimizzazione e sintetizzazione che risultano, di conseguenza, sempre possibili negli ambiti della ricerca scientifica per AI in Sanità e di governo della salute. L’obiettivo di agevolare la ricerca e la valorizzazione secondaria dei dati, anche clinici, è chiara e ne è prova il fatto che, nella formulazione definitiva della legge italiana AI in riferimento alla fattispecie prevista al comma 3, è stato eliminato il riferimento all’approvazione da parte dei Comitati Etici.

Diverso il caso dell’uso secondario previsto dal comma 2 dell’art.8 l. 132/2025, che indubbiamente richiederà il vaglio del Comitato Etico, nel quale si riconosce la possibilità di riuso dei dati per finalità ulteriori soltanto se i dati vengono privati degli elementi identificativi diretti. Ne deriva che, anche nel caso di studio che voglia riutilizzare dati sintetizzati in precedenza, si dovrà coinvolgere l’esperto di protezione dei dati personali, per verificare che non si presenti il rischio di ripersonalizzazione del dato sintetico o, comunque, non nelle forme dell’identificabilità diretta.

Dati sintetici nella ricerca medica: gli aspetti su cui dovrebbe intervenire il regolatore o il legislatore

La sintetizzazione dei dati rappresenta, dunque, indubbiamente, un fenomeno che va osservato e sul quale riflettere ad ampio spettro. Ad oggi sono diversi gli aspetti che potrebbero essere sottoposti al regolatore o al legislatore per eventuali futuri interventi a supporto di questa tecnologia e volti a renderla più comprensibile e sicura per il grande pubblico.

Si potrebbe iniziare proprio con il passo previsto dal comma 4 dell’art. 8 l. 132/2025, quando AGENAS fornirà una definizione autentica di dato sintetico e dei requisiti che questo deve avere, stabilendo quindi regole chiare sulle modalità di sintetizzazione che tengano conto sia degli aspetti tecnico-informatici che dei profili più giuridici ed etici.

Servirebbe poi cristallizzare un divieto di uso di dati sintetici non significativi (proprio per evitare costruzioni di effetti distorsivi).

Sarebbe inoltre opportuno modificare il Decreto del Ministero della Salute del 30 gennaio 2023 sulla definizione dei criteri per la composizione e il funzionamento dei Comitati Etici al fine di colmare il vuoto di competenze attualmente esistente causato dall’assenza di figure professionali specifiche. Forse questo “correttivo” aiuterà anche i Comitati Etici ad assumere orientamenti più uniformi rispetto alle nuove frontiere cui sta andando incontro la ricerca. Su tutto questo potrà riflettere il legislatore e i regolatori ratione materiae. Con l’obiettivo di non “scollegare” e allontanare troppo la dimensione umana dalla ricerca e dall’innovazione, ciò che potrebbe essere un effetto collaterale paradossale dell’uso di dati sintetici.

guest
0 Commenti
Più recenti Più votati
Inline Feedback
Vedi tutti i commenti

Articoli correlati

0
Lascia un commento, la tua opinione conta.x