Health Big Data

Secondary use dei dati sanitari: cos’è, esempi e vantaggi



Indirizzo copiato

L’uso secondario dei dati sanitari sfrutta l’enorme mole di dati generati dai sistemi sanitari per ottenere nuove conoscenze medico-scientifiche e migliorare l’assistenza sanitaria. Ecco come funziona, in quali casi si applica, i benefici, le sfide etiche e di privacy e le prospettive future

Pubblicato il 27 giu 2025



Secondary use dei dati sanitari

Il secondary use dei dati sanitari offre enormi potenzialità per la ricerca medica e il miglioramento dell’assistenza sanitaria. Nonostante i vantaggi in termini di efficienza e personalizzazione delle cure, persistono sfide legate alla privacy, qualità dei dati e interoperabilità.

L’integrazione di dati genomici, clinici e comportamentali, supportata da AI e spazi dati comuni, promette potenzialmente di rivoluzionare la Medicina. Tuttavia, realizzare questo potenziale richiederà un approccio olistico che bilanci innovazione e tutela dei diritti individuali.

Cos’è e in cosa consiste il secondary use dei dati sanitari

Il secondary use dei dati sanitari si riferisce all’utilizzo di informazioni sanitarie, raccolte originariamente per scopi clinici o amministrativi, per finalità diverse da quelle iniziali, come la ricerca, l’analisi epidemiologica, la valutazione della qualità delle cure e lo sviluppo di politiche sanitarie.

Questo approccio sfrutta l’enorme mole di dati generati quotidianamente dai sistemi sanitari per ottenere nuove conoscenze e migliorare l’assistenza sanitaria.

Secondo la definizione dell’Organizzazione Mondiale della Sanità, l’uso secondario dei dati sanitari comprende “qualsiasi utilizzo di dati sanitari personali al di là dello scopo diretto di cura per il quale sono stati originariamente raccolti“. Ciò può includere l’aggregazione di dati provenienti da diverse fonti, come cartelle cliniche elettroniche, registri di malattie, database amministrativi e dati generati dai pazienti stessi. L’obiettivo è estrarre informazioni preziose che possano guidare decisioni cliniche, ottimizzare l’allocazione delle risorse e accelerare la ricerca medica.

Ad esempio, l’analisi di vasti dataset può rivelare modelli nascosti nell’insorgenza e nella progressione delle malattie, identificare fattori di rischio precedentemente sconosciuti o valutare l’efficacia di trattamenti su larga scala.

Tuttavia, l’uso secondario dei dati sanitari solleva anche importanti questioni etiche e di privacy che richiedono un attento bilanciamento tra il potenziale beneficio per la salute pubblica e la protezione dei diritti individuali. La sfida sta nel massimizzare il valore di questi dati mantenendo al contempo rigorosi standard di sicurezza e consenso informato.

Principali vantaggi del secondary use dei dati sanitari

Il secondary use dei dati sanitari offre numerosi vantaggi potenziali per il progresso della Medicina e il miglioramento dei sistemi sanitari. Uno dei principali benefici è la possibilità di condurre studi su vasta scala che sarebbero altrimenti impossibili e dai costi proibitivi.

Analizzando milioni di cartelle cliniche, infatti, i ricercatori possono identificare rare correlazioni ed effetti collaterali che potrebbero sfuggire a studi più limitati.
Ad esempio, uno studio condotto su oltre 1,6 milioni di pazienti ha permesso di valutare l’impatto a lungo termine dell’epatite virale cronica negli Stati Uniti.

Inoltre, l’uso secondario dei dati sanitari consente di monitorare in tempo reale l’andamento di malattie e l’efficacia di interventi sanitari su intere popolazioni.
Durante la pandemia di COVID-19, l’analisi di dati sanitari in tempo reale è stata cruciale per tracciare la diffusione del virus e valutare l’impatto delle misure di contenimento.

Un altro vantaggio significativo è la possibilità di personalizzare le cure basandosi su vasti dataset che tengono conto di molteplici fattori individuali.

Esempi di secondary use dei dati sanitari

Sono molti i possibili esempi sull’uso secondario dei dati sanitari. Tra questi, la sicurezza dei farmaci, la segnalazione e il monitoraggio di eventi avversi ed effetti collaterali dovuti al loro utilizzo, gli studi e ricerche sulla prevalenza, l’incidenza e i fattori di rischio delle più diffuse patologie che affliggono la popolazione mondiale, lo sviluppo di terapie personalizzate basate sugli studi genetici, lo studio delle interazioni tra genetica, ambiente e salute globale e via dicendo.

Di seguito, l’analisi di alcuni tra gli esempi più significativi di applicazione del secondary use dei dati sanitari.

Real World Data

I Real World Data (RWD) sono una risorsa preziosa per l’avanzamento della ricerca medica e il miglioramento delle pratiche cliniche. Un esempio significativo di riutilizzo di RWD è lo studio condotto sulla sicurezza del rosiglitazone, un farmaco ampiamente utilizzato per il trattamento del diabete di tipo 2. Attraverso una meta-analisi di 42 studi randomizzati controllati, i ricercatori hanno scoperto un’associazione tra l’uso del farmaco e un aumento del rischio di infarto miocardico e di morte per cause cardiovascolari. Questi risultati hanno avuto un impatto significativo sulle linee guida per il trattamento del diabete.

Un altro caso rilevante riguarda l’uso di RWD per validare l’efficacia della metformina nel ridurre la mortalità associata ai tumori. Integrando i dati di due vasti sistemi di cartelle cliniche elettroniche, i ricercatori hanno analizzato una coorte di oltre centomila pazienti oncologici, confermando l’associazione tra l’uso di metformina e una ridotta mortalità dopo la diagnosi di cancro. Questo studio ha dimostrato il potenziale dei RWD nel validare in modo rapido ed economico i segnali di repurposing dei farmaci.

Nel campo della farmacovigilanza, il sistema EudraVigilance dell’Agenzia Europea per i Medicinali (EMA) ha permesso di monitorare in tempo reale gli eventi avversi associati ai vaccini COVID-19. Un’analisi retrospettiva dei dati ha rivelato, ad esempio, l’incidenza di trombosi del seno venoso cerebrale associata a trombocitopenia dopo la prima dose dei vaccini a vettore adenovirale, fornendo informazioni cruciali per la gestione del rischio vaccinale.

Database amministrativi sanitari

Il secondary use dei dati sanitari attraverso il riutilizzo dei database amministrativi sanitari (Administrative Databases) ha dimostrato un notevole potenziale nel fornire insight cruciali per la salute pubblica e la gestione sanitaria.

Un esempio è lo studio condotto in Svezia su una popolazione di 2,1 milioni di abitanti per valutare l’epidemiologia dell’insufficienza cardiaca. Utilizzando dati di ricovero ospedaliero, i ricercatori hanno potuto mappare la prevalenza, l’incidenza e i fattori di rischio dell’insufficienza cardiaca su scala nazionale, fornendo informazioni preziose per la pianificazione sanitaria.

Analogamente, in Canada, l’analisi di dati amministrativi ha permesso di tracciare l’andamento dell’incidenza, della prevalenza e della mortalità del diabete in Ontario, rivelando tendenze significative nella salute della popolazione.

Biobanking data

L’uso secondario dei dati sanitari mediante il riutilizzo dei dati provenienti dalle biobanche sta impattando significativamente sulla ricerca biomedica, offrendo opportunità fondamentali per comprendere le basi genetiche delle malattie e sviluppare terapie personalizzate.

Un esempio è la UK Biobank, che ha raccolto dati genetici e fenotipici di cinquecentomila partecipanti tra i 40 e i 69 anni. Questo vasto repository ha permesso di condurre studi su larga scala che hanno portato a scoperte significative. Ad esempio, un’analisi su 4509 test ha esplorato il contributo di fattori demografici, sociali, sanitari e ambientali riguardo al rischio di COVID-19, fornendo informazioni cruciali durante la pandemia.

La China Kadoorie Biobank ha offerto una prospettiva unica sulla salute della popolazione cinese, combinando dati genetici con informazioni dettagliate su stile di vita e fattori ambientali. Questo ha permesso di studiare l’interazione tra geni e ambiente in una delle popolazioni più grandi del mondo, con implicazioni significative per la comprensione di malattie complesse come il diabete e le malattie cardiovascolari.

La Estonian Biobank, con oltre duecentomila partecipanti, rappresenta il 20% della popolazione adulta estone. Questa risorsa ha permesso di condurre studi pionieristici sulla genomica delle popolazioni, inclusa l’identificazione di varianti rare associate a malattie cardiovascolari e metaboliche. Un esempio concreto è lo studio che ha utilizzato il “recall by genotype” per investigare l’ipercolesterolemia familiare, dimostrando come i dati biobanking possano essere utilizzati per implementare strategie di screening genetico a livello di popolazione.

Clinical Trial Data

Il secondary use dei dati sanitari attraverso il riutilizzo dei dati provenienti da trial clinici (Clinical Trial Data) è una strategia sempre più adottata per massimizzare il valore della ricerca medica e accelerare lo sviluppo di nuove terapie.

Un esempio illuminante di questo approccio è lo studio condotto utilizzando dati di 8 trial clinici sul cancro alla prostata ottenuti dal Project Data Sphere. Combinando e analizzando i dati di 4127 soggetti, i ricercatori sono riusciti a identificare possibili esiti avversi sulla sopravvivenza associati alla terapia di castrazione chirurgica nei pazienti con cancro alla prostata. Questo tipo di analisi integrata su larga scala sarebbe stata impossibile o troppo costosa se condotta come un nuovo studio clinico.

Un altro esempio significativo riguarda l’uso di dati clinici integrati per identificare endofenotipi della progressione dell’Alzheimer. Analizzando dati di 1160 pazienti con Alzheimer seguiti per 18 mesi, i ricercatori hanno identificato almeno tre sottogruppi distinti di pazienti, ciascuno caratterizzato da un diverso pattern di deterioramento cognitivo. Queste scoperte hanno importanti implicazioni per la stratificazione dei pazienti e lo sviluppo di terapie mirate.

Electronic Health Records

Il riutilizzo delle cartelle cliniche elettroniche (EHR) sta trasformando la ricerca medica e la pratica clinica, offrendo grandi opportunità per migliorare la qualità delle cure e accelerare le scoperte scientifiche.

Un esempio in tal senso è lo studio condotto da Kaiser Permanente su una coorte di 407 casi con almeno una diagnosi di disturbo dello spettro autistico (ASD) e 2095 controlli. Questa ricerca ha dimostrato che i disturbi autoimmuni materni intorno al periodo della gravidanza non giocano un ruolo significativo nel rischio di autismo, sfatando precedenti ipotesi e guidando future direzioni di ricerca.

Analogamente, lo studio Chronic Hepatitis Cohort Study (CHeCS) ha analizzato i dati EHR di oltre 1,6 milioni di pazienti adulti, identificando 2202 casi di infezione cronica da virus dell’epatite B. Questi dati hanno sottolineato il significativo onere sanitario dell’epatite virale cronica negli Stati Uniti fornendo informazioni cruciali per le politiche di salute pubblica.

Nel campo dell’epidemiologia ambientale, l’analisi dei dati EHR ha permesso di esplorare l’impatto dell’ambiente fisico sulla salute. Uno studio condotto nei Paesi Bassi ha esaminato la relazione tra gli spazi verdi nelle aree residenziali e la morbilità valutata dai medici. Analizzando i dati di 345143 individui, i ricercatori hanno scoperto che 15 su 24 cluster di malattie mostravano una prevalenza inferiore nelle aree con più spazi verdi entro 1 km.

Dati genomici e proteomici

L’uso secondario dei dati sanitari attraverso i dati genomici e proteomici sta impattando significativamente sulla ricerca biomedica, offrendo opportunità per comprendere le basi molecolari delle malattie e sviluppare terapie personalizzate.

Un esempio è lo studio condotto utilizzando dati di espressione genica da 81 campioni di globuli bianchi e 1463 campioni da vari organi, misurati sulla piattaforma Affymetrix HG U133A. Questa analisi ha rivelato una significativa sovrapposizione nei trascrittomi dei globuli bianchi e di altri organi, confermando che la maggior parte dei geni è espressa in vari tessuti. Questa scoperta ha importanti implicazioni per lo sviluppo di biomarcatori non invasivi e per la comprensione delle interazioni tra sistema immunitario e altri organi.

Nel campo dell’oncologia, il riutilizzo di dati di espressione genica ha permesso di sviluppare classificatori per identificare l’origine tissutale di tumori metastatici con sito primario sconosciuto.

Un altro esempio significativo di riutilizzo di dati genomici è il progetto HapMap, che ha creato un catalogo delle varianti genetiche umane condivise tra molti individui. Questo progetto ha portato allo sviluppo della prima generazione di microarray in grado di analizzare centinaia di migliaia di varianti genetiche in un singolo test. HapMap si è rivelato uno strumento efficace per studiare la relazione tra profili genetici e malattie, nonché per esplorare l’influenza di fattori genetici sull’efficacia e sugli effetti avversi di farmaci e vaccini.

Registri sanitari nazionali

I registri sanitari nazionali sono una risorsa inestimabile per la ricerca sanitaria e l’elaborazione di politiche di salute pubblica. Essi, infatti, offrono una visione completa e longitudinale della salute delle popolazioni.

In Canada, ad esempio, la Statistics Canada Biobank, parte integrante del Canadian Health Measures Survey, raccoglie e conserva informazioni da questionari, misure fisiche e campioni biologici di cittadini canadesi tra i 3 e i 79 anni. Ciò permette ai ricercatori di esplorare le complesse interazioni tra genetica, ambiente e salute.

In Giappone, il progetto BioBank Japan ha registrato duecentomila pazienti con 47 malattie comuni, generando oltre 500 pubblicazioni scientifiche. Un esempio notevole è lo studio che ha identificato varianti genetiche associate alla risposta ai farmaci, aprendo la strada a terapie più mirate ed efficaci nella popolazione giapponese.

Person Generated Health Data

Il secondary use dei dati sanitari attraverso il riutilizzo dei Person Generated Health Data (PGHD) è una frontiera innovativa nella ricerca medica e nella pratica clinica. Questi dati includono informazioni raccolte da dispositivi indossabili, app per smartphone e sistemi di monitoraggio dei pazienti.

Un esempio è lo studio condotto utilizzando dati di sensori Bluetooth a bassa energia (BLE) combinati con algoritmi di machine learning per monitorare in tempo reale i livelli di glucosio nel sangue di pazienti diabetici. L’integrazione di questi dati con le cartelle cliniche elettroniche potrebbe rivoluzionare la gestione del diabete, offrendo interventi personalizzati e tempestivi.

Nel campo della salute mentale, l’analisi dei dati di localizzazione derivati dagli smartphone tramite GPS, Wi-Fi e Google Location History ha fornito informazioni cruciali sulla mobilità della comunità e la sua correlazione con il benessere mentale e fisico. Uno studio ha dimostrato che le misurazioni GPS del movimento possono rilevare la depressione con un’accuratezza dell’87%, aprendo nuove strade per l’identificazione precoce delle malattie mentali.

Il riutilizzo dei PGHD sta trasformando la ricerca oncologica. L’uso di applicazioni mobili che consentono ai pazienti di identificare e segnalare sintomi o effetti collaterali del trattamento tra le visite cliniche di routine ha dimostrato di migliorare l’aderenza ai piani di trattamento.

Social and Behavioural Determinants of Health

L’uso secondario dei dati sanitari attraverso il riutilizzo dei dati relativi ai determinanti sociali e comportamentali della salute (Social and Behavioural Determinants of Health, SBDH) è fondamentale per comprendere e affrontare le disparità sanitarie.

Questa tipologia di dati, infatti, include informazioni su fattori quali l’istruzione, il reddito, l’ambiente, lo stile di vita e le abitudini comportamentali, offrendo quindi una visione olistica della salute che va oltre i tradizionali parametri clinici.

Un esempio è lo sviluppo di modelli predittivi per identificare i pazienti a rischio di disturbi da uso di sostanze e abuso di oppioidi basati su fattori socioeconomici. Uno studio ha dimostrato che un basso status socioeconomico e lo stress socioeconomico sono associati a un maggior rischio di disturbi da uso di sostanze e abuso di oppioidi. Utilizzando tali dati in combinazione a dati amministrativi sanitari e tecniche di machine learning, i ricercatori hanno sviluppato algoritmi in grado di prevedere il rischio di questi disturbi con una precisione significativa, aprendo la strada a interventi preventivi mirati.

Nel campo della salute mentale, il riutilizzo dei dati SBDH ha portato allo sviluppo di strumenti predittivi per il rischio di suicidio. Alcuni studi hanno esplorato l’uso di fattori SBDH come il livello di istruzione, lo stato occupazionale e il reddito nella previsione del comportamento suicidario nei pazienti con malattie mentali. Ad esempio, lo strumento OxMIS è stato progettato per prevedere il suicidio nei pazienti con gravi malattie mentali, incorporando fattori SBDH come l’istruzione e l’abuso di sostanze.
Fattori come lo stato abitativo, inclusa la condizione di senzatetto, e la localizzazione geografica sono stati identificati come influenti sulle malattie mentali, comportamentali e del neurosviluppo, nonché sulle malattie del sistema circolatorio. La localizzazione geografica, che funge da surrogato per le caratteristiche socioeconomiche, è stata associata a molteplici malattie, condizioni di salute e tassi di mortalità.

Inoltre, l’integrazione dei dati SBDH nei sistemi di cartelle cliniche elettroniche (EHR) ha dimostrato di riuscire a migliorare significativamente la gestione di malattie croniche come l’obesità e il diabete.

Come massimizzare il secondary use dei dati sanitari

La massimizzazione dell’uso secondario dei dati sanitari è una sfida complessa ma ricca di opportunità per il futuro della Sanità.

Tra i fattori abilitanti cruciali, un elemento fondamentale è rappresentato dalla maturità digitale dei sistemi sanitari. Secondo un rapporto dell’OMS, i Paesi che hanno raggiunto un alto livello di maturità digitale sono in grado di implementare programmi di sanità digitale su larga scala, migliorando significativamente l’efficienza e l’efficacia dei servizi sanitari.

L’Intelligenza Artificiale è un’altra opportunità importante per massimizzare il valore dei dati sanitari.

Anche l’implementazione di framework normativi adeguati, come lo European Health Data Space (EHDS), rappresenta un passo cruciale verso la massimizzazione del riutilizzo dei dati sanitari. Questo regolamento mira a stabilire regole chiare per l’accesso e l’utilizzo dei dati sanitari per scopi di ricerca e innovazione, bilanciando la necessità di progresso scientifico con la protezione della privacy dei cittadini. Secondo un’analisi della Commissione Europea, l’implementazione di questo regolamento potrebbe portare a risparmi fino a 5,5 miliardi di euro in 10 anni attraverso un migliore accesso ai dati per la ricerca e l’innovazione.

Inoltre, il coinvolgimento attivo dei pazienti nel processo di condivisione e riutilizzo dei dati sanitari si sta rivelando un elemento chiave per il successo di queste iniziative. Alcuni studi hanno infatti dimostrato che i pazienti più attivi nella gestione della propria salute fanno un uso minore dei servizi di medicina generale, dei ricoveri di emergenza e di altri servizi sanitari.

Secondary use dei dati sanitari: le sfide da vincere

L’uso secondario dei dati sanitari elettronici, pur essendo ormai un pilastro fondamentale per il futuro della Sanità (secondo l’OMS potrebbe portare a risparmi globali di oltre 300 miliardi di dollari all’anno nel settore sanitario) e offrendo opportunità senza precedenti, pone anche sfide significative e complesse.

Ad esempio, la qualità e l’integrità dei dati sono preoccupazioni primarie, poiché informazioni incomplete o errate possono portare a conclusioni fuorvianti.

La privacy e la sicurezza dei dati rappresentano un’altra sfida cruciale. Nonostante l’anonimizzazione, infatti, esiste sempre il rischio che gli individui possano essere re-identificati attraverso la combinazione di diversi dataset.

Inoltre, l’accesso equo ai dati e la condivisione dei benefici derivanti dalla ricerca sono questioni etiche importanti da affrontare.

Infine, per sfruttare appieno il potenziale del secondary use dei dati sanitari, sarà necessario garantire l’interoperabilità tra i diversi sistemi e dotarsi di competenze specializzate per capitalizzare i grandi vantaggi ottenibili dall’analisi degli health big data.

Riferimenti bibliografici

Fidelia Cascini - Secondary Use of Electronic Health Data Public Health Perspectives, Use Cases and Challenges - SpringerBriefs in Public Health (2025)

Articoli correlati

Articolo 1 di 5