top of page

Innovazione nella ricerca farmaceutica

  • Ezio Bertani
  • 14 apr
  • Tempo di lettura: 5 min

Come TDA, dati sintetici e AI stanno ridisegnando la ricerca e sviluppo

La ricerca farmaceutica è arrivata a un punto di svolta. Con un costo medio di 2,23 miliardi di dollari per portare un singolo farmaco sul mercato e tassi di successo che si attestano tra il 5% e il 10%, le organizzazioni che fanno ricerca e sviluppo non possono più permettersi di innovare semplicemente di più. Devono innovare meglio.

Il problema non è la mancanza di dati. È la difficoltà di estrarre segnali robusti e azionabili da sistemi biologici di straordinaria complessità, da dati frammentati e da popolazioni di pazienti sempre più vincolate da requisiti dalle regole che tutelano la riservatezza e la gestione delle informazioni.

Tre tecnologie convergenti stanno oggi offrendo una risposta concreta a queste sfide: l’analisi topologica dei dati (Topological Data Analysis - TDA), i dati sintetici e l'integrazione aziendale di tecnologie avanzate.



Perché i metodi tradizionali non bastano più

I modelli analitici classici - reti neurali profonde, insieme con gradient boosting, analisi delle componenti principali - sono efficaci nel catturare correlazioni lineari in dataset strutturati. Ma falliscono sistematicamente nell'identificare le classificazioni biologiche non lineari che determinano i risultati clinici.

Questi non sono casi limite. Sono esattamente i modelli che spiegano perché un farmaco funziona in un sottogruppo di pazienti e fallisce in un altro, perché una molecola promettente non supera la Fase III, o perché un biomarcatore statisticamente marginale a livello aggregato può nascondere un segnale clinicamente decisivo in una coorte genomica specifica.

Le conseguenze economiche sono concrete: un candidato erroneamente eliminato durante lo screening computazionale costa migliaia di euro; lo stesso errore nella tossicologia in vivo costa milioni; un composto che fallisce in Fase II può costare centinaia di milioni.

I tre pilastri dell'approccio avanzato

1. Topological Data Analysis (TDA)

La TDA si concentra sulla struttura intrinseca dei dati. Invece di imporre un sistema di coordinate o assumere una distribuzione generatrice, rivela schemi multi-scala e caratteristiche topologiche - componenti connesse, loop, vuoti - che sono spesso invisibili all'analisi convenzionale.

Questi segnali sono robusti al rumore, stabili attraverso molte trasformazioni e direttamente interpretabili in termini biologici. In pratica, questo significa:

  • Discovery: identificazione di target topologicamente stabili, conformazioni di legame metastabili, sottogruppi di pazienti biologicamente distinti che si perderebbero nell'analisi aggregata;

  • siurezza preclinica: rilevamento precoce di responsabilità strutturali e rischi di sicurezza, inclusi segnali correlati alla cardiotossicità, prima che i composti raggiungano stadi sperimentali costosi;

  • ottimizzazione clinica: fenotipizzazione basata sulla TDA che consente criteri di inclusione più precisi e strategie di arricchimento allineate ai meccanismi terapeutici.

Un caso concreto: applicando la TDA alle traiettorie di dinamica molecolare in un programma di ottimizzazione di inibitori di chinasi, è stato possibile identificare una tasca metastabile distinta correlata con la potenza in vitro. Il risultato: riduzione del 65% del set di candidati ed eliminazione di sei mesi di cicli ridondanti di ottimizzazione.

2. Dati sintetici

L'accesso a dati di qualità a livello paziente è sempre più limitato da normative stringenti (GDPR, HIPAA), barriere contrattuali complesse e scarsità intrinseca dei dati per le malattie rare. Questo crea un "gap di innovazione" che penalizza in particolare i programmi su indicazioni orfane.

I dati sintetici colmano questa lacuna. Utilizzando architetture generative avanzate - VAE, GAN, modelli di diffusione - le organizzazioni possono sviluppare e validare modelli su larga scala senza compromettere la riservatezza dei pazienti, preservando al contempo le caratteristiche statistiche e cliniche essenziali della popolazione originale.

Le applicazioni più rilevanti includono:

  • gruppi di gemelli digitali per malattie rare (Rare Disease Digital Twin Cohorts): da 50 pazienti reali a coorti sintetiche ad alta fedeltà di 5.000 soggetti, abilitando modelli predittivi per progressione della malattia, risposta al trattamento e profili di sicurezza;

  • bracci di controllo virtuali (Synthetic Control Arms): riduzione del carico (burden) dei pazienti assegnati a placebo, con accelerazione dei tempi di reclutamento e crescente accettazione regolamentare da parte di FDA ed EMA in oncologia e malattie rare;

  • scenario dei test: simulazione di diverse configurazioni di prova, criteri di inclusione e regimi di dosaggio prima di impegnarsi in studi prospettici costosi.

3. Integrazione aziendale

Le tecnologie avanzate generano valore reale solo quando sono incorporate nei flussi operativi esistenti. Un approccio maturo non si limita allo sviluppo di modelli in isolamento: supporta casi d'uso aziendali attraverso ELN, LIMS, database clinici e ambienti di supporto alle decisioni.

L'obiettivo è trasformare l'analisi avanzata in decisioni ripetibili in cui i team possono avere fiducia e su cui possono agire.

L'impatto sul business: concreto e misurabile

Per il top management, il valore di questo approccio non è astratto. È operativo e finanziario.

Le aree di impatto includono:

  • decisioni go/no-go più precoci e più sicure

  • riduzione dell'logoramento nelle fasi tardive

  • ottimizzazione dell’opportunità più rapida

  • progettazione e arruolamento del progetto più efficienti

  • minori emendamenti a metà studio

  • narrative più solide per regolatori e investitori.

Sponsorizzare l'implementazione completa di una suite di ottimizzazione clinica può portare a riduzioni a doppia cifra nei tempi complessivi del progetto, con miglioramenti corrispondenti nel Valore Attuale Netto (Net Present Value) dell'asset.

Credibilità scientifica come requisito fondamentale

In un mercato affollato di promesse tecnologiche, la credibilità è un fattore critico. Per i dirigenti farmaceutici, una soluzione deve essere difendibile non solo tecnicamente, ma anche scientificamente e operativamente.

Questo approccio si fonda su riferimenti consolidati nella letteratura sottoposto a revisione paritaria (peer-reviewed): dal lavoro seminale di Carlsson (2009) sulla TDA pubblicato nel Bulletin of the American Mathematical Society, agli studi di Lum et al. sull'identificazione di sottogruppi clinicamente significativi in dati genomici del cancro, fino alla ricerca di Jordon et al. sul potenziale dei Dati Sintetici nella ricerca clinica.

La distinzione tra questo approccio e le soluzioni "black box" risiede proprio nella tracciabilità metodologica e nella validazione accademica: non un'affermazione di marketing, ma un impegno alla trasparenza a ogni livello dell’architettura decisionale.

Il passo successivo

La domanda non è più se le tecnologie avanzate possano supportare la ricerca e sviluppo del settore farmaceutico. La domanda è come renderle operative in modo scientificamente rigoroso, realisticamente implementabile e commercialmente significativo.

Un approccio strutturato parte da una sessione di esplorazione (Discovery Workshop) che include: valutazione delle differenze analitiche, identificazione dei casi d'uso ad alto valore, mappatura preliminare dei requisiti di integrazione, definizione delle metriche di successo e strategia di validazione allineata alle priorità scientifiche e regolamentari.

L'opportunità è costruire un'architettura di sviluppo migliore: una che riduca l'incertezza prima, migliori la qualità dell'evidenza e acceleri il percorso dalla scoperta all'impatto sul paziente.

Ottimizza il tuo NPV riducendo il logoramento (attrition) nelle fasi tardive.

Non lasciare che segnali clinici decisivi restino invisibili nei tuoi dataset. Scopri come l’architettura decisionale di Envision Data può integrare TDA e dati sintetici nei tuoi flussi operativi.

 
 
 

Commenti


bottom of page