Whole Exome Sequencing (WES) has high power to discover variants in cancer cells, allowing the identification of molecular features underlying diseases development and progression, with important outcomes for cancer diagnosis/prognostication as well as for development and selection of molecularly targeted therapies in personalized medicine. WES projects pose as well different challenges due to biological factors, such as tumour heterogeneity, altered ploidy, low tumor purity, and technical artifacts, that make not obvious the identification of relevant variants. IWhale, an easy-to-use and customizable pipeline based on Docker and SCons, was developed to analyze cancer WES data, to detect and annotate somatic mutations by a combination of four different callers and integration of information deriving from different databases. Moreover, a systems genetics approach and custom data structures were built up to construct pathway-derived meta-networks of mutated genes depicting their direct interactions and functional relations, to ultimately identify key functions and pathways recurrently hit in cancer cells. In collaboration with different groups, increasingly refined and customized versions of the pipeline were applied in three WES studies regarding Large granular lymphocyte leukemia (LGL-L), pediatric follicular lymphomas (PTNFL and PFLT) and High-Risk Neuroblastoma (HR-NB). LGL-L is a rare chronic leukemia with persistent clonal increase of cytotoxic T cells or natural killer (NK) cells often associated to JAK/STAT pathway activation. By analysis of WES data in 19 patients, including cases without STAT mutations (STAT- patients), novel somatic mutations in recurrently mutated genes were identified. 16 selected variants, including those in the tumor suppressor gene FAT4 and in the epigenetic regulator KMT2D, were validated. The new Q706L and S715F STAT5B variants has been also functionally characterized. With pathway-derived network analysis, functional modules composed by several STAT-interacting or STAT-functional connected genes mutated in STAT-negative patients were discovered. Additional modules with putative pathogenic relevance in LGL-L and mutated in the absence of STAT mutations were identified. In PTNFL, recently recognized as a defined clinicopathological entity, WES analysis of the largest cohort collected so far uncovered mutations in the few genes, TNFRSF14, IRF8 and MAP2K1 previously associated to PTNFL, identifying as well novel mutations and genes. Eleven validated variants prioritized as possible drivers hit the recurrently mutated ARHGEF1, MAP2K1 and TNFRSF14 genes, as well as ATG7, GNA13, RSF1, UBAP2, and ZNF608. G-protein coupled receptor signaling and chromatin modifying enzyme alterations was linked for the first time to PTNFL and PFLT according to obtained findings. NB, a solid cancer arising from primitive neural crest cells and accounting for 9% of pediatric tumors, is characterized by high clinical heterogeneity and low mutation recurrence even in known driver (MYCN, ALK, ATRX). To clarify the biological basis of disease aggressiveness, WES was used to examine the genomic landscape of HR-NB patients at metastatic stage with short survival (SS) and long survival (LS). A few genes, including SMARCA4, SMO, ZNF44 and CHD2, were recurrently mutated only in the SS group and HotNet2 analysis revealed that in the two patient groups, mutations occurred in different pathways. Notably mutations of SS patients clustered into a six significantly mutated subnetworks, involved into MAPK pathway associated with the organization of the extracellular matrix, to cell motility through PTK2 signaling, to matrix metalloproteinase activity, to centrosome maturation and chromosome remodeling, to metabolism of nucleotides and lipoproteins, and to transport of small molecules. Since FDA-approved compounds targeting the deregulated pathways are available these findings may help to improve the treatment of HR-NB patients with most aggressive disease.

Il sequenziamento dell’esoma (WES) rileva efficacemente varianti in cellule tumorali, identificando le caratteristiche molecolari coinvolte nella patogenesi e nella progressione della malattia, con importanti risvolti per la diagnosi e per lo sviluppo e la scelta di terapie personalizzate. L’analisi di dati WES di tumori presenta tuttavia varie complicazioni dovute all’eterogeneità tumorale, ad alterazioni della ploidia, a contaminazioni dei campioni o ad artefatti tecnici. La pipeline iWhale, basata su Docker e SCons, è stata sviluppata per analizzare dati WES di tumori con l’obiettivo di rilevare ed annotare mutazioni somatiche tramite l’uso di quattro diversi software (MuTect, MuTect2, Strelka2 e VarScan2) e l’integrazione di informazioni provenienti da vari database. Inoltre, ho collaborato allo sviluppo di un metodo per la costruzione di meta-reti di geni mutati che sono annotati in database di pathway e ho costruito una struttura di dati customizzata per rilevare statisticamente pathway ricorrentemente mutati in cellule tumorali. In collaborazione con diversi gruppi di ricerca, ho utilizzato ed adattato di volta in volta versioni progressivamente più rifinite della mia pipeline in studi riguardanti la leucemia linfocitica granulare a grandi cellule T (LGL-L), due tipi di linfomi follicolari pediatrici (PTNFL e PFLT) e Neuroblastoma ad alto rischio (HR-NB). LGL-L è una leucemia cronica rara caratterizzata da una persistente crescita clonale di cellule citotossiche T o natural killer (NK) dovuta all’attivazione del pathway JAK/STAT. Mediante analisi WES sono state identificate nuove mutazioni somatiche in geni ricorrentemente mutati in 19 pazienti con LGL-L, comprendenti casi senza mutazioni nei geni STAT. Sono state selezionate per validazione con sequenziamento Sanger 16 varianti in diversi geni, tra le quali l’oncosoppressore FAT4 e il regolatore epigenetico KMT2D. Nuove varianti Q706L e S715F in STAT5B sono state anche caratterizzate funzionalmente. Grazie ad analisi di reti derivate da pathway, sono state identificate delle componenti funzionali composte da geni mutati, funzionalmente o direttamente interagenti con i geni STAT, in pazienti STAT negativi. Altre componenti funzionali con una possibile rilevanza nella patogenesi di LGL-L in assenza di mutazioni nei geni STAT sono emerse dalle analisi. Una coorte di pazienti affetti da linfomi follicolari pediatrici è stata analizzata tramite WES. Sono state confermate mutazioni presenti in TNFRSF14, IRF8 e MAP2K1, geni precedentemente associati a PTNFL, e sono stati caratterizzati nuove mutazioni e geni con possibile coinvolgimento nello sviluppo di PTNFL. Undici varianti presenti in ARHGEF1, MAP2K1, TNFRSF14, ATG7, GNA13, RSF1, UBAP2 e ZNF608 sono state validate e selezionate come possibili eventi driver in PTNFL e PFLT. I nostri risultati hanno per la prima volta permesso di associare il pathway GPCR ed enzimi modificatori della cromatina ai linfomi follicolari pediatrici. NB è un tumore solido che origina dalle cellule della cresta neurale primitiva ed è caratterizzato da un’alta eterogeneità clinica e da pochi geni ricorrentemente mutati (MYCN, ALK, ATRX). Per investigare sulle basi biologiche coinvolte nell’aggressività di NB, è stato effettuato WES di pazienti affetti da HR-NB con metastasi e divisi in base alla sopravvivenza (pazienti SS e LS, rispettivamente con sopravvivenza inferiore o uguale e superiore a 5 anni). Solo i geni SMARCA4, SMO, ZNF44 e CHD2 sono stati trovati mutati ricorrentemente in modo specifico in pazienti SS. HotNet2 ha rivelato che le mutazioni rilevate nei due gruppi ricadevano in pathway diversi. Le mutazioni dei pazienti SS si sono raggruppate in sei sotto-reti significativamente mutate, coinvolte nell’organizzazione della matrice extracellulare tramite MAPK pathway, nella motilità cellulare tramite PTK2, nell’attività delle metalloproteinasi della matrice, nella maturazione del centrosoma e nel rimodellamento dei cromosomi. Grazie all’esistenza di farmaci già approvati dalla FDA che hanno come bersaglio alcune delle proteine mutate o delle pathway identificate, i risultati ottenuti possono facilitare lo sviluppo di terapie mirate ai pazienti con le forme più aggressive di HR-NB.

The genomic landscape of solid and hematologic malignancies characterized by new bioinformatics tools / Binatti, Andrea. - (2018 Nov 30).

The genomic landscape of solid and hematologic malignancies characterized by new bioinformatics tools

Binatti, Andrea
2018

Abstract

Il sequenziamento dell’esoma (WES) rileva efficacemente varianti in cellule tumorali, identificando le caratteristiche molecolari coinvolte nella patogenesi e nella progressione della malattia, con importanti risvolti per la diagnosi e per lo sviluppo e la scelta di terapie personalizzate. L’analisi di dati WES di tumori presenta tuttavia varie complicazioni dovute all’eterogeneità tumorale, ad alterazioni della ploidia, a contaminazioni dei campioni o ad artefatti tecnici. La pipeline iWhale, basata su Docker e SCons, è stata sviluppata per analizzare dati WES di tumori con l’obiettivo di rilevare ed annotare mutazioni somatiche tramite l’uso di quattro diversi software (MuTect, MuTect2, Strelka2 e VarScan2) e l’integrazione di informazioni provenienti da vari database. Inoltre, ho collaborato allo sviluppo di un metodo per la costruzione di meta-reti di geni mutati che sono annotati in database di pathway e ho costruito una struttura di dati customizzata per rilevare statisticamente pathway ricorrentemente mutati in cellule tumorali. In collaborazione con diversi gruppi di ricerca, ho utilizzato ed adattato di volta in volta versioni progressivamente più rifinite della mia pipeline in studi riguardanti la leucemia linfocitica granulare a grandi cellule T (LGL-L), due tipi di linfomi follicolari pediatrici (PTNFL e PFLT) e Neuroblastoma ad alto rischio (HR-NB). LGL-L è una leucemia cronica rara caratterizzata da una persistente crescita clonale di cellule citotossiche T o natural killer (NK) dovuta all’attivazione del pathway JAK/STAT. Mediante analisi WES sono state identificate nuove mutazioni somatiche in geni ricorrentemente mutati in 19 pazienti con LGL-L, comprendenti casi senza mutazioni nei geni STAT. Sono state selezionate per validazione con sequenziamento Sanger 16 varianti in diversi geni, tra le quali l’oncosoppressore FAT4 e il regolatore epigenetico KMT2D. Nuove varianti Q706L e S715F in STAT5B sono state anche caratterizzate funzionalmente. Grazie ad analisi di reti derivate da pathway, sono state identificate delle componenti funzionali composte da geni mutati, funzionalmente o direttamente interagenti con i geni STAT, in pazienti STAT negativi. Altre componenti funzionali con una possibile rilevanza nella patogenesi di LGL-L in assenza di mutazioni nei geni STAT sono emerse dalle analisi. Una coorte di pazienti affetti da linfomi follicolari pediatrici è stata analizzata tramite WES. Sono state confermate mutazioni presenti in TNFRSF14, IRF8 e MAP2K1, geni precedentemente associati a PTNFL, e sono stati caratterizzati nuove mutazioni e geni con possibile coinvolgimento nello sviluppo di PTNFL. Undici varianti presenti in ARHGEF1, MAP2K1, TNFRSF14, ATG7, GNA13, RSF1, UBAP2 e ZNF608 sono state validate e selezionate come possibili eventi driver in PTNFL e PFLT. I nostri risultati hanno per la prima volta permesso di associare il pathway GPCR ed enzimi modificatori della cromatina ai linfomi follicolari pediatrici. NB è un tumore solido che origina dalle cellule della cresta neurale primitiva ed è caratterizzato da un’alta eterogeneità clinica e da pochi geni ricorrentemente mutati (MYCN, ALK, ATRX). Per investigare sulle basi biologiche coinvolte nell’aggressività di NB, è stato effettuato WES di pazienti affetti da HR-NB con metastasi e divisi in base alla sopravvivenza (pazienti SS e LS, rispettivamente con sopravvivenza inferiore o uguale e superiore a 5 anni). Solo i geni SMARCA4, SMO, ZNF44 e CHD2 sono stati trovati mutati ricorrentemente in modo specifico in pazienti SS. HotNet2 ha rivelato che le mutazioni rilevate nei due gruppi ricadevano in pathway diversi. Le mutazioni dei pazienti SS si sono raggruppate in sei sotto-reti significativamente mutate, coinvolte nell’organizzazione della matrice extracellulare tramite MAPK pathway, nella motilità cellulare tramite PTK2, nell’attività delle metalloproteinasi della matrice, nella maturazione del centrosoma e nel rimodellamento dei cromosomi. Grazie all’esistenza di farmaci già approvati dalla FDA che hanno come bersaglio alcune delle proteine mutate o delle pathway identificate, i risultati ottenuti possono facilitare lo sviluppo di terapie mirate ai pazienti con le forme più aggressive di HR-NB.
30-nov-2018
Whole Exome Sequencing (WES) has high power to discover variants in cancer cells, allowing the identification of molecular features underlying diseases development and progression, with important outcomes for cancer diagnosis/prognostication as well as for development and selection of molecularly targeted therapies in personalized medicine. WES projects pose as well different challenges due to biological factors, such as tumour heterogeneity, altered ploidy, low tumor purity, and technical artifacts, that make not obvious the identification of relevant variants. IWhale, an easy-to-use and customizable pipeline based on Docker and SCons, was developed to analyze cancer WES data, to detect and annotate somatic mutations by a combination of four different callers and integration of information deriving from different databases. Moreover, a systems genetics approach and custom data structures were built up to construct pathway-derived meta-networks of mutated genes depicting their direct interactions and functional relations, to ultimately identify key functions and pathways recurrently hit in cancer cells. In collaboration with different groups, increasingly refined and customized versions of the pipeline were applied in three WES studies regarding Large granular lymphocyte leukemia (LGL-L), pediatric follicular lymphomas (PTNFL and PFLT) and High-Risk Neuroblastoma (HR-NB). LGL-L is a rare chronic leukemia with persistent clonal increase of cytotoxic T cells or natural killer (NK) cells often associated to JAK/STAT pathway activation. By analysis of WES data in 19 patients, including cases without STAT mutations (STAT- patients), novel somatic mutations in recurrently mutated genes were identified. 16 selected variants, including those in the tumor suppressor gene FAT4 and in the epigenetic regulator KMT2D, were validated. The new Q706L and S715F STAT5B variants has been also functionally characterized. With pathway-derived network analysis, functional modules composed by several STAT-interacting or STAT-functional connected genes mutated in STAT-negative patients were discovered. Additional modules with putative pathogenic relevance in LGL-L and mutated in the absence of STAT mutations were identified. In PTNFL, recently recognized as a defined clinicopathological entity, WES analysis of the largest cohort collected so far uncovered mutations in the few genes, TNFRSF14, IRF8 and MAP2K1 previously associated to PTNFL, identifying as well novel mutations and genes. Eleven validated variants prioritized as possible drivers hit the recurrently mutated ARHGEF1, MAP2K1 and TNFRSF14 genes, as well as ATG7, GNA13, RSF1, UBAP2, and ZNF608. G-protein coupled receptor signaling and chromatin modifying enzyme alterations was linked for the first time to PTNFL and PFLT according to obtained findings. NB, a solid cancer arising from primitive neural crest cells and accounting for 9% of pediatric tumors, is characterized by high clinical heterogeneity and low mutation recurrence even in known driver (MYCN, ALK, ATRX). To clarify the biological basis of disease aggressiveness, WES was used to examine the genomic landscape of HR-NB patients at metastatic stage with short survival (SS) and long survival (LS). A few genes, including SMARCA4, SMO, ZNF44 and CHD2, were recurrently mutated only in the SS group and HotNet2 analysis revealed that in the two patient groups, mutations occurred in different pathways. Notably mutations of SS patients clustered into a six significantly mutated subnetworks, involved into MAPK pathway associated with the organization of the extracellular matrix, to cell motility through PTK2 signaling, to matrix metalloproteinase activity, to centrosome maturation and chromosome remodeling, to metabolism of nucleotides and lipoproteins, and to transport of small molecules. Since FDA-approved compounds targeting the deregulated pathways are available these findings may help to improve the treatment of HR-NB patients with most aggressive disease.
Exome Sequencing, Bioinformatics, Cancer genomics
The genomic landscape of solid and hematologic malignancies characterized by new bioinformatics tools / Binatti, Andrea. - (2018 Nov 30).
File in questo prodotto:
File Dimensione Formato  
Binatti_Andrea_tesi.pdf

accesso aperto

Tipologia: Tesi di dottorato
Licenza: Non specificato
Dimensione 22.18 MB
Formato Adobe PDF
22.18 MB Adobe PDF Visualizza/Apri
Pubblicazioni consigliate

I documenti in IRIS sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/11577/3424919
Citazioni
  • ???jsp.display-item.citation.pmc??? ND
  • Scopus ND
  • ???jsp.display-item.citation.isi??? ND
social impact