In silico investigation on protein domains structure and linear/structural motifs can strongly boost functional analyses and technological design. Protein surface features study is crucial to understanding Protein-Protein Interactions (PPI); in particular, surface and pockets conservation and variation, in terms of hydrophobicity, steric hindrance and electrostatics can act as driving forces in protein evolution and functional specialization. Therefore, molecular modeling and structure comparison techniques play an important role in shedding light on “protein behavior” and this PhD work took advantage from integrating computational approaches based on some known molecular modeling methods, such as e.g. Homology Modeling, Fold Recognition, Ab initio Modeling, PBE (Poisson-Boltzmann Electrostatics), Protein-peptide Docking and Hydropathy Analysis with structure and sequence comparison and scanning tools and, of course, with feedback from wet lab analyses performed by co-workers. Such an integrative approach was followed along investigations on a number of different biological systems: • Surface determinants in H5N1 type A Influenza viruses: Here, an analysis of surface determinants from H5N1 haemagglutinin, involved in host-viral interaction, was completed and then published. Genomic variation is very high in influenza A viruses. However, viral evolution and spreading are strongly influenced by immunogenic features and capacity to bind host cells, depending in turn on the two major capsidic proteins (haemagglutinin and neuraminidase). Current analyses of viral evolution are based on serological and primary sequence comparison; however, comparative structural analysis of capsidic proteins can provide functional insights on surface regions possibly crucial to antigenicity and cell binding. We performed molecular modeling and extensive structural comparison of influenza virus haemagglutinin and of their domains and sub-regions to investigate type- and/or domain specific variation. We found that structural closeness and primary sequence similarity are not always tightly related; moreover, type-specific features could be inferred when comparing surface properties of haemagglutinin subregions, monomers and trimers, in terms of electrostatics and hydropathy. Focusing on H5N1, we found that the variation at the receptor binding domain (RBD) surface intriguingly relates to branching of still circulating clades from those ones that are no longer circulating. Recent evidence on the association between electrostatic fingerprints at the haemagglutinin receptor binding surface and the evolutionary success and spreading of H5N1 avian influenza clades prompted us to perform further integrated phylogenetic and structural bioinformatic analysis in H9N2 viruses. In fact, influenza A virus is a zoonotic agent with a significant impact both on public health and poultry industry and switch to human host has been reported for both H5N1 and H9N2 viruses. We performed the evolutionary analysis of a large and non-redundant viral strain dataset, leading to clustering of H9N2 viruses in five groups. Then and according to recent evidence on H5N1, congruence resulted among phylogenetic data and surface electrostatic fingerprints from structural comparison. In particular, surface feature fingerprints could be inferred that relate group specific variation in electrostatic charges and isocontour to well-known hemagglutinin sites involved in modulation of immune escape and host specificity. Results from this second work strengthen suggestion that when integrating up-to-date phylogenetic analyses with sequence-based and structural investigation of surface features may represent a front-end strategy for inferring trends and relevant mechanisms in influenza virus evolution. • Domain architecture variation in mammalian protein trafficking: Human VAMP7b is the most interesting variant among those produced by alternative splicing of the encoding gene SYBL1. Production of VAMP7b variants is determined by skipping of exon 6 which in turn results in coding sequence frameshift. We found that this event is conserved in other mammalian species. VAMP7b shares with the main isoform the N-terminal, inhibitory longin domain and the first half of the SNARE motif. In mammals, VAMP7b is a truncated protein in which the C-terminal half of the SNARE motif and the transmembrane region are replaced by short and variable peptides. Intriguingly instead, only in human and apes sequence frameshift determined by exon 6 skipping results in the creation of a novel unique domain of unknow function, hence human VAMP7b is not truncated but even 40 residues longer than the main isoform. Since existence of such “long” isoform and of its unique domain at protein level were confirmed by specific antibodies, we embarked on in silico dissection of the novel domain by position specific matrix sequence analysis and by ab initio structural modeling. Moreover, since the N-terminal region of the SNARE motif is conserved and it is known to mediate intramolecular binding to the Longin domain, we investigated both in vivo (by two-hybrid in yeast analysis) and in vitro (by NMR analysis) on conservation of the closed conformation. Furthermore, SCL of both VAMP7b and Ykt6b was investigated using GFP and RFP chimeras. Last but not least, b isoforms of the longin genes were analyzed by qPCR and found to be developmentally regulated. • Binding motif regulating neurite outgrowth and guidance: Fine tuning of PPIs by variation in domain architecture or by changing local motifs by surface features modulation can regulate both extracellular and intracellular signaling pathways. Extracellular PPIs can play a central role in heterologous recognition (e.g. host-pathogen) as well as in homologous signaling among cells from the same organism. Proteins exposed at the plasma membrane (PM) can interact each other and with the extracellular matrix (ECM) to provide positional information and guidance cues. Cell adhesion molecules (CAMs) are PM proteins mediating either attractive or repulsive signals by homo- and heterophilic interactions of their extracellular domains (Eds). CAM EDs are most often composed by Ig-like or Fibronectin type III fold repeats. Current evidence suggests that the four N-terminal Ig 1-4 domains of CAM EDs play a major role in such homo- or heterophilic interactions and in particular an important interaction motif is contributed by repeat Ig2. In our lab, biomimetic peptides have been developed by reproducing the known or predicted interaction motifs from the Ig2 domain of human L1CAM and the single Ig domain of human LINGO1, i.e. two proteins that play a crucial role in neurite outgrowth and guidance and in neuronal differentiation. Based on the somehow surprising structural and sequence conservation of the motif region (even when proteins show very different ED architectures), we started investigating on variation and conservation of the putative motif region by means of homology search, regular expression and finally by structural modeling and comparison. Preliminary results highlighted strong conservation of the central Arg residue in the interaction motif, while in other positions of the motif residue properties rather than specific residues are conserved. Such evidence is in agreement with finding that mutation of such residue in L1CAM is responsible for a severe neurological disorder, while mutations at other residues of the motif, results in less severe phenotype. This suggests the motif is an epitope positionally conserved around the central Arg allowing limited, but significant structural variability in surrounding sequence. In order to check such a hypothesis, a structural superposition of the Ig domains containing the interaction motif was performed, confirming that the peptide motif itself is positionally conserved but the highest positional and structural conservation concerns the central Arg residue. Experiments with peptides mutated in the central Arg showed biological activity of these peptides in terms of neuritogenesis signalling. These works carry out a bioinformatic protocol for the characterization of interaction determinants and their functional modulation, easily transportable to other proteins.

Gli studi in silico aventi per oggetto la struttura di domini proteici e di motif sia strutturali che lineari, sono in grado di fornire un importante apporto in termini di comprensione di funzione e nelle biotecnologie. Lo studio delle caratteristiche a carico della superficie proteica si rivelano essenziali nella comprensione delle Interazioni Proteina-Proteina (PPI); in particolare, la conservazione e variazione della superficie proteica e delle relative cavità in termini di idrofobicità, ingombro sterico e caratteristiche elettrostatiche, possono essere considerate come la forza in grado di guidare l’evoluzione e la specializzazione funzionale delle proteine stesse. Alla luce di quanto sopra esposto, tecniche come la Modellistica Molecolare ed il confronto tra strutture giocano un ruolo importante nel chiarire il modus operandi delle proteine e questo progetto di Dottorato ha proprio sfruttato l’approccio integrato di alcune ben note tecniche di biologia computazionale basate sulla Modellistica Molecolare come, ad esempio, Homology Modeling, Fold Recognition, Ab initio Modeling, PBE (Poisson-Boltzmann Electrostatics), Protein-peptide Docking e Hydropathy Analysis con confronto di sequenze e strutture. Elemento indispensabile e prezioso, ovviamente, il feedback ottenuto dagli esperimenti al banco effettuati dai nostri collaboratori. Questo approccio integrato è stato dunque applicato a differenti sistemi biologici: • Individuazione di determinanti di superficie in virus influenzali di tipo A H5N1: è stata effettuata un’analisi dei determinanti di superficie a carico dell’emoagglutinina proveniente dal virus influenzale H5N1, coinvolta nell’interazione virus-ospite. Questo lavoro ha già condotto ad una pubblicazione. La variazione genomica è elevata nei virus influenzali di tipo A. L’evoluzione e la diffusione dei virus sono molto influenzate dalle caratteristiche immunogeniche e dalla capacità del virus, di interagire con le cellule dell’ospite tramite le due più importanti proteine presenti sul capside virale: l’emoagglutinina e la neuraminidasi. Le analisi oggi a disposizione sono basate sul confronto dell’attività sierologica e di sequenze primarie; alla luce di ciò, l’analisi strutturale di queste proteine capsidiche può essere in grado di svelare delle conoscenze a riguardo di certe regioni presenti sulla superficie proteica che possono essere cruciali per l’antigenicità e per il legame alle cellule dell’ospite. L’emoagglutinina, sezionata nei suoi domini e subdomini, è stata da noi studiata con metodi di Modellistica Molecolare e sottoposta a confronti strutturali fini, per individuare quelle variazioni che potessero risultare tipo/dominio specifiche. Abbiamo evidenziato che la vicinanza strutturale e la similarità di sequenza primaria non sempre sono correlate; in più, caratteristiche tipo-specifiche di sottoregioni dell’emoagglutinina, monomeri e trimeri, possono essere rivelate grazie al confronto delle loro proprietà di superficie, (in termini di elettrostatica ed idrofobicità) appartenenti a sottoregioni dell’emoagglutinina, monomeri e trimeri. In questo lavoro ci siamo focalizzati sul virus H5N1 e abbiamo scoperto che il dominio di legame recettoriale dell’emoagglutinina (RBD) presenta delle variazioni tra clade circolanti e non più circolanti. Le recenti scoperte riguardanti l’associazione tra la disposizione delle cariche al RBD ed il successo in termini evolutivi e di diffusione del virus H5N1 ci hanno spinto ad eseguire analisi integrate di filogenesi e biologia strutturale a carico dei virus H9N2. Infatti, l’influenza A è un agente zoonotico in grado di produrre un grosso impatto sia sulla salute pubblica che sull’industria del pollame, avendo la capacità di effettuare il salto d’ospite, come riportato proprio per H5N1 ed H9N2. Abbiamo effettuato un’analisi evoluzionistica su un grande dataset non ridondante di ceppi virali e questo ci ha consentito di individuare cinque gruppi di virus H9N2. In accordo con le precedenti analisi effettuate per H5N1, abbiamo ottenuto accordo tra i dati filogenetici con quelli ottenuti dalle analisi di confronto strutturale. In particolare, emerge che la variazione della disposizione delle cariche coincide con quella di siti noti dell’emoagglutinina coinvolti nell’evasione al sistema immunitario e nella specificità d’ospite. I risultati ottenuti da questo secondo lavoro pongono l’accento sull’importanza dell’integrazione tra analisi di tipo filogenetiche e di biologia strutturale nella scoperta di nuovi meccanismi evolutivi dei virus dell’influenza. • Variazione dell’architettura di domini in proteine di mammifero coinvolte nel traffico vescicolare: la proteina umana VAMP7b è la più interessante tra quelle prodotte per splicing alternativo del gene SYBL1. La produzione di VAMP7b è causata dal salto dell’esone 6 che si traduce in uno slittamento della sequenza codificante. Abbiamo scoperto che questo evento è conservato in altre specie di mammiferi. VAMP7b condivide con l’isoforma principale il dominio inibitorio longin N-terminale e la prima metà dello SNARE motif. Nei mammiferi, VAMP7b è una proteina tronca in cui al C-terminale metà dello SNARE motif e la regione transmembrana sono sostituite da peptidi corti e variabili. È molto interessante notare come negli uomini e nelle scimmie antropomorfe lo slittamento della regione codificante determinato dal salto dell’esone 6 abbia prodotto un nuovo dominio di funzione sconosciuta: proprio per questo VAMP7b umana non è tronca, ma addirittura 40 residui più lunga rispetto all’isoforma principale. Dal momento che l’esistenza di questa isoforma “lunga” ed il suo nuovo dominio sono stati confermati a livello proteico grazie all’ausilio di specifici anticorpi, abbiamo effettuato una dissezione in silico del nuovo dominio adoperando un’analisi di sequenza di tipo matrice posizione-specifica (PSI-BLAST), seguita da da Modellistica Strutturale di tipo ab initio. In più, dal momento che la regione N-terminale dello SNARE motif è conservata ed è nota nel mediare il legame intramolecolare al dominio Longin, abbiamo appurato la conservazione della conformazione chiusa sia in vivo (saggio del doppio ibrido in lievito) che in vitro (analisi NMR). Inoltre, la localizzazione subcellulare (SCL) di VAMP7b e Ykt6b è stata studiata adoperando chimere contenenti GFP e RFP. Non ultimo, le isoforme b dei geni longin sono stati analizzati tramite qPCR e si è scoperto essere regolate durante lo sviluppo. • Motif di legame con azione regolatoria sulla crescita e l’indirizzamento neuronale: La regolazione fine delle interazioni proteina-proteina che avviene grazie alle variazioni nell’architettura dei domini o dal cambiamento di motif locali indotto dalla modulazione di caratteristiche di superficie, è in grado di regolare i percorsi di segnalazione sia a livello intra- che extracellulare. Le interazioni proteina-proteina extracellulari possono giocare un ruolo fondamentale nel riconoscimento eterologo (es. ospite-patogeno) come nella segnalazione omologa tra cellule appartenenti allo stesso organismo. Le proteine esposte in membrana plasmatica (PM) possono interagire le une con le altre e con la matrice extracellulare (ECM) per consentire informazioni posizionali e segnali di indirizzamento. Le molecole di adesione cellulare (CAMs) sono proteine della membrana plasmatica in grado di mediare segnali sia di natura attrattiva che repulsiva grazie ad interazioni omo- ed eterofiliche a carico dei loro domini extracellulari (EDs). Questi ultimi sono composti per la magior parte da domini ripetuti aventi fold di tipo Ig o Fibronectina di tipo III. Le attuali conoscenze suggeriscono che i 4 domini extracellulari N-terminali di tipo Ig siano importanti nelle interazioni omo- o eterofiliche ed in modo particolare il dominio Ig2 è provvisto di un importante motif di interazione. Nel nostro laboratorio abbiamo sviluppato dei peptidi biomimetici che riproducono i motif di interazione conosciuti o predetti appartenenti al dominio Ig2 di L1CAM umana e al singolo dominio Ig di LINGO1 umana, proteine, queste, che giocano un ruolo fondamentale nella crescita, nell’indirizzamento e nel differenziamento neuronale. Sulla base della conservazione strutturale della regione del motif (anche tra proteine con architetture molto diverse dei loro EDs), abbiamo iniziato a studiarne la variazione di sequenza mediante analisi per omologia e per espressioni regolari, per infine tornare al livello strutturale mediante Modellistica Molecolare. I risultati preliminari indicano una forte conservazione dell’Arginina centrale presente nel motif d’interazione, mentre nelle altre posizioni del motif si osserva la conservazione di proprietà dei residui piuttosto che la presenza di specifici residui. Questa evidenza è in accordo con il dato di fatto che la mutazione dell’Arginina in L1CAM è responsabile di un serio disordine neurologico, mentre mutazioni a carico di altri residui del motif causano un fenotipo meno grave. Questo suggerisce che il motif è un epitopo posizionalmente conservato attorno all’Arginina centrale in grado di consentire una variabilità limitata ma significativa nella sequenza circostante. Per verificare quest’ipotesi è stata effettuata una superimposizione strutturale dei domini Ig contenenti il motif d’interazione: il risultato ha confermato che il peptide contenente il motif è di per sé conservato posizionalmente e che la conservazione maggiore sia a livello posizionale che struturale è a carico del residuo centrale di Arginina. Esperimenti con peptidi mutati nell’Arginina centrale hanno dimostrato un’attività in termini di segnalazione nella neuritogenesi. Questi lavori hanno consentito di sviluppare un protocollo bioinformatico per la caratterizzazione di determinanti d’interazione e della loro modulazione funzionale, facilmente trasportabile su altre proteine.

Towards "Systems Biotechnology": identification, characterization and design/engineering of protein interaction motifs/domains mediating regulatory signals / Righetto, Irene. - (2017 Jul 28).

Towards "Systems Biotechnology": identification, characterization and design/engineering of protein interaction motifs/domains mediating regulatory signals

Righetto, Irene
2017

Abstract

Gli studi in silico aventi per oggetto la struttura di domini proteici e di motif sia strutturali che lineari, sono in grado di fornire un importante apporto in termini di comprensione di funzione e nelle biotecnologie. Lo studio delle caratteristiche a carico della superficie proteica si rivelano essenziali nella comprensione delle Interazioni Proteina-Proteina (PPI); in particolare, la conservazione e variazione della superficie proteica e delle relative cavità in termini di idrofobicità, ingombro sterico e caratteristiche elettrostatiche, possono essere considerate come la forza in grado di guidare l’evoluzione e la specializzazione funzionale delle proteine stesse. Alla luce di quanto sopra esposto, tecniche come la Modellistica Molecolare ed il confronto tra strutture giocano un ruolo importante nel chiarire il modus operandi delle proteine e questo progetto di Dottorato ha proprio sfruttato l’approccio integrato di alcune ben note tecniche di biologia computazionale basate sulla Modellistica Molecolare come, ad esempio, Homology Modeling, Fold Recognition, Ab initio Modeling, PBE (Poisson-Boltzmann Electrostatics), Protein-peptide Docking e Hydropathy Analysis con confronto di sequenze e strutture. Elemento indispensabile e prezioso, ovviamente, il feedback ottenuto dagli esperimenti al banco effettuati dai nostri collaboratori. Questo approccio integrato è stato dunque applicato a differenti sistemi biologici: • Individuazione di determinanti di superficie in virus influenzali di tipo A H5N1: è stata effettuata un’analisi dei determinanti di superficie a carico dell’emoagglutinina proveniente dal virus influenzale H5N1, coinvolta nell’interazione virus-ospite. Questo lavoro ha già condotto ad una pubblicazione. La variazione genomica è elevata nei virus influenzali di tipo A. L’evoluzione e la diffusione dei virus sono molto influenzate dalle caratteristiche immunogeniche e dalla capacità del virus, di interagire con le cellule dell’ospite tramite le due più importanti proteine presenti sul capside virale: l’emoagglutinina e la neuraminidasi. Le analisi oggi a disposizione sono basate sul confronto dell’attività sierologica e di sequenze primarie; alla luce di ciò, l’analisi strutturale di queste proteine capsidiche può essere in grado di svelare delle conoscenze a riguardo di certe regioni presenti sulla superficie proteica che possono essere cruciali per l’antigenicità e per il legame alle cellule dell’ospite. L’emoagglutinina, sezionata nei suoi domini e subdomini, è stata da noi studiata con metodi di Modellistica Molecolare e sottoposta a confronti strutturali fini, per individuare quelle variazioni che potessero risultare tipo/dominio specifiche. Abbiamo evidenziato che la vicinanza strutturale e la similarità di sequenza primaria non sempre sono correlate; in più, caratteristiche tipo-specifiche di sottoregioni dell’emoagglutinina, monomeri e trimeri, possono essere rivelate grazie al confronto delle loro proprietà di superficie, (in termini di elettrostatica ed idrofobicità) appartenenti a sottoregioni dell’emoagglutinina, monomeri e trimeri. In questo lavoro ci siamo focalizzati sul virus H5N1 e abbiamo scoperto che il dominio di legame recettoriale dell’emoagglutinina (RBD) presenta delle variazioni tra clade circolanti e non più circolanti. Le recenti scoperte riguardanti l’associazione tra la disposizione delle cariche al RBD ed il successo in termini evolutivi e di diffusione del virus H5N1 ci hanno spinto ad eseguire analisi integrate di filogenesi e biologia strutturale a carico dei virus H9N2. Infatti, l’influenza A è un agente zoonotico in grado di produrre un grosso impatto sia sulla salute pubblica che sull’industria del pollame, avendo la capacità di effettuare il salto d’ospite, come riportato proprio per H5N1 ed H9N2. Abbiamo effettuato un’analisi evoluzionistica su un grande dataset non ridondante di ceppi virali e questo ci ha consentito di individuare cinque gruppi di virus H9N2. In accordo con le precedenti analisi effettuate per H5N1, abbiamo ottenuto accordo tra i dati filogenetici con quelli ottenuti dalle analisi di confronto strutturale. In particolare, emerge che la variazione della disposizione delle cariche coincide con quella di siti noti dell’emoagglutinina coinvolti nell’evasione al sistema immunitario e nella specificità d’ospite. I risultati ottenuti da questo secondo lavoro pongono l’accento sull’importanza dell’integrazione tra analisi di tipo filogenetiche e di biologia strutturale nella scoperta di nuovi meccanismi evolutivi dei virus dell’influenza. • Variazione dell’architettura di domini in proteine di mammifero coinvolte nel traffico vescicolare: la proteina umana VAMP7b è la più interessante tra quelle prodotte per splicing alternativo del gene SYBL1. La produzione di VAMP7b è causata dal salto dell’esone 6 che si traduce in uno slittamento della sequenza codificante. Abbiamo scoperto che questo evento è conservato in altre specie di mammiferi. VAMP7b condivide con l’isoforma principale il dominio inibitorio longin N-terminale e la prima metà dello SNARE motif. Nei mammiferi, VAMP7b è una proteina tronca in cui al C-terminale metà dello SNARE motif e la regione transmembrana sono sostituite da peptidi corti e variabili. È molto interessante notare come negli uomini e nelle scimmie antropomorfe lo slittamento della regione codificante determinato dal salto dell’esone 6 abbia prodotto un nuovo dominio di funzione sconosciuta: proprio per questo VAMP7b umana non è tronca, ma addirittura 40 residui più lunga rispetto all’isoforma principale. Dal momento che l’esistenza di questa isoforma “lunga” ed il suo nuovo dominio sono stati confermati a livello proteico grazie all’ausilio di specifici anticorpi, abbiamo effettuato una dissezione in silico del nuovo dominio adoperando un’analisi di sequenza di tipo matrice posizione-specifica (PSI-BLAST), seguita da da Modellistica Strutturale di tipo ab initio. In più, dal momento che la regione N-terminale dello SNARE motif è conservata ed è nota nel mediare il legame intramolecolare al dominio Longin, abbiamo appurato la conservazione della conformazione chiusa sia in vivo (saggio del doppio ibrido in lievito) che in vitro (analisi NMR). Inoltre, la localizzazione subcellulare (SCL) di VAMP7b e Ykt6b è stata studiata adoperando chimere contenenti GFP e RFP. Non ultimo, le isoforme b dei geni longin sono stati analizzati tramite qPCR e si è scoperto essere regolate durante lo sviluppo. • Motif di legame con azione regolatoria sulla crescita e l’indirizzamento neuronale: La regolazione fine delle interazioni proteina-proteina che avviene grazie alle variazioni nell’architettura dei domini o dal cambiamento di motif locali indotto dalla modulazione di caratteristiche di superficie, è in grado di regolare i percorsi di segnalazione sia a livello intra- che extracellulare. Le interazioni proteina-proteina extracellulari possono giocare un ruolo fondamentale nel riconoscimento eterologo (es. ospite-patogeno) come nella segnalazione omologa tra cellule appartenenti allo stesso organismo. Le proteine esposte in membrana plasmatica (PM) possono interagire le une con le altre e con la matrice extracellulare (ECM) per consentire informazioni posizionali e segnali di indirizzamento. Le molecole di adesione cellulare (CAMs) sono proteine della membrana plasmatica in grado di mediare segnali sia di natura attrattiva che repulsiva grazie ad interazioni omo- ed eterofiliche a carico dei loro domini extracellulari (EDs). Questi ultimi sono composti per la magior parte da domini ripetuti aventi fold di tipo Ig o Fibronectina di tipo III. Le attuali conoscenze suggeriscono che i 4 domini extracellulari N-terminali di tipo Ig siano importanti nelle interazioni omo- o eterofiliche ed in modo particolare il dominio Ig2 è provvisto di un importante motif di interazione. Nel nostro laboratorio abbiamo sviluppato dei peptidi biomimetici che riproducono i motif di interazione conosciuti o predetti appartenenti al dominio Ig2 di L1CAM umana e al singolo dominio Ig di LINGO1 umana, proteine, queste, che giocano un ruolo fondamentale nella crescita, nell’indirizzamento e nel differenziamento neuronale. Sulla base della conservazione strutturale della regione del motif (anche tra proteine con architetture molto diverse dei loro EDs), abbiamo iniziato a studiarne la variazione di sequenza mediante analisi per omologia e per espressioni regolari, per infine tornare al livello strutturale mediante Modellistica Molecolare. I risultati preliminari indicano una forte conservazione dell’Arginina centrale presente nel motif d’interazione, mentre nelle altre posizioni del motif si osserva la conservazione di proprietà dei residui piuttosto che la presenza di specifici residui. Questa evidenza è in accordo con il dato di fatto che la mutazione dell’Arginina in L1CAM è responsabile di un serio disordine neurologico, mentre mutazioni a carico di altri residui del motif causano un fenotipo meno grave. Questo suggerisce che il motif è un epitopo posizionalmente conservato attorno all’Arginina centrale in grado di consentire una variabilità limitata ma significativa nella sequenza circostante. Per verificare quest’ipotesi è stata effettuata una superimposizione strutturale dei domini Ig contenenti il motif d’interazione: il risultato ha confermato che il peptide contenente il motif è di per sé conservato posizionalmente e che la conservazione maggiore sia a livello posizionale che struturale è a carico del residuo centrale di Arginina. Esperimenti con peptidi mutati nell’Arginina centrale hanno dimostrato un’attività in termini di segnalazione nella neuritogenesi. Questi lavori hanno consentito di sviluppare un protocollo bioinformatico per la caratterizzazione di determinanti d’interazione e della loro modulazione funzionale, facilmente trasportabile su altre proteine.
28-lug-2017
In silico investigation on protein domains structure and linear/structural motifs can strongly boost functional analyses and technological design. Protein surface features study is crucial to understanding Protein-Protein Interactions (PPI); in particular, surface and pockets conservation and variation, in terms of hydrophobicity, steric hindrance and electrostatics can act as driving forces in protein evolution and functional specialization. Therefore, molecular modeling and structure comparison techniques play an important role in shedding light on “protein behavior” and this PhD work took advantage from integrating computational approaches based on some known molecular modeling methods, such as e.g. Homology Modeling, Fold Recognition, Ab initio Modeling, PBE (Poisson-Boltzmann Electrostatics), Protein-peptide Docking and Hydropathy Analysis with structure and sequence comparison and scanning tools and, of course, with feedback from wet lab analyses performed by co-workers. Such an integrative approach was followed along investigations on a number of different biological systems: • Surface determinants in H5N1 type A Influenza viruses: Here, an analysis of surface determinants from H5N1 haemagglutinin, involved in host-viral interaction, was completed and then published. Genomic variation is very high in influenza A viruses. However, viral evolution and spreading are strongly influenced by immunogenic features and capacity to bind host cells, depending in turn on the two major capsidic proteins (haemagglutinin and neuraminidase). Current analyses of viral evolution are based on serological and primary sequence comparison; however, comparative structural analysis of capsidic proteins can provide functional insights on surface regions possibly crucial to antigenicity and cell binding. We performed molecular modeling and extensive structural comparison of influenza virus haemagglutinin and of their domains and sub-regions to investigate type- and/or domain specific variation. We found that structural closeness and primary sequence similarity are not always tightly related; moreover, type-specific features could be inferred when comparing surface properties of haemagglutinin subregions, monomers and trimers, in terms of electrostatics and hydropathy. Focusing on H5N1, we found that the variation at the receptor binding domain (RBD) surface intriguingly relates to branching of still circulating clades from those ones that are no longer circulating. Recent evidence on the association between electrostatic fingerprints at the haemagglutinin receptor binding surface and the evolutionary success and spreading of H5N1 avian influenza clades prompted us to perform further integrated phylogenetic and structural bioinformatic analysis in H9N2 viruses. In fact, influenza A virus is a zoonotic agent with a significant impact both on public health and poultry industry and switch to human host has been reported for both H5N1 and H9N2 viruses. We performed the evolutionary analysis of a large and non-redundant viral strain dataset, leading to clustering of H9N2 viruses in five groups. Then and according to recent evidence on H5N1, congruence resulted among phylogenetic data and surface electrostatic fingerprints from structural comparison. In particular, surface feature fingerprints could be inferred that relate group specific variation in electrostatic charges and isocontour to well-known hemagglutinin sites involved in modulation of immune escape and host specificity. Results from this second work strengthen suggestion that when integrating up-to-date phylogenetic analyses with sequence-based and structural investigation of surface features may represent a front-end strategy for inferring trends and relevant mechanisms in influenza virus evolution. • Domain architecture variation in mammalian protein trafficking: Human VAMP7b is the most interesting variant among those produced by alternative splicing of the encoding gene SYBL1. Production of VAMP7b variants is determined by skipping of exon 6 which in turn results in coding sequence frameshift. We found that this event is conserved in other mammalian species. VAMP7b shares with the main isoform the N-terminal, inhibitory longin domain and the first half of the SNARE motif. In mammals, VAMP7b is a truncated protein in which the C-terminal half of the SNARE motif and the transmembrane region are replaced by short and variable peptides. Intriguingly instead, only in human and apes sequence frameshift determined by exon 6 skipping results in the creation of a novel unique domain of unknow function, hence human VAMP7b is not truncated but even 40 residues longer than the main isoform. Since existence of such “long” isoform and of its unique domain at protein level were confirmed by specific antibodies, we embarked on in silico dissection of the novel domain by position specific matrix sequence analysis and by ab initio structural modeling. Moreover, since the N-terminal region of the SNARE motif is conserved and it is known to mediate intramolecular binding to the Longin domain, we investigated both in vivo (by two-hybrid in yeast analysis) and in vitro (by NMR analysis) on conservation of the closed conformation. Furthermore, SCL of both VAMP7b and Ykt6b was investigated using GFP and RFP chimeras. Last but not least, b isoforms of the longin genes were analyzed by qPCR and found to be developmentally regulated. • Binding motif regulating neurite outgrowth and guidance: Fine tuning of PPIs by variation in domain architecture or by changing local motifs by surface features modulation can regulate both extracellular and intracellular signaling pathways. Extracellular PPIs can play a central role in heterologous recognition (e.g. host-pathogen) as well as in homologous signaling among cells from the same organism. Proteins exposed at the plasma membrane (PM) can interact each other and with the extracellular matrix (ECM) to provide positional information and guidance cues. Cell adhesion molecules (CAMs) are PM proteins mediating either attractive or repulsive signals by homo- and heterophilic interactions of their extracellular domains (Eds). CAM EDs are most often composed by Ig-like or Fibronectin type III fold repeats. Current evidence suggests that the four N-terminal Ig 1-4 domains of CAM EDs play a major role in such homo- or heterophilic interactions and in particular an important interaction motif is contributed by repeat Ig2. In our lab, biomimetic peptides have been developed by reproducing the known or predicted interaction motifs from the Ig2 domain of human L1CAM and the single Ig domain of human LINGO1, i.e. two proteins that play a crucial role in neurite outgrowth and guidance and in neuronal differentiation. Based on the somehow surprising structural and sequence conservation of the motif region (even when proteins show very different ED architectures), we started investigating on variation and conservation of the putative motif region by means of homology search, regular expression and finally by structural modeling and comparison. Preliminary results highlighted strong conservation of the central Arg residue in the interaction motif, while in other positions of the motif residue properties rather than specific residues are conserved. Such evidence is in agreement with finding that mutation of such residue in L1CAM is responsible for a severe neurological disorder, while mutations at other residues of the motif, results in less severe phenotype. This suggests the motif is an epitope positionally conserved around the central Arg allowing limited, but significant structural variability in surrounding sequence. In order to check such a hypothesis, a structural superposition of the Ig domains containing the interaction motif was performed, confirming that the peptide motif itself is positionally conserved but the highest positional and structural conservation concerns the central Arg residue. Experiments with peptides mutated in the central Arg showed biological activity of these peptides in terms of neuritogenesis signalling. These works carry out a bioinformatic protocol for the characterization of interaction determinants and their functional modulation, easily transportable to other proteins.
Homology Modeling, Fold Recognition, Ab initio Modeling, PBE (Poisson-Boltzmann Electrostatics), Protein-peptide Docking, Hydropathy Analysis, Protein-protein interactions, H5N1, H9N2, protein surface, CAM, biomimetics, SNARE
Towards "Systems Biotechnology": identification, characterization and design/engineering of protein interaction motifs/domains mediating regulatory signals / Righetto, Irene. - (2017 Jul 28).
File in questo prodotto:
File Dimensione Formato  
Righetto_Irene_tesi.pdf

accesso aperto

Tipologia: Tesi di dottorato
Licenza: Non specificato
Dimensione 10.19 MB
Formato Adobe PDF
10.19 MB Adobe PDF Visualizza/Apri
Pubblicazioni consigliate

I documenti in IRIS sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/11577/3426306
Citazioni
  • ???jsp.display-item.citation.pmc??? ND
  • Scopus ND
  • ???jsp.display-item.citation.isi??? ND
  • OpenAlex ND
social impact