Motivated by the analysis of telecommunications marketing data, which are multidimensional, longitudinal and mostly consisting in counts, this thesis introduces novel Bayesian nonparametric techniques for the estimation of probability mass functions and count stochastic processes. In addition, the theoretical basis of nonparametric mixture models for mixed-scale density estimation are provided. Mixed-scale data consists in joint continuous, count and categorical variables. Although Bayesian nonparametric models for continuous variables are well developed, the literature on related approaches for counts is limited and that for mixed-scale variables is close to none. The leading idea of this work is to induce prior distributions on the spaces of interest via priors on suitable latent spaces and mapping functions. Precisely a class of priors on the space of the probability mass functions and of the mixed-scale densities is induced through priors on the space of continuous densities and another class of priors on count stochastic process is induced through priors on the space of continuous stochastic processes. Asymptotic properties of these procedures are studied and results in terms of large support and posterior consistency are obtained under suitable assumptions. Efficient Gibbs samplers are developed for posterior computation, and the performance of the proposed methods is assessed in simulation studies and real data applications.
Motivati dall'analisi di dati di marketing nelle telecomunicazioni, solitamente multidimensionali, longitudinali e per lo più composti da conteggi, questo lavoro di tesi introduce nuove tecniche bayesiane nonparametriche per la stima delle funzioni di probabilità e la modellazione dei processi stocastici a valori interi. Sono introdotti inoltre i fondamenti teorici per la stima di densità congiunta con variabili su scale di misura miste (continue, conteggio e categoriali) tramite modelli mistura nonparametrica. Sebbene i modelli bayesiani nonparametrici per variabili continue siano ben sviluppati, la letteratura su approcci simili per dati di conteggio è scarsa, mentre quella per dati su diverse scale di misura è praticamente inesistente. L'idea principale di questo lavoro è quella di indurre distribuzioni a priori sugli spazi astratti di interesse tramite distribuzioni a priori su appropriati spazi latenti e funzioni di mappatura. Nello specifico, attraverso a priori sullo spazio delle densità countinue è introdotta una nuova classe di a priori sullo spazio delle funzioni di probabilità discrete e a scala di misura mista, mentre attravesto a priori sullo spazio dei processi stocastici a valori continui è introdotta una classe di a priori sui processi stocastici di conteggio. Le proprietà asintotiche di queste procedure sono studiate e, sotto opportune ipotesi, vengono dimostrati risultati sull'ampiezza del supporto e sulla consistenza dell'a posteriori. Vengono inoltre sviluppati efficienti algoritmi di campionamento di Gibbs per il calcolo delle a posteriori. Le prestazioni dei metodi proposti sono verificate tramite studi di simulazione e applicazioni a dati reali.
Bayesian nonparametric models for count data with applications to customer base management / Canale, Antonio. - (2012 Jan 31).
Bayesian nonparametric models for count data with applications to customer base management
Canale, Antonio
2012
Abstract
Motivati dall'analisi di dati di marketing nelle telecomunicazioni, solitamente multidimensionali, longitudinali e per lo più composti da conteggi, questo lavoro di tesi introduce nuove tecniche bayesiane nonparametriche per la stima delle funzioni di probabilità e la modellazione dei processi stocastici a valori interi. Sono introdotti inoltre i fondamenti teorici per la stima di densità congiunta con variabili su scale di misura miste (continue, conteggio e categoriali) tramite modelli mistura nonparametrica. Sebbene i modelli bayesiani nonparametrici per variabili continue siano ben sviluppati, la letteratura su approcci simili per dati di conteggio è scarsa, mentre quella per dati su diverse scale di misura è praticamente inesistente. L'idea principale di questo lavoro è quella di indurre distribuzioni a priori sugli spazi astratti di interesse tramite distribuzioni a priori su appropriati spazi latenti e funzioni di mappatura. Nello specifico, attraverso a priori sullo spazio delle densità countinue è introdotta una nuova classe di a priori sullo spazio delle funzioni di probabilità discrete e a scala di misura mista, mentre attravesto a priori sullo spazio dei processi stocastici a valori continui è introdotta una classe di a priori sui processi stocastici di conteggio. Le proprietà asintotiche di queste procedure sono studiate e, sotto opportune ipotesi, vengono dimostrati risultati sull'ampiezza del supporto e sulla consistenza dell'a posteriori. Vengono inoltre sviluppati efficienti algoritmi di campionamento di Gibbs per il calcolo delle a posteriori. Le prestazioni dei metodi proposti sono verificate tramite studi di simulazione e applicazioni a dati reali.File | Dimensione | Formato | |
---|---|---|---|
canale_26Gen.pdf
accesso aperto
Tipologia:
Tesi di dottorato
Licenza:
Accesso gratuito
Dimensione
1.9 MB
Formato
Adobe PDF
|
1.9 MB | Adobe PDF | Visualizza/Apri |
Pubblicazioni consigliate
I documenti in IRIS sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.