Negli ultimi anni l’impatto dei big data sulla capacità di prevedere vari fenomeni e sulla conoscenza in generale è stato tale che si è dibattuto sulla possibile “fine della teoria”. La disponibilità di dataset relazionali su larga scala, spesso generati attraverso contenuti pubblicati direttamente dagli utenti sui Social Networking Sites, offre nuove opportunità e solleva al tempo stesso interrogativi e problematiche metodologiche, che la sociologia e le scienze sociali in generale non possono ignorare. Un saggio delle potenzialità di analisi di dati sociali su larga scala è offerto dai modelli probabilistici per l’individuazione dei topic latenti in un corpus testuale, come la latent Dirichlet allocation, applicabili, per esempio, ai contenuti presenti sul sito di micro-blogging Twitter. A partire da queste premesse, il presente contributo illustra una proposta di inquadramento metodologico del topic modeling all’interno di disegni di ricerca basati sui mixed methods, che combinano metodi e tecniche quantitative e qualitative. In particolare, questo lavoro mostra una possibile integrazione di metodi qualitativi in un disegno di ricerca fondato su analisi e algoritmi derivanti da un approccio tipicamente quantitativo. Pur sottolineando i limiti conoscitivi insiti in queste tecniche di analisi, la loro ricaduta sulla ricerca sociale è rilevante e la strada intrapresa non può che favorire una maggiore collaborazione interdisciplinare.
Big data nelle scienze sociali: una proposta di integrazione del topic modeling nei disegni di ricerca con mixed methods
Sciandra A
2015
Abstract
Negli ultimi anni l’impatto dei big data sulla capacità di prevedere vari fenomeni e sulla conoscenza in generale è stato tale che si è dibattuto sulla possibile “fine della teoria”. La disponibilità di dataset relazionali su larga scala, spesso generati attraverso contenuti pubblicati direttamente dagli utenti sui Social Networking Sites, offre nuove opportunità e solleva al tempo stesso interrogativi e problematiche metodologiche, che la sociologia e le scienze sociali in generale non possono ignorare. Un saggio delle potenzialità di analisi di dati sociali su larga scala è offerto dai modelli probabilistici per l’individuazione dei topic latenti in un corpus testuale, come la latent Dirichlet allocation, applicabili, per esempio, ai contenuti presenti sul sito di micro-blogging Twitter. A partire da queste premesse, il presente contributo illustra una proposta di inquadramento metodologico del topic modeling all’interno di disegni di ricerca basati sui mixed methods, che combinano metodi e tecniche quantitative e qualitative. In particolare, questo lavoro mostra una possibile integrazione di metodi qualitativi in un disegno di ricerca fondato su analisi e algoritmi derivanti da un approccio tipicamente quantitativo. Pur sottolineando i limiti conoscitivi insiti in queste tecniche di analisi, la loro ricaduta sulla ricerca sociale è rilevante e la strada intrapresa non può che favorire una maggiore collaborazione interdisciplinare.Pubblicazioni consigliate
I documenti in IRIS sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.