The study aims at comparing two methods for tracing the temporal evolution of topics and keywords in corpora of scientific literature: the well-known Latent Dirichelet Allocation and a new knowledge-based system that has been developed in a functional data analysis unsupervised perspective. Object of the study is a corpus of abstracts of articles published by the American Journal of Sociology over a century (1921-2018). Our study advocates that the two methods might not be seen as alternative but rather as integrable means to improve the interpretation of findings. [Lo studio mira a confrontare due metodi per tracciare l’evoluzione temporale di argomenti e parole chiave in corpora di letteratura scientifica: la ben nota Latent Dirichelet Allocation e un nuovo sistema basato sulla conoscenza sviluppato in una prospettiva non supervisionata di analisi dei dati funzionali. Oggetto dello studio e un corpus di abstracts di articoli pubblicati dall’American Journal of Sociology nel corso di un secolo (1921-2018). Lo studio propone di considerare i due metodi non come alternativi ma piuttosto come strumenti integrabili per migliorare l’interpretazione dei risultati.
Knowledge discovery for dynamic textual data: temporal patterns of topics and word clusters in corpora of scientific literature
Stefano Sbalchiero;Arjuna Tuzzi
2019
Abstract
The study aims at comparing two methods for tracing the temporal evolution of topics and keywords in corpora of scientific literature: the well-known Latent Dirichelet Allocation and a new knowledge-based system that has been developed in a functional data analysis unsupervised perspective. Object of the study is a corpus of abstracts of articles published by the American Journal of Sociology over a century (1921-2018). Our study advocates that the two methods might not be seen as alternative but rather as integrable means to improve the interpretation of findings. [Lo studio mira a confrontare due metodi per tracciare l’evoluzione temporale di argomenti e parole chiave in corpora di letteratura scientifica: la ben nota Latent Dirichelet Allocation e un nuovo sistema basato sulla conoscenza sviluppato in una prospettiva non supervisionata di analisi dei dati funzionali. Oggetto dello studio e un corpus di abstracts di articoli pubblicati dall’American Journal of Sociology nel corso di un secolo (1921-2018). Lo studio propone di considerare i due metodi non come alternativi ma piuttosto come strumenti integrabili per migliorare l’interpretazione dei risultati.Pubblicazioni consigliate
I documenti in IRIS sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.