The study aims at comparing two methods for tracing the temporal evolution of topics and keywords in corpora of scientific literature: the well-known Latent Dirichelet Allocation and a new knowledge-based system that has been developed in a functional data analysis unsupervised perspective. Object of the study is a corpus of abstracts of articles published by the American Journal of Sociology over a century (1921-2018). Our study advocates that the two methods might not be seen as alternative but rather as integrable means to improve the interpretation of findings. [Lo studio mira a confrontare due metodi per tracciare l’evoluzione temporale di argomenti e parole chiave in corpora di letteratura scientifica: la ben nota Latent Dirichelet Allocation e un nuovo sistema basato sulla conoscenza sviluppato in una prospettiva non supervisionata di analisi dei dati funzionali. Oggetto dello studio e un corpus di abstracts di articoli pubblicati dall’American Journal of Sociology nel corso di un secolo (1921-2018). Lo studio propone di considerare i due metodi non come alternativi ma piuttosto come strumenti integrabili per migliorare l’interpretazione dei risultati.

Knowledge discovery for dynamic textual data: temporal patterns of topics and word clusters in corpora of scientific literature

Stefano Sbalchiero;Arjuna Tuzzi
2019

Abstract

The study aims at comparing two methods for tracing the temporal evolution of topics and keywords in corpora of scientific literature: the well-known Latent Dirichelet Allocation and a new knowledge-based system that has been developed in a functional data analysis unsupervised perspective. Object of the study is a corpus of abstracts of articles published by the American Journal of Sociology over a century (1921-2018). Our study advocates that the two methods might not be seen as alternative but rather as integrable means to improve the interpretation of findings. [Lo studio mira a confrontare due metodi per tracciare l’evoluzione temporale di argomenti e parole chiave in corpora di letteratura scientifica: la ben nota Latent Dirichelet Allocation e un nuovo sistema basato sulla conoscenza sviluppato in una prospettiva non supervisionata di analisi dei dati funzionali. Oggetto dello studio e un corpus di abstracts di articoli pubblicati dall’American Journal of Sociology nel corso di un secolo (1921-2018). Lo studio propone di considerare i due metodi non come alternativi ma piuttosto come strumenti integrabili per migliorare l’interpretazione dei risultati.
2019
Smart statistics for smart applications. Book of short papers SIS2019
Intermediate Meeting of Italian Statistical Society (SIS)
9788891915108
File in questo prodotto:
Non ci sono file associati a questo prodotto.
Pubblicazioni consigliate

I documenti in IRIS sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/11577/3306679
Citazioni
  • ???jsp.display-item.citation.pmc??? ND
  • Scopus ND
  • ???jsp.display-item.citation.isi??? ND
  • OpenAlex ND
social impact