Por Alvaro Graves, 2015.
Esta visualización permite ver las cartas al director publicadas el 2015 en El Mercurio (detalles técnicos más abajo). Las cartas están agrupadas por temas (educación, economía, etc). El número de cartas relacionado por cada tema varía, por lo que se ven temas con más o menos cartas. Al hacer click en cada una de esas áreas, la cartas relacionadas se despliegan en una línea de tiempo. Cuando hay más de una carta sobre un tema en el mismo día, estas se muestran una sobre otras, creando una especie de histograma. Es posible aumentar o reducir el número de áreas en las que se agrupan las cartas, dando un enfoque más detallado o global a la visualización.
Al hacer click en una carta, se muestra el título, link y las persona, organizaciones y otras entidades relacionadas (ver detalles técnicos más abajo). También se muestran links a otras carta que mencionan a las mismas personas y organizaciones. Es posible hacer click en cada entidad mostrada abajo, lo que va a mostrar las cartas donde sólo esta persona u organización aparece. También es posible usar la selección que aparece justo arriba de la visualización para buscar personas, organizaciones, países, etc.
Preguntas, comentarios o sugerencias a alvaro@graves.cl o alvarograves.
Apliqué Latent Dirichlet Allocation con n = 5, 10, 20 para agrupar las noticias. Además hice entity recognition para obtener las entidades (personas, organismos públicos, etc). El reconocimiento de entidades está lejos de ser óptimo, debido a las limitaciones del algoritmo usado (MonkeyLearn). Es probable que se pueda mejorar este reconocimiento de entidades, pero es algo bastante más costoso en tiempo.
También por razones de tiempo y recursos no pude obtener los datos de los primeros días de Enero y de fines Diciembre. A pesar de eso, decidí mostrar la línea de tiempo completa de manera de dejar en claro que no están los datos del año completo.