INTRODUCCIÓN
La presente investigación nace producto de varios eventos y noticias que tenían un comportamiento anómalo en redes sociales alrededor del Plebiscito de Chile. Se habían encontrado cuentas, patrones y comportamientos habituales de los generadores de contenido fake o artificial. Por ejemplo, se veían Trending Topics con cuentas que generaban más de 100 mensajes y RTs; y, al cabo de unas horas, eliminaban el contenido. Adicionalmente, existían muchos mensajes en periodos cortos de tiempo para intentar desviar la atención. Lo interesante de esto es que se creaban tendencia con mucha facilidad, lo que nos generó una alerta de Astroturfing.
Con lo dicho anteriormente, nos planteamos algunas hipótesis que han sido resueltas con nuestra investigación.
HIPÓTESIS
El inflar una discusión, es más habitual de lo que pensamos pero pocas empresas han desarrollado una técnica y metodología para evidenciar con datos este comportamiento, pero también, porque no se plantean hipótesis claras de investigación que en nuestro caso son:
H1. ¿La discusión alrededor del apruebo es orgánica?
H2. ¿El comportamiento atípico es solo en una red social?
METODOLOGÍA
Es importante indicar que dentro de un proceso de investigación digital, no existen en el mercado herramientas que estén desarrolladas para responder hipótesis o incógnitas respecto de un tema determinado. Si bien existen productos que permiten resolver gran parte de la discusión radicada en redes sociales, estos mismos productos no han sido creados para responder preguntas como: ¿Cuál es la fecha de creación de una cuenta?, ¿Cuál es el ID de un objeto o cuenta?, ¿Cuál es la velocidad de escritura por segundo o minuto de una cuenta?, etc.
Por lo tanto, debemos recurrir a la ciencia de datos para poder responder las hipótesis que han sido planteadas.
La ciencia de datos es una rama de investigación que nace en los últimos años y comprende un equipo multidisciplinario con conocimiento en: Estadística, Econometría, Programación, Analistas Sr. de data y desarrolladores de Software.
En el presente estudio se aplicará un método conocido como ETL (Extract, Transform and Load). Esto quiere decir que extraeremos información directamente de la fuente, transformaremos la información en un set de datos; y, finalmente, cargaremos para una visualización y entendimiento.
¿Qué sucedió en mayo con el Presidente Boric?
Si bien el motivo de análisis es el comportamiento alrededor del Plebiscito, no podemos dejar de investigar el comportamiento digital en un fenómeno que fue tendencia en redes sociales para ver si existe relación. Esto es, analizar la amplificación realizada a la rendición de cuentas (Cuenta Pública) ya que el comportamiento fue bastante atípico con la utilización del hashtag.
#CuentaPublica2022
Se generaron más de 62.0K mensajes con más de 620.0K interacciones de las cuales se han extraído todos los resultados para poder comprender el comportamiento digital. Como se puede ver, las cuentas pro Boric son mayor en número: