Evolución de los usuarios de Twitter y su comportamiento


Una investigación arrojó los resultados de lo que sería la evolución y comportamiento de los usuarios de Twitter desde 2010.

Con más de 37 mil millones de Tweets hechos 2006 y 2013, se cuantifica a los usuarios, su comportamiento, y cómo el sitio en conjunto ha evolucionado.

Observaron y cuantificaron una serie de patrones interesantes, incluyendo:

- La propagación de Twitter en todo el mundo, tanto en términos de usuarios de diferentes regiones como de Tweets que contienen diferentes idiomas (por ejemplo, el porcentaje de usuarios de EE.UU. / Canadá cae de más del 80% al 32% , y el porcentaje de usuarios twitteando en Inglés cae del 83% al 52%).

- El porcentaje de tweets que ya no están disponibles debido a la acción de los aumentos de un usuario o de Twitter a más del 20% para algunos rangos de tiempo.

- El porcentaje de las cuentas de usuarios de Twitter que están inactivos muestra un rápido crecimiento, más del 32,5% de las cuentas no han twitteado hace más de un año.

- El aumento de comportamientos maliciosos en Twitter a partir de 2009, incluyendo los seguidores falsos, cuentas falsas, y la promoción hashtag, más del 6% de todas las cuentas están ahora suspendidas.

- El cambio de un sistema principalmente móvil (por SMS) a un sistema principalmente de escritorio (a través de la web) y de nuevo a un sistema principalmente móvil (a través de las aplicaciones móviles).

Hoy en día, más de la mitad de todos los Tweets se crean desde dispositivos móviles.

En la siguiente imagen pueden ver el porcentaje de toda la base de usuarios de Twitter a través del tiempo cuyas cuentas están protegidas, desactivadas, suspendidas o inactivas (por lo menos durante un año), basado en el conjunto de datos UserSample. Se obrserva un aumento espectacular de las cuentas tanto inactivas y suspendidas a partir de 2010.





La media del número de Tweets por usuario por mes en el tiempo, está basado en los primeros y últimos estados de cuenta observados para cada usuario. Este resultado se basa en el conjunto de datos "Gardenhose", que está sesgado hacia los usuarios más activos.





En la siguiente imagen se muestra el porcentaje de Tweets creados en diferentes regiones geográficas a través del tiempo. Las Geo-etiquetas se introdujeron en noviembre de 2009, por lo que sólo se muestran los datos desde entonces. Tanto África y Oceanía tienen menos del 1%, y no se muestran para mayor claridad. Se pueden observar una serie de tendencias interesantes, que cuantifican la propagación de Twitter en todo el mundo.






Veamos el porcentaje de usuarios de los seis idiomas más populares en el tiempo. Los Tweet en Inglés se trazaron por separado en el gráfico superior, a fin de aumentar la legibilidad; la escala es diferente entre los dos gráficos. El idioma Inglés muestra una disminución en su mayoría lineal de 83% en enero de 2010 al 52% en diciembre de 2013.







El porcentaje de los diferentes tipos de Tweets en el tiempo: Ambos - RTs y Retweets -
representar los Retweets, incluyendo como se hacía anteriormente, con captura y manual. Los Retweets nativos fueron introducidos en Twitter a partir de noviembre de 2009.




Media del número de amigos y seguidores de todos los usuarios y la proporción de amigos a los seguidorescomo derivados del conjunto de datos  de "Gardenhose".  Se observa una densificación dramática de la gráfica social de Twitter. Similar al conjunto de datos que provoca un sesgo hacia los usuarios más activos.




Hasta el 10% de los Tweets son emitidos por usuarios que después cambian su cuenta abierta a una cuenta protegida con candado, y hasta un 5% de los Tweets se suprime explícitamente por los usuarios. El aumento de los tweets que no están disponibles debido a los usuarios suspendidos y eliminados corresponde fuertemente con el aumento del spam en Twitter (Thomas et al. 2011).







El porcentaje de tweets con diferentes tipos de entidades (abajo), y el número promedio de entidades para estos Tweets (arriba) en el tiempo.
Se observa cómo crecen las menciones, y una creciente probabilidad de muchos hashtags por Tweet.







Porcentaje de Tweets creados con diferentes diferentes clientes de Twitter en el tiempo.








Para ver el trabajo completo: ccs.neu.edu




Publicidad