jueves, 16 de noviembre de 2017

Quién habla de quién en LATAM?

De quien hablamos en el barrio? Y que decimos?

Usando la metodología del IHCT es posible verificar el nivel y tono de conversación sobre los demás países de latinoamérica. Para ello se corrió la herramienta en su versión "comparación" para cada país procesando cerca de 700 mil tweets y 8 millones de palabras.

METODOLOGÍA
Para la comparación se utililzó el IHCT (Indice de Humor de la Conversación en Twitter) para los filtros "argentin[oa]", "chilen[oa]", "uruguay[oa]", "paraguay[oa]", "bolivian[oa]", "ecuatorian[oa]", "peruan[oa]", "colombian[oa]", y "venezolan[oa]" en cada país, excluyendo en cada caso el propio país. La rutina se corrió para los datos recolectados entre el 1 de mayo y el 15 de noviembre de 2017. 

Dado que la herramienta permite hacer 8 comparaciones simultáneas se excluyó del análisis a México concentrándose en América del Sur.

Para el análisis de la frecuencia de la conversación se tuvo en cuenta el porcentaje de tweets que contenían el filtro seleccionado en el total de la conversación de cada país.
Para el análisis del tono de la conversación se utilizó el promedio de los últimos 180 días disponibles del Indice de Humor de la Conversación en Twitter y el Saldo Neto Palabras Positivas. 
Finalmente se hizo un promedio simple de los registros por país.

Los parámetros utilizados para el estudio fueron puntajes neutros 3 a 7 y puntajes nulos 4 a 6. Con estos parámetros, las palabras con puntajes entre 4 y 6 fueron excluidas del análisis. Las palabras con puntajes menores a 3 fueron consideradas negativas y las que tienen puntajes mayores a 7 fueron consideradas positivas.

CONCLUSIONES

Cuánto se habla?
La cantidad de tweets que tienen referencia a otros países sudamericanos medida por los términos seleccionados es muy baja. El máximo se registro en la conversación de twitter de Bolivia sobre la referencia "argentino[oa]" (1,24%) y en varios países no se registró conversación sobre algunos de los términos filtrados.

De quien se habla más?
En términos generales, se observó que el país del que más se habla es argentina. El término "argentin[oa]" tiene un promedio de menciones de 0,5% entre los países sudamericanos. Este registro es el doble del que promedia el término "venezolan[oa]", y cinco veces mayor al de los términos "chilen[oa]" y "colombian[oa]".
Otra característica interesante referido a la frecuencia de conversación sobre Argentina es que en todos los países relevados está en los más mencionados. En contraste, la conversación sobre Venezuela registra mucha más variación siendo el 0,5% en el caso de Colombia pero solamente el 0,04% para el caso de Paraguay.

Quién habla más de los demás?
Una segunda dimensión de análisis referida a la frecuencia de la conversación, proviene de analizar en que país se habla más de los demás. Nuevamente aquí destaca Argentina, aunque en este caso por la escasa referencia hallada en la conversación de twitter en referencia a otros países (según los filtros destacados).
Solamente el 0,3% de la conversación de twitter refiere a alguno de los otros 8 países de habla hispana de Sudamérica. Le sigue Venezuela con un 0,5% y Perú con un 0,6%.
El país en el que más se hace referencia a otros países es Bolivia, donde el 2% de la conversación contiene alguno de los términos filtrados. Como fue mencionado, algo más de la mitad de las menciones refieren a Argentina, seguida por sus otros dos vecinos de habla hispana (Chile y Perú).
Uruguay, Paraguay, Colombia, y Ecuador presentan aproximadamente 1% de la conversación en twitter referida a otros países.



Como se habla?
La siguiente dimensión de análisis tiene en cuenta el "humor" de la conversación y para eso se utilizó el IHCT promedio y el SNPP.
El IHCT presentó problemas en algunas mediciones ya que algunos países no registraron medición de algunos filtros a pesar de que el SNPP tuvo lecturas en todos los casos.

De quien se habla mejor?
Como habitualmente, la dispersión del IHCT fue baja con el registro máximo de 6,21 registrado en la conversación de Uruguay en referencia al filtro "colombian[oa]". Esta conversación capturó el 0,2% del total de los tweets del período de referencia en Uruguay. El registro mínimo fue 4,97 también en el caso de la conversación de Uruguay referida en este caso a Venezuela.

El país que presentó un mayor IHCT promedio fue Ecuador (con la referencia "ecuatorian[oa]") y Paraguay (con la referencia "paraguay[oa]"). El menor fue Venezuela que aparece distanciado del primero. Chile y Bolivia le siguen en la parte baja de la tabla.

Las diferencias son algo más expresivas al analizar el SNPP. en este caso, el país con mayor saldo neto de palabras positivas fue Uruguay con 15. Si bien la conversación sobre Uruguay no se destaca por ser extraordinariamente positiva (20% contiene palabras mayores de 7 por debajo de Argentina o Paraguay), la utilización de términos negativos es particularmente baja (el término "uruguay[oa]" tiene el menor porcentaje de palabras con puntaje menor a 3). Con un porcentaje positivo relativamente alto y un negativo muy bajo, la conversación sobre Uruguay consigue ser una de las que involucra el mayor saldo neto de palabras positivas.
La lectura guarda cierta relación con el IHCT que fue de 5,9 (levemente por debajo de Ecuador y Paraguay).

Argentina y Paraguay le siguen en la tabla. Es interesante destacar el caso de Argentina, que teniendo un volumen extraordinariamente alto de referencias, registra una conversación con tono positivo. El reciente resultado del proceso electoral puede estar influyendo en esas lecturas.

En el otro extremo de la tabla se encuentra Venezuela. El saldo neto fue 3 que resulta de un 16% de términos positivos menos un 13% de negativos. La conversación en twitter que refiere a Venezuela tiene el menor porcentaje de palabras positivas y el mayor porcentaje de palabras negativas de los países relevados. Nuevamente la lectura resulta consistente con el IHCT.

Le siguen en el lado bajo de la tabla Chile y Bolivia.

Quién habla mejor de los demás?
La aplicación de esta metodología permite medir el "tono" de la conversación que se hace en cada país sobre los demás. Paraguay destaca como el país que asocia más vocabulario positivo cuando se refiere a los demás, mientras que Venezuela destaca nuevamente en la medición.

En Venezuela la conversación sobre los demás países de latinoamérica involucra relativamente pocos términos positivos (15% versus un promedio de 20% en los restantes) y un volumen alto de términos negativos (13% versus un promedio de 8% en los restantes). Destaca la conversación sobre Chile que tiene un saldo negativo de -7. Colombia y Perú también presentan mediciones relativamente bajas.
Llama la atención las lecturas de Bolivia y Ecuador con bajos SNPP. La conversaciones sobre esos dos países en Venezuela presentan bajos porcentajes de palabras positivas (11% versus 16% del promedio de los restantes).

Bolivia y Perú acompañan a Venezuela en el lado bajo de la tabla.



Como referencia se incluye algunas informaciones económicas sobre los distintos países. La última columna del cuadro presenta el saldo de cuenta corriente de 2016 por país, contra los demás países estudiados. Aunque no es posible establecer una correlación entre el nivel de integración económica medida por este indicador y el "humor" de la conversación, algunas narrativas puntuales pueden ser ajustadas a dichas lecturas.



SÍNTESIS

La aplicación de la metodología del IHCT permite analizar el "humor" de la conversación de los países de Sudamérica en relación a sus vecinos.

Entre Mayo y Noviembre, la conversación sobre Argentina captó la mayor atención entre sus vecinos siendo más del doble que la de su inmediato seguidor. Esta conversación reflejó un "humor" positivo siendo la que mayor porcentaje de palabras positivas presentó. Probablemente el proceso político electoral de los últimos meses se reflejó en estos registros.
El segundo país con más menciones fue Venezuela aunque en este caso, la conversación tuvo un "humor" predominantemente negativo. Las dificultades de los últimos meses se ven reflejadas en esas lecturas.

Resulta interesante observar también que Argentina y Venezuela son los países que menos hablan de los demás. Seguramente la intensidad de los procesos internos compiten en atención con la realidad de los países vecinos. 


Anexo