ANÁLISIS NLP de discursos presidenciales en eua: biden vs trump – datlas investigación

La semana pasada el protagonismo para la audiencia en Estados Unidos de América y la mayoría de países del mundo fue el cambio en el liderazgo presidencial del país. Después de unas controversiales votaciones, Joe Biden del partido Democrático ganó y paso a ser el nuevo presidente de los Estado Unidos por un período de 4 años.

Dejando atrás la controversia electoral, en esta columna nos enfocamos a desarrollar un análisis de NLP (Natural Language procesing o procesamiento de lenguaje natural) de los discursos presidenciales. Por un lado el de salida desarrollado por Donald Trump y por otro lado el de entrada, ejecutado por Joe Biden.

Te pudiera interesar los análisis que hemos hecho para los discursos de AMLO, el presidente de México, en el 2018 y 2019.

¿Qué es el procesamiento de Lenguaje natural o NLP?

Es un campo de la inteligencia artificial que estudia las interacciones entre computadoras y el lenguaje humano. Son utilizados en el estudio de discursos escritos o hablados. En este caso, por ejemplo, de un discurso presidencial.

El discurso de salida de Donald TRUMP

El discurso de salida de la presidencia de Trump estuvo cargado de agradecimientos y mensajes que algunos consideran de «venganza» o dejando claro que «regresará» de alguna u otra manera al escenario político de Estados Unidos. Si quieres leer el discurso completo te recomendamos ver la siguiente liga.

Como primer paso, pre-procesamos el discurso y lo dividimos en distintos enunciados más pequeños para que pueda ser procesado correctamente. Usando la librería » library(SentimentAnalysis) » en R contamos la cantidad de palabras por cada uno de los enunciados.

Posteriormente, y tomando en cuenta un diccionario de palabras que asocia cada término con un puntaje que representa 3 niveles de connotación en cada palabra: negativa, neutral o positiva, se analiza el nivel de cada uno de los enunciados.

Es posible obtener el nivel generalizado de cada uno de los enunciados su nivel. En ese sentido encontramos que para el discurso de trump 20 de los 23 enunciados desarrollados fueron con una mayor carga positiva

Respecto a las palabras, podemos realizar un conteo de las más usadas y así construir una «nube de palabras» que nos ayudará a entender un poco más el tipo de lingüística preferido por el presidente en este discurso

En concreto, este discurso tiene una carga de agradecimiento como es de entender de alguien que deja su cargo. Muy enfocado a las personas y elaborando comentarios sobre los temas problemáticos con los que se despide su gobierno. Muy al estilo Trump, algunas palabras denotan extremos, pero generarán empatía con su seguidores y partido.

El discurso de entrada de JOE BIDEN

Corriendo un proceso similar, tan sencillo como replicar el código, pre-procesamos el discurso de BIDEN que puedes encontrarlo aqui.

Respecto a la carga de mensajes, 45 de los 53 mensajes tuvieron una carga positiva. En proporción, menos que los de TRUMP, y mayormente porque algunas emociones que provocaría BIDEN en su discurso serían para provocar preocupación de la situación «caótica» en la que le «entregan» al gobierno.

Cuando revisamos las palabras más frecuentes del discurso encontramos terminología clásica en discursos presidenciales. Tales como «América», «Nación», «Democracia», «Presidente» y «personas». Con estas palabras invoca mensajes a una audiencia específica, al pueblo de los Estados Unidos.

Aqui una imagen generada con esta información

¿Para qué nos puede servir el análisis de NLP?

  • Analizar tickets de clientes
  • Clasificar prioridad de dudas o mensajes
  • Entender el contexto y campos de texto en variables
  • Generar predicciones
  • Entre otros…

Los mejores usos a este tipo de métodos se les da en aplicativos usando datos de redes sociales. Como es el caso de Twitter. Por ejemplo, aqui se analizan los datos de los últimos 250 tweets al corte de @JoeBiden

Hasta aqui la columna de hoy, cuéntanos en nuestras redes sociales @DatlasMX qué otro tipo de aplicaciones existen para NLP. Comparte y suscríbete a nuestras cuentas.

Equipo Datlas

– Keep it weird-

El santo grial de analytics: «Location Intelligence», y su controversia con la privacidad – Datlas research

(Este blog es una adaptación del trabajo de investigación del #NYTIMES referido en: https://www.nytimes.com/interactive/2019/12/19/opinion/location-tracking-cell-phone.html)

En los últimos 2 años el escándalo de privacidad de«Cambridge Analytica»y Facebook ha levantado polvo sobre lo invasivo que puede llegar a ser la tecnología en nuestras vidas. Nos dimos cuenta que la red social más importante del mundo podía saber tanto de nosotros (como perfil, amigos, familiares, hobbies, donde estábamos, con quién nos tomábamos fotos, etc.) al grado de poder usar esta información para influenciar nuestros gustos y preferencias. Tal y como lo expusimos en el blog sobre el documental de Netflix «The Great Hack».

Datlas_Blog_Promo_SuscriberFree

Mientras como usuarios nos preocupábamos por hacer conciencia y comprender esta nueva realidad que vino acompañada de servicios digitales  «gratuitos» (por que tu verdadera moneda de intercambio es tu información), existe otra cara de la historia. Nos referimos a las empresas que estaban aprovechando la poca o nula regulación sobre privacidad de datos para generar formulas de marketing nunca antes vistas. En esta columna hablaremos de un caso que publicó recientemente NYTIMES sobre «Inteligencia de Ubicación» o «Location Intelligence» para Nueva York tratando de explicar los beneficios de estas aplicaciones de analítica, haciendo énfasis en que no podemos dejar atrás el enfoque la privacidad de los datos de las personas.

Si quieres comprender cómo la ubicación le sirve al plan de marketing de un negocio también puedes leer: El secreto de tu negocio: Ubicación, ubicación y ubicación

¿Cómo funciona?

La «inteligencia de ubicación» es una técnica que aprovecha la generación de datos geo-referenciados, es decir datos que vienen acompañados de atributos como coordenadas o referencias geográficas para visualizar en mapas, que permite generar análisis dinámicos de muy alta resolución. Compañías como UBER y DIDI utilizan este tipo de datos para ubicar a sus transportes y usuarios dentro de su app. Pero por otro lado hay otras aplicaciones que venden datos de nuestras ubicaciones sin que necesariamente estemos enterados de cómo o cuándo obtienen estos datos.

Datlas_Promo_Facebook_Suscribe

Una aplicación, por ejemplo, genera datos nos debería de pedir permisos de ubicación cuando usas el app. En algunos casos, como Waze o UBER, no abre el app si no accedemos a dar este permiso y encender nuestro localizador GPS.

Datlas_comofunciona_

Mientras este abierta la aplicación o puede estar cerrada, pero con servicios de segundo plano, el APP estará registrando nuestros movimientos y ubicaciones en bases de datos que luego serán procesadas y comercializadas. El deber ser es que toda esta información se «anonimice» , es decir se borren identificaciones de personas que puedan ponerlos en riesgo. Sin embargo hay casos de estudio que han sacado a relucir que debido a este tipo de apps podemos ubicar a casi cualquier persona. Aqui un ejemplo de cómo «trackear» al presidente Donald Trump que realizó el NYTIMES

¿Cómo se aprovecha esta información?

El pase de diapositivas requiere JavaScript.

En las imágenes anteriores se comparte un ejemplo para NYC.  De compañías telefónicas y aplicaciones se integraron las ubicaciones durante una semana de los usuarios de un teléfono inteligente en NYC. Aunque de manera integrada no nos dicen mucho, es relevante saber que podemos aislar un punto en específico e identificar su recorrido.

Datlas_Promo_Youtube_Suscribe

En el caso de la nota particularmente se analizaron datos para Nueva York, sin embargo datos similares están disponibles para México ¿Dónde? … no está tan sencillo. Pero compartimos los logros de @sasha_trub que compartió estos mapas en Twitter con el fin de contrastar los usuarios de IPHONE contra los de ANDROID. Sin embargo cada punto es un usuario de celular que ha sido georeferenciado y podría ser localizado con más profundidad.

El pase de diapositivas requiere JavaScript.

Quién comercializa esta información

Al menos en el continente Americano las empresas con más presencia en el comercio de datos geo-referenciados de usuarios son estas 20:Datlas_logos_compañías

El gobierno de Estados Unidos ya está intentando «limitar» la venta al extranjero de este tipo de información, sobre todo la que utiliza aplicaciones de Inteligencia Artificial. Esto por temas de «seguridad nacional».

Por otro lado hay mucho generador independiente de aplicativos en facebook, google maps, instagram y otras redes sociales que mediante la habilitación de filtros o juegos obtienen datos de usuarios y se las venden a alguna de estas empresas.

Todos conectados, todos arriesgados

Datlas_smarthead

Para cerrar la columna, te recomendamos tomarte quince minutos para conocer el caso específico del NY TIME (puedes ver la liga al inicio de la columna) y también ser consciente de que la próxima ves que enciendas tu GPS alguien seguramente está registrando estos datos para lanzar alguna campaña de marketing o comercializarlos

Datlas_Promo_Podcast_Suscribe

¿Qué deberíamos hacer con esta situación? ¿Cómo garantizar que se anónimo y que haya una práctica correcta? Comenta y comparte.

Equipo Datlas

-Keep it weird-