San Valentin Geográfico para Nuevo León ¿Dónde hay más Casad@s y Solter@s? – Columna de Investigación DATLAS

Es día de San Valentin. Una festividad que, al menos en México , se celebra cada 14 de Febrero y nos hace recordar el amor en las parejas. Y aunque no solamente se tiene/debe expresar un día el año, es importante traer a la mesa su significado. Los Institutos estadísticos de los países, por reglas oficiales, cuantifican la cantidad de Población soltera, casada, separada y/ viuda en sus censos. En este blog tomaremos esas y otras estadísticas para compartir algunos hallazgos para el Estado Norteño de Nuevo León, México

Nuevo León es un Estado donde se cuantifican poco más de 5M de habitantes en sus zonas urbanas.  Particularmente en este Estado, en contraste con México en general, habitan más hombres que mujeres.

En cuanto a las estadísticas básicas, y cuando hablamos de personas de 12 y más años de edad, nos encontramos con que la mayoría de sus habitantes están Casados. Después la categoría de solteros y finalmente Separados y/o Viudos.

En términos comparables, y para el resto del ejercicio, usamos una base de 1000 habitantes para generar los siguientes indicadores:

556 personas por cada mil están casadas. 334 por cada mil están solteras y 110 por cada mil están viúdas o separadas

A Niveles Totales

Generamos una tabla de datos para 3 condiciones: Solteras, Casados y/o Separados-Viudos. En esta imagen el ordenamiento es por casados.

Top Municipios por Casados

Municipios a las afueras de la zona metropolitana es donde se excede por 100 personas, aproximadamente, el nivel a nivel Estatal de Población Casada.

Top Municipios por Solteras

Podemos «rankear» los municipios por orden de personas solteras. San Pedro y San Nicolás son las zonas con más solteros mayores de 12 años, según datos del CENSO INEGI 2020

Top Municipios por Separados y/o Viudos

Finalmente, de Separados y Viudos, algunas zonas también a las afueras de la ciudad

A nivel Suburbio (AGEB)

Top Suburbios por Población Casada

Top Suburbios por Población Soltera

Top Suburbios por Población Separada y/o Viuda

Para el cierre, revisamos la fuente «Exploding Topics» registramos que «autoamor» o «self-love» es de lo más revisado

Hasta aqui la columna de hoy . ¿Qué te parecieron las imágenes de nuestros mapas? ¿Ya ubicaste dónde dar serenata? Cuéntanos cómo la pasarás este día en nuestras redes @DatlasMX y si encuentras algún otro dato interesante

Equipo Datlas

– Keep it weird-

LAS 5 DE DATLAS EN EL TIANGUIS TURISTICO DE MÉRIDA: Analytics, exposición Glampling, Tendencias y Nuevo León- ECOSISTEMAS DATLAS

El fútbol tiene su mundial, la fórmula uno su carrera, las películas los óscares.. pero ¿El Turismo? Al menos en México uno de los eventos que convoca a toda la comunidad de expert@s de turismo es el TIANGUIS TURISTICO. Este gran evento convoca a todos los Estados de la República en un sólo espacio para buscar generar nuevas colaboraciones en esta industria que le aporta casi el 8% del PIB al país.

Desde Datlas tuvimos oportunidad de ser convocados por el Clúster de Turismo de Monterrey y Turismo Nuevo León para presentar un caso de éxito de colaboración de datos. En esta columna te contaremos la perspectiva de una startup en este gran evento y te compartiremos algunos aprendizajes.

1) Sobre la exposición

Un recinto de primer-mundo en el Centro de Convenciones s. XXI al Norte de Mérida. Que justo uno de los eventos con los que fue inaugurado fue este Tianguis. Con amplias salas para eventos, patios, una sala de cine propia (Que se utilizó para dar conferencias) y a un costado del asombroso MUSEO MAYA.

En el interior, cada Estado tenía su propio espacio donde lucía alguna caracterización junto con mesas de trabajo para la delegación de profesionales que la acompañaba.

2) Sobre analítica

Tuvimos oportunidad de compartir el proyecto de DASHA: Inteligencia Turística

En este proyecto colaborativo dimos una introducción al proyecto

Si quieres revisar la presentación la puedes consultar aqui

Y si quieres escuchar el audio de la charla está en el podcast Café de Datos

3) Glamping

Esta nueva tendencia de «camping» de lujo o con acceso a lugares exclusivos. Escucha qué tal opinan los expertos ¿Crees que esta tendencia crezca en tu ciudad próximamente?

4) Tendencias

Hablamos de Industria de Reuniones, entre muchas conferencias, asistimos a estas para acompañar a COMIR en sus actividades. Nos pareció interesante la perspectiva de ver a los eventos por ZOOM como un híbrido y/o complemento de los eventos de «carne y hueso».

5) Sobre la delegación de Nuevo León

Un gran equipo en colaboración y de trabajo se vivió durante los días del evento. Cada delegación llevaba a sus equipos, pero en Nuevo León se vio un espíritu de atracción a otras entidades y expertos de Turismo buscando experiencias como las de EcoTurismo, rutas homologadas y tecnología en Nuevo León.

Hasta aqui la columna de hoy ¿Cuáles crees que serán las tendencias de Turismo? Comparte tus comentarios en nuestras redes @DatlasMX . Recuerda suscribirte a datlasacademy.com para recibir tus cursos gratuitos sobre introducción a storytelling de datos y definición de KPIs.

Equipo Datlas

– Keep it weird –

AIRBNB En la zona metropolitana de Monterrey – DATLAS COLUMNA DE INVESTIGACIÓN

En Monterrey NL y su zona metropolitana cuenta con las condiciones necesarias para ser cede del turismo mundial, entre sus distintas empresas que promueven el turismo de negocios, sus grandes centros médicos que impulsan el turismo medico, así como los cientos de lugares y atractivos a visitar.

Todos estos visitantes a la sultana del norte tienen la misma necesidad, el hospedaje. Sin duda esta ciudad tiene cientos de hoteles distribuidos por toda la ciudad, pero una alternativa atractiva para miles de turistas es la de un Airbnb. Esta solución para hospedarse esta presente en la zona metropolitana y a continuación veremos algunos datos importantes que hemos encontrado analizando la oferta de esta compañía en la ciudad de Monterrey.

** También te puede interesar nuestro complemento a este análisis escrito en la columna de «Análisis de AIRBNB para México: Mérida Vs. Monterrey»

¿Cuántos Airbnb’s hay en la zona metropolitana de Monterrey?

Para finales del 2021 en Monterrey y su zona metropolitana se contabilizaron un total de 2,408 Airbnb’s. De todos los municipios de la zona metropolitana, si contabilizamos los alojamientos que hay en los municipios de: Monterrey, San Pedro, San Nicolás y Santa Catarina estos suman una cantidad de 2,189 o el 91% de todos los Airbnb’s.

¿Cuáles son los tipos de alojamiento y cual es la distribución?

Airbnb es famoso por tener una variedad enorme de tipos de alojamiento, desde un Ovni en el Reino Unido hasta una cueva en la cara de una colina en Francia1. Sin embargo, en Monterrey y su zona metropolitana los distintos tipos de alojamientos se pueden agrupar de manera sencilla en 4 grupos, los alojamientos enteros, las habitaciones privadas, las habitaciones competidas y los alojamientos distintos que podemos agrupar como otros.

** Te puede interesar nuestra columna de: «AIRBNB en CDMX»

¿Cuáles son los rangos de precios de Airbnb en la zona metropolitana de Monterrey?

Algunos datos que podemos encontrar a considerar los precios por noche de los alojamientos por municipio son la media del precio, así como el precio mas barato y mas caro.
La media mas alta la tiene el municipio de Santiago con $1,460, pero el precio mas alto por noche se encuentra en el municipio de Monterrey con $16,060.
El precio mas bajo de alojamientos por noche se encuentra por igual en $200 pesos en los municipios de Monterrey, San Pedro y Santa Catarina.

¿Cuál es la capacidad de huéspedes de Airbnb en la zona metropolitana de Monterrey?

Cada uno de los alojamientos de Airbnb tiene una capacidad de huéspedes distinta, sumando la capacidad en todos ellos en la zona metropolitana de Monterrey tenemos un total de 9,198 personas.

¿Cuál es da derrama económica de Airbnb en una noche en la zona metropolitana de Monterrey?

Suponiendo una ocupación del 100% en los alojamientos de Airbnb de la zona metropolitana, para noviembre del 2021, la derrama económica por noche seria de $3,139,120 pesos.
Con la distribución por municipio de la siguiente manera:

¿Cómo utilizar el mapa?

Por tiempo limitado, hasta el 1ero de Diciembre del 2021. ACTIVA TU CUENTA EN www.datlas.mx/register y solicita escribiendo a direccion@datlas.mx tu acceso a la plataforma

**Te puede interesar «DASHA: El Dashboard de Turismo con información para Nuevo León»

Conclusiones

Los Airbnb en la zona metropolitana de Monterrey son importantes para la derrama económica de la ciudad, estos no solo tienen una aportación directa, sino que son parte importante de la derrama indirecta, al facilitar que distintos tipos de turistas visiten la ciudad y disfruten de la amplia variedad de actividades que hay que disfrutar.

Equipo Datlas

– Keep it weird-

Fuentes

1.- https://www.dwell.com/article/unique-airbnb-fund-weirdest-home-rentals-e665f737

Análisis de AIRBNB para México 2021: Monterrey Vs. Mérida – Columna de Investigación Datlas

Hace unos días fue la temporada de PALNORTE 2021 , un festival de música celebrado en el PARQUE FUNDIDORA en Monterrey, Nuevo León. Asistieron bandas como TAME IMPALA; FOO FIGHTERS; BABASONICOS; EL TRI; CLAPTONE; Entre otros. Desde el 2018 que, por la pandemia COVID-19, la reactivación de este festival que se realiza todos los años fue una señal de recuperación turística para la ciudad. De hecho, el hospedaje en la ciudad llega a saturarse. Esto específicamente en zonas aledañas al parque donde se celebra el evento. Es donde complementos de hospedaje como AIRBNB comienzan a presentar un beneficio para los turísticas.

Por otro lado, la semana que viene se celebrará en la ciudad de Mérida, Yucatán un gran evento, también señal de recuperación de la pandemia y que había sido pospuesto, el cuál lleva por nombre TIANGUIS TURISTICO. El marco de este evento es centralizar a l@s principales jugadores de la industria turística Nacional en un sólo lugar. Si uno trata de reservar hospedaje en la ciudad se encontrará con algunas dificultades. De la misma manera, AIRBNB resulta un complemento para la experiencia de algunos turístas.

En esta columna presentamos un breve análisis de alojamientos de AIRBNB en ambas ciudades con el objetivo de presentar un ejemplo de investigación y el impacto de esta alternativa de hospedaje.

** Te puede interesar nuestra columna de: «AIRBNB el nuevo negocio inmobiliario de los regios»

¿Cuántos AIRBNB hay en cada ciudad?

De acuerdo a los datos obtenidos en sitios como INSIDER AIRBNB y similares los conteos dicen que Mérida cuenta con más alojamientos de AIRBNB que Monterrey Zona Metropolitana. Así mismo los niveles de precio promedio son mayores en Monterrey ZMM que en Mérida. Sin embargo, el tamaño de la capacidad de huéspedes es mayor en Mérida.

El contraste entre Mérida (Izquierda) y Monterrey (Derecha) por ubicación

Y

¿Cuáles son los niveles de precios de estos AIRBNB?

Generamos categorías de precios (En dólares: USD) para contar con variables categóricas en los mapas. Las distribuciones son sorprendentemente parecidas.

¿Cuáles son los niveles de capacidad de alojamientos en huéspedes de AIRBNB?

Por otro lado, existen contrastes importantes en cuanto al tamaño de huéspedes.

** Te puede interesar nuestra columna de: «AIRBNB en CDMX»

¿Los niveles van de acuerdo a los tamaños?

El 36% del total alojamientos de AIRBNB en Mérida y Monterrey son de menos de 3 huéspedes y menos de $38 dólares ó aproximadamente $800 pesos mexicanos. Otras dispersiones se pueden encontrar en estas tablas.

¿Qué ciudad generaría más ingreso de AIRBNB si una noche estuvieran el 100% ocupados?

Para Monterrey, el dato se estimaría con 2,470 alojamientos a un precio promedio de $72,3 dólares tendríamos un monto total de $178,560 USD. O en pesos MXN , aproximadamente $3,749,762.3 MXN.

Por el lado de Mérida, estimaríamos con 3,417 a un precio promedio de $64 dólares tendríamos un monto de $219,165 USD. En pesos MXN serían aproximadamente $4,602,469.1 MXN.

¿Cómo utilizar el mapa?

Por tiempo limitado, hasta el 1ero de Diciembre del 2021

ACTIVA TU CUENTA EN www.datlas.mx/register y solicita escribiendo a direccion@datlas.mx tu acceso a la plataforma

**Te puede interesar «DASHA: El Dashboard de Turismo con información para Nuevo León»

Y tú ¿Has usado AIRBNB? ¿Qué opina del complemento y los impactos económicos?

Cuéntanos tu respuesta en nuestras redes. También, si quieres conocer más del TIANGUIS TURISTICO, de nuestras plataformas de inteligencia para información turística o de analítica de datos te recomendamos seguirnos en redes @DATLASMX.

Equipo Datlas

– Keep it weird-

¿PODRÍAS SER más propenso a chocar que otra persona SÓLO POR TU MODELO DE AUTO? La respuesta puede ser «sí» – DATLAS INVESTIGACIONES

El análisis de datos ha ido adquiriendo mucha importancia últimamente, sabemos que es una ciencia que se encarga de analizar un respectivo conjunto o conjuntos de datos para obtener conclusiones de los mismos y así tomar decisiones o simplemente obtener nuevos conocimientos. En esta columna presentamos un ejercicio complementario de análisis de datos. Esto sobre una base de datos de choques y siniestros para Nuevo León. Te presentamos nuestros hallazgos.

** También te podría interesar nuestras otras columnas sobre choques y siniestros

Big Data y Data Science: los profesionales especializados en ciencias de  datos tienen el futuro asegurado

En esta ocasión se usará una base de datos que recopila los choques de la zona metropolitana de Monterrey, Nuevo León desde el año 2016 hasta la mitad del 2018. Gracias al análisis podremos observar los diferentes fenómenos que se presentan.

La base de datos contiene los registros ya mencionados, cada registro contiene diferentes columnas, podemos dividir estas columnas en tres secciones que definen cada aspecto del choque:

1) La primera sería el lugar del suceso,

2) La segunda sería la descripción del mismo y

3) La tercera es la fecha/hora cuando ocurrió.

Ahora bien, con estos datos vamos a contestar algunas preguntas.

¿En qué códigos postales de la ciudad de Monterrey, Nuevo León y Zona metropolitana (ZMM) se generan más choques?

Para fines prácticos, se tomaron de la tabla los diez códigos postales donde hubo más choques, esto considerando su respectiva frecuencia de ocurrencias con respecto al total. Los resultados se mostrarán a continuación.

Top 10 códigos postales con más choques:

  1. 64000
  2. 64620
  3. 64590
  4. 64330
  5. 64619
  6. 64200
  7. 64988
  8. 64460
  9. 64710
  10. 64700

Para un mejor entendimiento se relacionó cada código postal con el nombre de la colonia. Estas son las colonias donde hay más percances del área metropolitana.

Top 10 colonias con más choques:

  1. Col. Centro
  2. Col. Vista Hermosa
  3. Col. Agrícola
  4. Col. Gral. Naranjo
  5. Col. Residencial Cumbres
  6. Col. Croc
  7. Col. El Milagro
  8. Col. Mitras Centro
  9. Col. Nuevas Colonias
  10. Col. Nuevo Repueblo
Mapa Monterrey, N.L. Colonias con más choques.

Si andas por estas colonias te recomiendo que vayas con mucha precaución detrás del volante.

¿A qué hora ocurren más choques en Monterrey (ZMM) ?

Pienso que esta es una de las preguntas más importantes a considerar ya que si vives en Monterrey sabrás de la cantidad de tráfico que se genera a las horas pico, veremos si existe una relación entre los choques y las horas de más tráfico.

Formato 24hrs.

Las horas que destacan son: 14:00, 13:00, 16:00, 18:00, 15:00. Podemos notar que los choques están relacionados con el tráfico, y el tráfico a su vez se genera principalmente debido a las «horas de trabajo», claramente podemos observar la “hora de entrada”, la de “hora de comida” y la “hora de salida” que son los tiempos en donde hay más personas manejando.

¿Qué días de la semana suceden más choques en Monterrey(ZMM) ?

Formato 24hrs. Empezando por día domingo y terminando el sábado.

Empezando por el domingo en este caso, se puede notar cómo es que los choques varían dependiendo del día, siendo el “viernes” cuando ocurren más siniestros y el “domingo” el día que menos. Otro fenómeno curioso que podemos observar es que durante los sábados en la noche la cifra de choques aumenta considerablemente en comparación a los demás días, es entendible, la gente se va de fiesta, toma alcohol u otras sustancias, acto siguiente escoge manejar y lamentablemente choca. 

¿Algún color de auto es más propenso a chocar?

La respuesta corta es “sí”, existen autos que son más propensos a chocar que otros por su color, esto quizá se deba a que durante el día o la noche son más difíciles de observar para los conductores, otro factor puede ser que la mayoría de los autos que circulan son de ciertos colores «populares» y por ende tienen esas estadísticas.

Puede parecer broma, pero tomando en cuenta todo esto, en dado caso de que te encuentres manejando un carro gris o blanco un viernes por la tarde en el centro de Monterrey, estadísticamente tienes una gran probabilidad de chocar.

– Equipo Datlas –

¿Qué se puede decir de todo esto?

“Nuevo León, la entidad con mayor registro de choques en el país” – El financiero

“Falta cultura vial…y abundan choques” –El Norte

Estos solo son dos ejemplos de los miles que se pueden encontrar en cuanto a notas periodísticas donde mencionan nada más que la verdad. Nuevo León es en efecto la entidad del país con el mayor número de choques, esto se puede comprobar observando las bases de datos del INEGI o simplemente visualizando las gráficas que ya tienen disponibles en su página. No hace falta ser muy meticuloso con los datos para darnos cuenta de esto, solo basta con salir a manejar en horas pico para que uno se dé cuenta de lo pésima que es esta situación, no es de sorprenderse que seamos la zona metropolitana con mayor número de choques.

Finalmente, si multiplicamos las probabilidades de cada dato podemos llegar a una conclusión un poco chistosa pero cierta, si tú decides salir a manejar un automóvil de color blanco, un viernes por la tarde en el centro de la ciudad de Monterrey, estadísticamente tienes mayor probabilidad de chocar que cualquier otro conductor.

Ándate con cuidado si tienes un auto blanco y te gusta salir los viernes.

Lectores recuerden suscribirse en www.datlasacademy.com para obtener cursos gratuitos sobre métodos y conceptos de transformación digital. Para las y los primeros suscriptores habrá un curso de «Storytelling de Datos» de obsequio. No se lo pierdan.

Equipo Datlas –

análisis de la presencia de cámaras cctv en el mundo (monterrey, cdmx y guadalajara vs. el top10 global)

¿La reducción justifica la invasión a nuestra privacidad como ciudadanos? Es una pregunta que cae un poco en lo filosófico, pero también en lo técnico cuando analizamos los efectos de la intervención de la tecnología en la vida de las personas. En esta ocasión hacemos un breve análisis de la publicación original de «VisualCapitalist» con datos de «SurfShark» sobre las cámaras en el mundo.

Qué es una Cámara CCTV

Un CCTV o circuito cerrado de televisión es una instalación de equipos conectados que generan un circuito de imágenes que solo puede ser visto por un grupo determinado de personas, estas se personalizan para adaptarse a las necesidades de cada cliente bien sean orientadas a la seguridad, vigilancia o mejora de servicio. (Tomado de IMSEL)

Desde 1942, en Alemania, donde se tienen registros de la instalación de las primeras cámaras de videovigilancia al día de hoy se identifican cerca de un billón de este tipo de equipos en el mundo.

Los sistemas de CCTV se han convertido en un apoyo fundamental en la prevención y control de pérdida y riesgos, al igual que la supervisión para mejora de la efectividad de las empresas y otro tipo de organizaciones

Algunos gobiernos de países, como China, han integrado aplicaciones de Inteligencia Artificial a sistemas de CCTV para identificar de manera más rápida a delincuentes, vehículos que mercen multas o gente que se ha reportado como perdida. Puedes ver este video para conocer mejor el sistema de «tracking».

TOP 10 Global en instalaciones de CCTV

Similar a China, otros países como la India e Inglaterra han invertido en desarrollar poderosos sistemas de videovigilancia para su ciudad.

Los motivos, por un lado, resulta más «barato» instalar cámaras que contratar la cantidad de oficiales necesarios para completar la cobertura de grandes ciudades como Londres. Por otro lado es más eficientes, las cámaras y los sistemas de IA integrados no tienen dependencias de agotamiento. No se distraen y cumplen con el objetivo para el que fueron programado… reportar delincuencia o registrar gente que está pasando.

Por otro lado, los CCTV son sistemas fijos. Es decir, una vez instaladas a lo mucho pueden cambiar de ángulo, pero el ángulo de enfoque es limitado.

Un ejemplo más práctico puede se visto aqui (Cámara web online abierta y en vivo del Zócalo en CDMX Mexico City):

También te puede interesar «Estudiando cifras de Homicidios publicadas por el INEGI para México»

CCTV en México (país)

CCTV en Monterrey, Nuevo León

Se registran alrededor de 4,000 cámaras CCTV para el 2020. Por kilómetro cuadrado encontramos 4.18. Bastante menos en relación a lo que una ciudad como Beijing podría tener, 278 cámaras. Finalmente el índice de crimen estandarizado para Monterrey es de 49.29 y en Beijing sería de 34.27. Con esta tabla se podría decir que a mayor número de cámaras por kilómetro cuadrado menor sería el índice de crimen. Pero esta relación no podría ser concluyente hasta hacer un análisis longitudinal.

CCTV en Guadalajara, Jalisco

En relación a Monterey, la ciudad de Guadalajara tiene 6 veces más cámaras de videovigilancia. Por kilómetro cuadrado incrementa de 4 a 170 cámaras por kilómetro cuadrado. Aún así, el índice de criminalidad es mayor en Guadalajara que en Monterrey según SurfShark.

CCTV en CDMX

Finalmente, en México país, la CDMX es la región con más cámaras llegando a la cifra de 87,000. Por kilómetro cuadrado tiene 59 cámaras (Menos que Guadalajara, pero más que Monterrey). Aún con estas cifras el índice de crimen es mayor.

Si te interesa conocer más de la relación de vigilancia , análisis de datos y crimen te recomendamos escuchar nuestro podcast «Café de Datos» capítulo ¿Cómo analizar datos de delitos para proteger tu negocio?

Cierre

En México, como en otros países de LATAM, más cámaras en sistema CCTV con centros de monitoreos como los famosos «C4» ó «C5» podrían tener impactos positivos en la seguridad de una delegación, suburbio o municipio. En el futuro, los sistemas de inteligencia artificial que se apoyan en CCTV se irán sofisticando al grado de poder identificar personas de manera ágil mediante cámaras y otro tipo de aplicativos presentados en esta columna.

Sin embargo, si no cuidamos o nos aseguramos que se haga un correcto uso de estas tecnologías podemos caer en un «sobre-control» de los sistemas de videovigilancia sobre la población. La invasión a la privacidad es una situación que se contrapone a la seguridad cuando lo interpretamos desde estas aplicaciones del CCTV

Fuentes

– Fuente: https://embed.neomam.com/surveillance-cities/interactive.html

– Ciudades más videovigiladas. Fuente: https://www.visualcapitalist.com/mapped-the-top-surveillance-cities-worldwide/

– Qué es una CCTV. Fuente: https://www.imsel.com/que-es-cctv-y-cual-es-su-funcion/

¿Cómo calcular LAS HORAS DE LUZ SOLAR EN CUALQUIER PARTE DEL MUNDO? cASO APLICADO CON R – Manual datlas

El estudio de energías alternativas y luz solar han sido temas de prioridad durante los últimos 10 años en Latinoamérica. Se ha incrementado cada vez más la conciencia de lo contaminante que pueden ser las fuentes de energías fósiles. Y en ese sentido el estudio de luz solar y el interés por sus aplicaciones ha ido a la alza. En esta columna compartiremos un método en R para poder obtener información de luz solar en cualquier parte del mundo utilizando la paquetería suncalc.

¿Cómo empezar?

El ejercicio que haremos será en el lenguaje de R. Es una iniciativa de software libre muy utilizada para analítica y ciencia de datos. Una combinación recomendada es utilizar R junto con el IDE de R Studio para poder tener una plataforma de trabajo más cómoda y ordenada.

¿Qué paqueterías utilizar?

R es un lenguaje que tiene una base de funciones en CRAN, su base, que se pueden utilizar y en automático ya vienen precargados al momento que descargas R. En complemento, sistemas como R permiten la instalación de librerías externas desarrolladas por la comunidad que permiten ampliar las capacidades del mismo. Las librerías que vamos a utilizar para este ejercicio son:

library(suncalc)
library(tidyverse)
library(scales)

También te puede interesar «Análisis de discurso de AMLO con NLP en R»

¿Cómo identificar las zonas horarias?

Las zonas horarias serán importantes para el ejercicio. En la herramienta suncalc.org puedes identificar la zona horaria de cualquier ubicación del mundo. En el buscador, para este ejemplo, ubicamos San Pedro Garza García, en el Estado de Nuevo León en México.

Lo podemos declarar en nuestro código como lo siguiente:

names <- «San Pedro Garza Garcia (México)»
lat <-25.6510566
lon <- -100.4025978

¿Cómo generar la consulta para calcular la hora de amanecer y anochecer?

El código es la siguiente, hay que declarar primero las fechas que estamos considerando para la métrica , después estructurar la tabla reporte de respuesta que en este caso tiene el amanecer, el horario en que termina el amanecer, puesta del sol y la hora a la que comienza. También incluye la declaración de la latitud y la longitud, en este caso como variables que declaramos previamente. Y finalmente el «timezone» o la zona horaria que encontramos en el sitio web referenciado

df <-
getSunlightTimes(
date = seq.Date(as.Date(«2018-12-01»), as.Date(«2019-12-31»), by = 1),
keep = c(«sunrise», «sunriseEnd», «sunset», «sunsetStart»),
lat = lat,
lon = lon,
tz = «America/Monterrey»

El reporte lo podemos consultar el reporte. Para esto podemos revisar las primeras filas con: head(df)

¿Cómo calcular las horas de luz en una ubicación determinada?

Para calcular las horas de luz, el código es más complejo, pero tiene que ver con una particularidad del sistema para manejar los horarios.

df %>%
mutate(
date = as.POSIXct(date),
day_length = as.numeric(sunset – sunrise)
) %>%
ggplot(aes(x = date, y = day_length)) +
geom_area(fill = «#FDE725FF», alpha = .4) +
geom_line(color = «#525252») +
scale_x_datetime(
expand = c(0, 0),
labels = date_format(«%b ‘%y»),
breaks = seq(as.POSIXct(min(df$date)), as.POSIXct(max(df$date)), «month»),
minor_breaks = NULL
) +
scale_y_continuous(
limits = c(0, 24),
breaks = seq(0, 24, 2),
expand = c(0, 0),
minor_breaks = NULL
) +
labs(x = «Date», y = «Hours», title = names) +
theme_bw()

Finalmente , podemos observar los resultados en un gráfico como los siguientes.

En contraste, si lo ponemos en comparación contra Oslo Noruega, digamos que San Pedro GG tiene mucho mayor luz solar que otros.

¿Qué podría suceder al futuro?

Futuros análisis de datos nos podrán apoyar a identificar, por ejemplo, la potencial captación de luz para un edificio. O, en el caso de negocios que tienen una dependencia con la luz solar, tener una mayor predictibilidad de sus oportunidades comerciales.

¿Qué otras aplicaciones piensas que pueden funcionar? Cuéntanos en @DatlasMX . Hasta aquí la columna de hoy, esperamos la puedas compartir con tus colegas y personas que les pueda interesar

Fuentes:

Ciencia de datos para todos : ¿Cómo ha cambiado la movilidad de los usuarios de Twitter en Monterrey por el covid-19?

“Twitter es lo qué está pasando en el mundo y sobre lo que las personas están hablando en este momento.”

Las redes sociales son relativamente nuevas y han cobrado importancia en nuestra vida cotidiana al grado que no nos sentimos cómodos si vamos a un restaurante y no publicamos en Instagram lo que ordenamos para que nuestros amigos se enteren donde estuvimos y que hacíamos ahí o por ejemplo cuando por la mañana nos levantamos a hacer ejercicio y es imposible no publicar nuestra foto en lo más alto de la montaña.

Es por eso que el análisis de las interacciones en las redes sociales ha cobrado la misma importancia, para muchos negocios, que las redes sociales en nuestras vidas. Por ejemplo, para saber de qué se está hablando de nuestra marca, si es algo positivo o negativo y cuantificarlo. Estos enfoques son muy bien conocidos en el área de análisis de textos.

Sin embargo, el día de hoy nuestro enfoque tomara otro rumbo. Responderemos a dos preguntas fundamentales: ¿Cómo ha sido el comportamiento de los usuarios en los últimos meses?  Y ¿Cómo ha cambiado por el covid-19?  

*También te puede interesar un estudio similar para Jalisco o CDMX

Desarrollo

Con una base de datos de alrededor 7200 check-in’s (el registro de una persona en cierto lugar), más de 15 variables (fecha y hora, lugar donde se hizo el registro, municipio de residencia, usuario, ubicación exacta, entre otras) y algo de trabajo se pueden generar diversos insigths de valor.

Pero antes de llegar a esos insigths de valor hay camino por recorrer. La primera pregunta en cuestión es: ¿Cómo conseguir este tipo de información en un sitio web tan protegida como lo es Twitter?

No hay forma de conseguir esta información si no es mediante la API (Application Programming Interface) de Twitter. La API cumple la función de una interfaz para que dos softwares interactúen y puedan intercambiar información. Para tu poder hacer un request desde tu computadora (Con programas como Python y R) y acceder a este tipo de información debes llenar una solicitud, una vez aprobada la solicitud Twitter te hará llegar las API keys, el identificador que te autentica como usuario de las API. Para más información clic aquí.

 

Una vez obtenido la información sigue la fase de trabajar los datos para posteriormente pasar a la fase de análisis. Nos referimos a la fase de homologar ciertas variables o categorizar observaciones en función de valores que toman algunas variables, en nuestro caso categorizamos los lugares a donde las personas han asistido los últimos meses. Otro ejemplo de esta fase es poner las fechas en un mismo formato (año/mes/día o día/mes/año) para no tener problemas al momento de visualizar los datos en una línea de tiempo.

Datlas_Promo_Facebook_Suscribe

 

Ahora si el plato fuerte, el análisis. Aquí empezamos viendo la estructura y distribución de cada una de nuestras variables, y modificar en caso de que algo este fuera de lugar, por ejemplo, las variables categóricas cambiarlas a factores si están como texto. Una gran parte del análisis es el momento de crear visualizaciones, esta es la parte creativa del analista porque ahora si que los límites para crear visualizaciones son muy extensos, claro, siempre con el cuidado de generar buenas visualizaciones no únicamente en el sentido de que se vean bonitas sino que también transmitan un mensaje claro y único. Otra gran parte del análisis es crear modelos estadísticos que expliquen a una variable (variable dependiente «y») en función de otras variables (variables independientes «x») y/o ayuden a predecir el comportamiento de la variable en el futuro.

Finalmente, llegamos a la etapa de conclusión y exposición de resultados, básicamente es ver el contraste entre la hipótesis que te hayas planteado o la pregunta que quieres responder y lo que los datos te dicen para después plasmarlo en una presentación o un texto.

Todas estas etapas aunque se escuchen muy «básicas» realmente las llevamos a cabo en nuestro análisis y es por eso que nos pareció importante no sólo exponer los resultados sino todo el desarrollo para que el lector que no este tan familiarizado en este ámbito pueda tener una mejor comprensión y no solo eso sino que se lleve un verdadero aprendizaje .

¿Qué encontramos?

Antes de empezar con las visualizaciones es importante mencionar que las primeras medidas preventivas en Nuevo León tomaron lugar el 17 de marzo del 2020, el día que cancelaron actividades escolares a nivel bachillerato y superior, y posteriormente el día 20 del mismo mes en los niveles básicos (primaria y secundaria).

La primera incógnita que nos gustaría responder es : ¿En qué magnitud o proporción ha disminuido el tráfico de check-ins en Twitter una vez iniciadas las medidas preventivas covid-19?

Esta gráfica ordena los días de la semana por mes, cada color es una etapa diferente: diciembre-2019 (azul) , antes de prevención covid (verde) y una vez iniciada la etapa de prevención covid (rojo).
Esta gráfica ordena los días de la semana y nos ayuda a visualizar la proporción de check-ins realizados en cada etapa.

 

 

Para poder crear estas visualizaciones tuvimos que categorizar nuestros datos en tres grupos (diciembre-2019, Antes de prevención covid y Después de prevención covid). En las dos gráficas se aprecia una caída significativa en los check-ins registrados una vez iniciadas las prevenciones covid. Se podría argumentar que esto se debe a la naturaleza de los meses abril, mayo y junio, sin embargo, llama mucho la atención que la primera mitad de marzo tenga mucha actividad y la segunda mitad se vea estancada. Hablando más puntualmente los chek-ins tuvieron una disminución del 75%.

Datlas_Promo_Podcast_Suscribe

 

Otra visualización que hicimos fue una especie de heatmap que nos permitiera ver por mes cuales fueron los municipios del área metropolitana con mayor actividad y en este sentido ver que municipios menos siguieron las recomendaciones de los expertos.

Heatmap de actividad por municipio y mes. No se estandarizo para numero de check-ins por habitante.

Ahora, pasaremos a contestar la pregunta ¿Cómo ha cambiado el comportamiento de los check-ins durante el covid? Para responder esta pregunta hicimos un cluster de 17 grupos y visualizamos la proporción de check-ins para cada grupo. Algunos de los grupos son: comida (restaurantes), entretenimiento (cines, boliches, parques, etc), Salud (hospitales, clínicas y gimnasios), Autoservicio (tiendas de autoservicio como H-E-B y Walmart), residencial (zonas residenciales), etc.

Proporción y orden de los grupos en las diferentes etapas de la contingencia. Comparativa de tipo de lugar donde la gente hace check-ins por etapa.

Podemos observar que en las primeras dos gráficas el orden y proporción de los grupos son muy parecidos y esto cambia considerablemente para la tercera. Dos grupos que han cobraron mucha importancia durante el tiempo de la pandemia son autoservicio y residencial, por otra parte, los grupos de entretenimiento, vida nocturna y aeropuerto pasaron de ser primeros a últimos. Considerar todos los ángulos a la hora de hacer un análisis es muy importante porque si no nos detuviéramos a ver a donde realmente la gente ha acudido y solo hubiéramos analizado las primeras tres gráficas probablemente nos quedaríamos con una mala impresión de los municipios de Monterrey y San Nicolás que han sido los municipios con mayor actividad y precisamente con esta gráfica podemos ver que mucha de esa actividad es desde sus casas.

Datlas_Promo_Youtube_Suscribe

Por último ¿qué podemos decir de estos resultados? Tenemos información suficiente para decir que la pandemia ha cambiado la manera en la que las personas hacen check-ins en magnitud y forma. En su mayoría la gente se está quedando en casa y está asistiendo primordialmente a lugares de primera necesidad como tiendas de autoservicio donde surten la despensa y restaurantes, no obstante, se sigue asistiendo a lugares que probablemente no se consideren de primera necesidad como ir al aeropuerto para ir a vacacionar y asistir a hoteles, donde, probablemente hoy sean los lugares con mayor riesgo de contagio y es por eso que invitamos a todos nuestros lectores a seguir las indicaciones de los expertos y no salir de casa a menos que sea necesario.

Esta columna fue desarrollada por Alejandro Rodalgo,  participante del programa de «intern» de Datlas en investigación. 

Saludos

Equipo Datlas

¿Qué es el “Crowdmapping”? – COLUMNA DE INVESTIGACIÓN DATLAS

Si nunca habían escuchado hablar del “crowdmapping” o el “mapeo colaborativo” entonces este artículo les explicara un poco más sobre ellos. El crowdmapping se refiere a un tipo de mapeo donde el conjunto de aportes proveniente de varios usuarios es mostrado en tiempo real. Estos mapas tienen diversos fines, desde mejorar las redes de transporte en una ciudad hasta ayudar al prójimo durante catástrofes naturales o conflictos humanitarios. Generalmente, cualquier persona puede tener acceso a editar o actualizar información geográfica en un “crowdmap”; esto con el fin de hacer la información más abierta, democrática, transparente, y actual. A continuación les explicaré un poco más sobre cómo se popularizaron este tipo de mapas, algunos ejemplos de usos actuales y donde encontrarlos, y algunos retos al que se enfrenta este tipo de tecnología.

Datlas_Blog_Promo_SuscriberFree

El término crowdmapping se popularizó después del 2008 cuando la aplicación móvil Ushahidi fue creada en respuesta a la violencia post-electoral en Kenya. La aplicación usaba voluntarios para mapear información proveniente de fuentes que variaban desde reportes de ONU, hasta tweets y mensajes de texto. Desde entonces, este tipo de mapas se ha popularizado para su uso en emergencias similares, como desastres naturales, crisis políticas, conflictos violentos o propagación de enfermedades. En México por ejemplo recientemente se ha usado esta tecnología durante los sismos recientes y para mapear incidentes de narco-violencia. Sin embargo, es importante notar que el crowdmapping no está restringido únicamente al mapeo de situaciones de riesgo.

Los usos del crowdmapping van más allá de las catástrofes. OpenStreetMap (OSM) es un proyecto de mapeo colaborativo del mundo donde el objetivo es mapear y actualizar los datos sobre caminos y otras cosas alrededor del mundo. Aunque no parezca que Google Maps ya tiene todo el mundo mapeado, existen muchos lugares que aún faltan de mapear o que la información mapeada existente no es la actual, incluso en nuestras propias ciudades.

Datlas_Promo_Facebook_Suscribe

Comúnmente vemos ejemplos de esto en asentamientos informales de las grandes ciudades (como los “slums” o “favelas”) al igual que en localidades remotas o simplemente lugares con caminos que fueron creados muy recientemente. OpenStreetMap al igual que otras plataformas atenta resolver este problema, incluso Google en veces dispone este tipo de colaboración abierta para algunos de sus mapas. Otro ejemplo interesante de mapeo colaborativo es en el uso de las redes de transporte en una ciudad. La aplicación de transporte Moovit invita a sus usuarios a colaborar mejorando los datos de transporte en las más de 2200 ciudades dentro de 80 países donde opera. Existen este tipo de plataformas para varios nichos, algunos ejemplos interesantes son: Harassmap, Anti-Eviction Mapping Project, y FixMyStreet. Aquí en México existen plataformas como Tehuan la cual actualmente opera en Monterrey y Puebla invitando a sus usuarios a mapear cosas como incidentes en las vialidades, delitos, y problemas de alumbramiento (entre otras).

Al desarrollarse la tecnología para traer a las ciudades a los vehículos autónomos, también es muy importante mapear las calles de las ciudades en otra dimensión. Actualmente ya existen algunas startups que pagan a usuarios por mapear ciudades en la tercera dimensión. Pixtier es una startup israelí que paga a dueños de drones por usar sus drones para fotografiar ciudades y después ellos usan un software para convertir estas imágenes en 3D. Otra startup de San Francisco, Mapper, ha creado un instrumento que permite el mapeo 3D sin tener que utilizar la tecnología LIDAR.

Datlas_Promo_Podcast_Suscribe

Esta empresa después vende este instrumento a usuarios a quien después les paga por mapear ciudades en sus propios vehículos (después de instalar el aparato encima de ellos). La startup surgió debido a que a las empresas que desarrollaban vehículos autónomos se les hacía muy fastidioso generar y crear estos mapas ellos mismos, sin embargo estos mapas son esenciales para que este tipo de vehículos opere. Ahora Mapper intenta promoverse como el nuevo Uber en el sentido de que es la nueva forma de monetizar tu propio vehículo.


A pesar de todas las soluciones que puede proporcionar el crowdmapping obviamente al ser un concepto tan democrático y tan abierto existen varias cuestiones con respecto a la calidad de la información y los datos que son generados. Entre menos control exista sobre los datos que son publicados a los mapas y más abiertos sean, obviamente la calidad y veracidad de los datos va a ser perjudicada. Mantener controles de calidad robustos en si es un costo significativo que se incurre al operar estas plataformas y este es solo un costo de más que se suma a los costos de mantenimiento. Debido a que muchas de estas plataformas no son con fines de lucro o no tienen un modelo comercial viable establecido, el costo en si es otro problema notorio para el crowdmapping. También existe el hecho de que en veces ha resultado difícil atraer la participación de usuarios a algunos mapas, naturalmente al ser un concepto un poco nuevo. Ejemplos de mapas colaborativos actuales son numerosas y en este artículo no se alcanzan a cubrir todas. Sin embargo, algunos obstáculos han prevenido a que algunas de estos esfuerzos de crowdmapping sean tan exitosos como lo planeaban, pero comoquiera es una tecnología que permanece evolucionando hacia la mejoría.

cropped-banner-web-2.0-6.png

Referencias:

Llegó la hora – Datlas en Talent Land 2018

*Actualizado*

Datlas_barra_suscribir

Gracias a los allí presentes, ha sido un éxito. Subiremos la presentación y un blog de toda la experiencia #TalentLand muy pronto.

Síguelo en vivo en:

http://talent-channel.com/escenario-talent-startup/

Igual que el año pasado en Campus Party Jalisco o en INCMTY; este año comenzamos nuestras conferencias en Talent Land 2018 Jalisco. Este magno evento reune poco más de 30 mil asistentes del 2 al 6 de abril en la Expo Guadalajara en una fiesta de talento, desarrollo y vinculación.

El pase de diapositivas requiere JavaScript.

Este año participamos con la exposición «Big Data para convertir tus datos en dinero» que se llevará acabo el Miércoles 4 de abril de 2018 a las 15:00 en el escenario Startup.

Datlas_barra_suscribir

¿Te interesa asistir?, inscríbete aqui: http://sched.co/DXRv

Talent_land_datlasbrief

Agradecemos a los más de 250 inscritos al momento. Estaremos compartiendo la transmisión en tiempo real esperando compartir muchísimos consejos de alto valor.

También estaremos obsequiando nuestro #DataPlaybook a los asistentes.

Saludos

Equipo Datlas