Discrepancia de poblaciones entre INEGI y CONAPO (Caso Mexicano) – Columna de Investigación Datlas

Introducción

En México, el Instituto Nacional de Estadística y Geografía (INEGI) realiza el Censo de Población y Vivienda cada 10 años. Dicho censo, tiene como propósito producir información sobre el volumen, la estructura y la distribución espacial de la población, así como de sus principales características demográficas, socioeconómicas y culturales; además de obtener la cuenta de las viviendas y sus características tales como los materiales de construcción, servicios y equipamiento, entre otros. Al cumplir con el principio de universalidad, cuenta a todas las personas residentes habituales de las viviendas en el territorio nacional, además, incluye al personal del Servicio Exterior Mexicano que realiza sus funciones en el extranjero, a la población sin vivienda y a la que reside en viviendas colectivas.

Los censos son esenciales para la implementación y evaluación de las políticas públicas, su información es útil para la toma de decisiones en diferentes sectores: autoridades de los tres órdenes de gobierno, población en general, académicos, organizaciones de la sociedad civil y del sector privado.

Para registrar a la población que reside en México y las viviendas donde habitan, se utilizaron, principalmente, los cuestionarios Básico y Ampliado.El Cuestionario Básico se utilizó para realizar la enumeración exhaustiva de la población y las viviendas habitadas, de las personas que residen en viviendas colectivas, de la población sin vivienda y del personal del Servicio Exterior Mexicano. Los datos e indicadores que se generen a partir de este Cuestionario se podrán producir para los niveles:

  • Nacional
  • Entidad Federativa
  • Municipio o demarcación territorial
  • Localidad
  • AGEB
  • Manzana urbana

** Te puede interesar: Que es un GeoHash y para que sirve?

Por otro lado, está el Consejo Nacional de Población (CONAPO), que es la instancia gubernamental mexicana que tiene por objeto el diseño, operación y evaluación de las iniciativas públicas destinadas a regular el crecimiento de la población, los movimientos demográficos, así como la distribución de los habitantes de México en el territorio. El propósito de esta misión es favorecer las condiciones de igualdad de los mexicanos y la planificación de la dinámica demográfica en el país.

A diferencia del INEGI, la CONAPO si toma en cuenta las defunciones de los mexicanos.

¿Cuál es el problema?

El problema es que los datos de población de el INEGI y la CONAPO son diferentes. Por lo que no se tiene bien informado al pueblo mexicano y el mundo sobre cual es la verdadera población mexicana.

Por ejemplo, de acuerdo al INEGI en el 2020 hay una población total de 5.54M en Nuevo León. Y por otro lado, de acuerdo a la CONAPO, hay una población total de 5.61M en el mismo estado.

Y así mismo para todos los Estados de la República Mexicana.

Por lo que se tiene una discrepancia de poblaciones entre ambas instituciones.

¿Cómo afecta este dato en nuestro negocio?

Si no se tiene bien el dato de población, puede tener varias consecuencias. Por ejemplo, se quiere modelar que zonas de Nuevo León serán las más óptimas para expandir o abrir mi negocio. Si no se tiene bien el dato de población, esto puede ocasionar que nuestro modelo de predicción arroje resultados erróneos. Que haya menos población de la que realmente se tiene, podría llegar a ser una detonante para una toma de decisiones. Lo que nos puede costar mucho dinero en un futuro si no se resuelve bien desde un principio.

¿Cómo lo resolvimos?

Como bien se mencionó, el INEGI tiene la población por AGEBS. lo cual la CONAPO solo la tiene a nivel municipio(o Estado). Entonces lo que se hizo, fue una homologación de poblaciones. Para tener una población real.

Para este ejercicio se hizo lo siguiente:

  1. Descargar las bases de datos tanto del INEGI como la de CONAPO
  2. Calculamos la proporción de la población de cada AGEB con su municipio y Estado
  3. Multiplicamos esa proporción del AGEB por la población municipal del municipio

Y así es como podemos homologar las poblaciones de ambas instituciones.

Y tú ¿Qué hubieras hecho?

Hasta aqui la columna de hoy. Te agradecemos seguirnos en nuestras redes @DATLASMX y si quieres seguir aprendiendo de esto te invitamos a revisar www.datlasacademy.com

– Equipo Datlas –

Keep it weird

¿QUÉ ES UN SHAPEFILE Y PARA QUE SIRVE? – INVESTIGACIÓN DATLAS

En Datlas nos especializamos en brindarles a nuestros clientes las mejores opciones para transformar sus datos en decisiones inteligentes, para ello tenemos una oferta grande de soluciones. Los tableros de inteligencia que ofrecemos son muy buenos en explicar los datos, mediante el uso de visuales podemos detectar tendencias y producir hallazgos. Por otro lado, tenemos el uso de Mapas, estos facilitan la interpretación de los datos que están georreferenciados.

Si quieres conocer mas acercaa de los Tableros de Inteligencia, te invitamos a leer «Dashboards de negocios, guía para principiantes – MANUALES DATLAS»

¿Que tienen de especial los mapas en Datlas?

El uso de nuestros mapas resuelve muchos de los retos actuales que tienen los negocios. Desde mapas de expansión comercial, hasta mapas que integran información de ventas de tu negocio.

Una de las solicitudes que hemos atendido es la de integrar distintos tipos de información georreferenciada al mismo mapa. Esto tiene como objetivo crear un mapa con toda la información que se necesita, logrando así un mapa completamente personalizado.

La solución tecnológica para poder integrar múltiples fuentes y múltiples tipos de datos a un solo mapa se atiende de múltiples maneras. Antes hemos hablado de que es un “Geohash” o para que sirve un “AGEB”, pero en esta columna queremos platicarles de que es un Shapefile, de que se conforma, cuál es su utilidad y de cómo podemos crear uno nosotros.

Te invitamos a leer las siguientes columnas para conocer mas de geohash y AGEBs.

¿QUÉ ES UN AGEB Y PARA QUE SIRVE? – INVESTIGACIÓN DATLAS

¿QUÉ ES UN GEOHASH Y PARA QUE SIRVE? – INVESTIGACIÓN DATLAS

¿Qué es la georreferenciación?

Esta es una técnica de posicionamiento espacial donde ubicamos en el mapa un objeto.

Si nos queremos poner técnicos, la georreferenciación es el posicionamiento espacial de una entidad en una localización geográfica única y bien definida mediante el uso de un sistema de coordenadas y datum específicos.

Todo esto se traduce en poner un punto en el mapa.

¿Qué encontramos en un Mapa?

Cualquier mapa que utilicemos desde Google maps hasta algún mapa viejo en papel tiene información desplegada. Toda esta información se encuentra en el mapa tomando alguna forma, esta puede ser un punto, línea o un polígono.

Puntos

Los puntos son objetos que no tienen ninguna dimensión, solo están ubicados dentro del mapa, pero tienen cero “volumen”, estos tienen a ser usados para representar mucha de la información y sin duda alguna es el tipo más común que encontramos en la mayoría de los mapas.

Uno uso común de los puntos es marcar la ubicación de un negocio, parque, centro comercial, etc. Estos lugares sin duda tienen un espacio o un “volumen” en tres dimensiones, pero para fines de simpleza, tienden a ser representados con un solo punto en el centro de su ubicación.

Por ejemplo, en esta captura de pantalla de Google Maps, encontramos al parque fundidora de la ciudad de Monterrey como un solo punto, al centro del parque.

Líneas

El segundo tipo que tocaremos será las líneas, para ello podemos pensar en la silueta o contorno de un lugar. Las líneas tienen un mundo de usos, uno de los más comunes es colocar los niveles topográficos del lugar. En algunos mapas también pueden ser usadas para desplegar información como calles, líneas de metro, límites territoriales, etc.

Polígonos

El polígono tiene la función de formar objetos en 2 dimensiones, en Datlas los utilizamos para delimitar una zona del mapa y agrupar sus características.

Por ejemplo, en esta imagen tenemos algunos polígonos de la Ciudad de Monterrey del mapa demo Datlas.

Trabajando con Múltiples Tipos

Cuando desarrollamos un proyecto nuevo en Datlas, es normal tener múltiples tipos de datos, así como múltiples fuentes.

Al tener todos estos datos georreferenciados, podemos colocarlos en el mismo mapa sin importar de que tipo sean.

Para eso trabajamos con nuestro habilitadores tecnológicos de GIS (geographic information system) que nos permiten procesar la información para colocarla en el mapa.

Nuestro software favorito tiene el nombre de QGIS.

Este es un software libre y de código abierto (open source) que habilita a nuestro equipo de manera importante para hacer procesamientos geoespaciales.

URL: https://www.qgis.org/en/site/index.html

Al trabajar con este tipo de programas podemos hacer uso de múltiples tipos de datos y de distintos formatos.

Lo que nos lleva al famoso SHAPEFILE. Este es un tipo de formato que nos permite trabajar con información georreferenciada ya sean puntos, líneas, polígonos, entre otros.

¿Qué es un Shapefile?

Un shapefile es un formato, así como tus imágenes tiene “.jpg” o tu documento de Word tiene “.docx” los shapefiles o comúnmente abreviados como “shp” son formatos de vectores geoespaciales de datos para el uso de software GIS.

Este formato de shapefile fue desarrollado y es regulado por ESRI como un estándar abierto para la interoperabilidad entre ESRI y distintos softwares de GIS.

Ahora para confundirte:

Cuando decimos “Shapefile” podemos estar diciendo dos cosas distintas. En la industria estas dos cosas tienen el mismo nombre, pero no te preocupes, aquí te decimos por qué y cuáles son las diferencias.

El primero y el que es técnicamente correcto es nombrar “shapefile” al archivo que termina en “.shp”, este es un solo archivo que tiene las características de la geometría de tus puntos, líneas o polígonos.

El problema aquí es que un archivo .shp no puede ser utilizado por sí mismo, tiene que ir acompañado de otros archivos con terminaciones .shx, .prj & .dbf.

Y he allí la confusión, como requerimos de mínimo estos cuatro archivos juntos para poder hacer uso de la información que almacenan, también se conoce como “shapefile” al conjunto de archivos que trabajan juntos para desplegar información en un sistema de información geográfica (GIS).

Mas adelante exploraremos cuales son las funciones de los otros tres archivos necesarios y de todos los otros que pueden acompañar a nuestro “shapefile” que son opcionales.

¿Cueles son los formatos que conforman un Shapefile?

De ahora en adelante llamaremos al conjunto de archivos que trabajan juntos para desplegar la información como “shapefile”.

Sin duda al trabajar con este tipo de documentos y sistemas por primera vez surge la duda de cómo hacer que funcione, por lo general al hacer uso de un archivo solo hacemos clic en él y si tenemos el programa adecuado, este se abre.

Para que un shapefile funcione de manera adecuada solo tenemos que asegurarnos de que todos los archivos que conforman un shapefile tengan el mismo nombre y estén en el mismo directorio o carpeta.

Por ejemplo, si tengo un shapefile que almacena información de un punto de interés se vería de esta manera en mi computadora.

Al importar estos archivos al QGIS o software de sistema de información geográfica de tu preferencia, se desplegará la información de manera adecuada y sin errores.

¿Qué función tienen los archivos que conforman un Shapefile?

Como lo mencionamos antes, un .shp se acompaña de 3 archivos indispensables para su correcto funcionamiento.

Estos son .dbf, .shx y .prj y su función es la que sigue:

.shp

Formato de la forma o, en otras palabras, almacena la geometría.

.shx

Almacena la indexación o forma del índice de la geometría, permitiendo su consulta en ambas direcciones del índice

.dbf

Almacena los atributos de formato, para cada figura del archivo.

.prj

Dentro de este archivo se encuentra la información sobre la proyección de la información. En sí, este archivo tiene los datos necesarios para georreferenciar el shapefile.

¿Qué otros archivos pueden acompañar un Shapefile?

Existen otra serie de archivos que pueden o no acompañar a los 4 esenciales, estos le agregan funciones o atributos al shapefiles.

Algunos de estos archivos son:

.sbn & .sbx

Indexación espacial de los atributos.

.fbn  & .fbx

Indexación espacial de los atributos, con la diferencia de que es solo para la lectura y no se pueden modificar.

.shp.xml (pegado)

Metadatos geoespaciales en formato .xml.

Existen muchos otros tipos de formatos de archivos que se pueden agregar a un shapefile, pero con esta introducción es más que suficiente para empezar a hacer uso de tus propios datos.

¿Dónde empezar?

La barrera de entrada para hacer uso de esta tecnología es baja, si tienes una computadora y puedes descargar información de internet, tienes todo lo que necesitas.

Empieza descargando QGIS desde https://www.qgis.org/es/site/ y utilízalo como tu software para procesamiento de información geográfica, este está disponible para Mac, Windows & Linux. Es seguro y gratuito.

Accede a la documentación en https://docs.qgis.org/3.22/es/docs/user_manual/ para familiarizarte con el programa.

¿Y los datos?

¿Qué crees?, no te tienes que preocupar por encontrar algunos shapefiles. Existe un mundo de información muy accesible y completamente gratuita que es generada por gobiernos, ONGs y entusiastas del mundo de los datos.

Te recomendamos usar tu motor de búsqueda al que más confianza le tengas (para mí: duckduckgo.com) y busques los shapefiles que más te llamen la atención.


Hasta aqui la columna de hoy ¿Qué otras aplicaciones has escuchado para los shapefiles? Únete a la conversación en @DatlasMX y aprende más del tema en Datlas Academy.

Equipo Datlas

– Keep it weird-

FIESTA DEL CINE: Reactivación de la industria de entretenimiento en 2022 – ECOSISTEMA DATLAS

Durante 2020 se vivió una de las temporadas más difíciles de los últimos años consecuencia de la pandemia del COVID-19, afectando no solo la salud de millones de personas alrededor del mundo, sino también teniendo un impacto directo en la economía global en los diferentes giros e industrias. Una de las industrias más afectadas fue el sector turístico, que poco a poco se ha estado recuperando y de la cual ya hemos hablado con anterioridad.

Te puede interesar: La analítica de datos para la recuperación de Turismo post pandemia. – Investigación Datlas

Sin embargo, otra de las industrias afectadas fue la cinematográfica que por el cierre de salas y retrasos de grandes estrenos, afectó la recaudación taquillera, además de que el 2020 fue uno de los peores años para la industria. Durante 2022 con la reapertura de estos espacios, el cine comienza a recuperarse y con el estreno de Blockbusters como Top Gun: Maverick o Spiderman: No way home, parece todo tener un futuro prometedor.

Te puede interesar: INDUSTRIA DEL CINE VS GAMING

Según datos de Canacine, durante 2020 el número de boletos vendidos para funciones de cine tuvo un promedio de 64.5 millones, una caída de poco más del 81% respecto al 2019, en el cual se vendieron más de 350 millones de boletos, mientras que en 2021 se logró llegar a la cifra de 113.6 millones, aun quedándose lejos de las ventas obtenidas pre-pandemia.

Comparativa de venta de boletos de los últimos años en México.
Cortesía: Canacine

Para el cierre de 2022 se espera tener un aumento considerable, ya que los resultados al corte de segundo cuatrimestre parecen favorables y, con la intención de asegurar este crecimiento y reactivación de esta actividad, los días 5, 6 y 7 de septiembre llega la Fiesta del Cine.

Comparativa de venta de boletos al corte de 15 de agosto de 2022.
Cortesía: Canacine

La Fiesta del Cine es una campaña que busca incentivar que el público regrese a las salas de cine con descuentos en las entradas generales de $29 MXN en todas las salas tradicionales de cualquier función en toda la República Mexicana. Las funciones en formatos especiales como IMAX, Dolby Atmos, 3D, 4DX o 4XD tendrán un costo de $49 MXN y salas Premium o VIP un costo de $69 MXN. También habrá descuentos especiales en alimentos y dulcería que se definirán por las diferentes cadenas.

Es una propuesta interesante, ya que uno de los impactos que también tuvo la industria fue el incremento del costo de entrada, por lo que el reducir los costos abre una oportunidad para todos los mexicanos de regresar a las salas de cine.

Aunque el costo promedio tuvo solo un aumento del 3% en algunos Estados y salas de cine puede rondar hasta en lo $90 MXN en salas tradicionales

Para concluir, algunos datos de las películas más taquilleras de lo que va del 2022.

 

Gracias por leernos, estaremos atentos para conocer con que datos cierra el cine este año. Cuéntanos si tú ya has regresado al cine o piensas aprovechar la Fiesta del Cine para hacerlo ¡Escríbenos en redes sociales! @DatlasMX

-Equipo Datlas –

Los 3 tipos de analítica de datos – COLUMNA DE OPINIÓN

La analítica de datos hoy en día se utiliza mundialmente con diversos usos, ya sea en la función pública o el sector privado. El INEGI y el Banco de México son dos ejemplos de instituciones que hacen uso del análisis de datos. Por otro lado, el sector privado tiene muchos ejemplos desde Meta, Google, Apple y Microsoft. Un ejemplo puntual de estas empresas y caso de uso, es de la empresa de la manzana, que en sus dispositivos cuenta con una herramienta para medir el rendimiento de la persona. Esta herramienta describe el uso que se le ha dado al dispositivo, este tipo de análisis es el descriptivo.

Tiempo de pantalla de Apple

Así como estos ejemplos, existen muchos más que nos ayudan a describir, predecir o, mejor aún, prescribir qué deberíamos hacer en el futuro para cuidar nuestras operaciones. En esta columna definiremos y ahondaremos en 3 tipos de analítica que te podrán servir para avanzar en tus proyectos de datos.

** También te puede interesar: A/B Testing para experimentar con datos y tecnología

Analítica Descriptiva

El análisis descriptivo (o de informes) se refiere a saber qué está sucediendo en la organización y comprender algunas tendencias subyacentes y las causas de tales ocurrencias. En primer lugar, esto implica la consolidación de las fuentes de datos y la disponibilidad de todos los datos relevantes en una forma que permita la elaboración de informes y análisis adecuados. A partir de esta infraestructura de datos, podemos desarrollar informes, consultas, alertas y tendencias apropiados utilizando diversas herramientas y técnicas de generación de informes.

Una tecnología significativa que se ha convertido en un actor clave en esta área es la visualización. Usando las últimas herramientas de visualización en el mercado, ahora podemos desarrollar conocimientos poderosos en las operaciones de nuestra organización.

Analítica Predictiva

El análisis predictivo tiene como objetivo determinar qué es probable que suceda en el futuro. Este análisis se basa en técnicas estadísticas, así como en otras técnicas desarrolladas más recientemente que caen dentro de la categoría general de minería de datos. El objetivo de estas técnicas es poder predecir si es probable que el cliente cambie a un competidor («abandono»), qué es probable que el cliente compre a continuación y cuánto, a qué promociones respondería un cliente, si esto el cliente es un riesgo digno de crédito, y así sucesivamente. Se utilizan varias técnicas para desarrollar aplicaciones analíticas predictivas, incluidos varios algoritmos de clasificación.

Empresas de venta en linea usan análisis predictivo

Un caso de uso de analítica predictiva aplicada es en Amazon, por ejemplo, cualquier búsqueda de productos en Amazon.com da como resultado que el minorista también sugiera otros productos similares en los que un cliente pueda estar interesado.

Analítica prescriptiva

El objetivo del análisis prescriptivo es reconocer lo que está sucediendo, así como el pronóstico probable y tomar decisiones para lograr el mejor rendimiento posible. Este grupo de técnicas ha sido históricamente estudiado bajo el paraguas de las OR o ciencias de la gestión y generalmente están encaminadas a optimizar el rendimiento de un sistema. El objetivo aquí es proporcionar una decisión o una recomendación para una acción específica. Estas recomendaciones pueden adoptar la forma de una decisión específica de sí o no para un problema, una cantidad específica (por ejemplo, el precio de un artículo específico o el pasaje aéreo a cobrar) o un conjunto completo de planes de producción.

Un caso aplicado para este tipo de análisis es una ferretería, que suministra barras de acero configuradas a medida para sus clientes. Estas barras se pueden cortar en formas o tamaños específicos y pueden tener requisitos únicos de material y acabado. La empresa adquiere materias primas de todo el país y las guarda en su almacén. Cuando un posible cliente llama a la empresa para solicitar una cotización de las barras especiales que cumplen con los requisitos específicos del material (composición, origen del metal, calidad, formas, tamaños, etc.), el vendedor generalmente tiene poco tiempo para envíe dicha cotización que incluya la fecha en que se puede entregar el producto y, por supuesto, los precios, etc. Debe tomar decisiones de disponibilidad para prometer, que determinan en tiempo real las fechas en las que puede prometer la entrega de los productos que los clientes solicitaron durante la etapa de cotización.

Anteriormente, un vendedor tenía que tomar tales decisiones analizando informes sobre el inventario disponible de materias primas. Es posible que parte de la materia prima disponible ya se haya comprometido con el pedido de otro cliente. Por lo tanto, es posible que el inventario en stock no sea realmente el inventario libre disponible.

** Te puede interesar: Algoritmos Supervisados

Una ferretería aunque suele ser pequeñas, venden gran cantidad de materiales.

Por otro lado, puede haber materia prima que se espera entregar en un futuro cercano que también podría usarse para satisfacer el pedido de este posible cliente. Finalmente, incluso podría haber una oportunidad de cobrar una prima por un nuevo pedido al reutilizar el inventario previamente comprometido para satisfacer este nuevo pedido mientras se retrasa un pedido ya comprometido. Por supuesto, tales decisiones deben basarse en los análisis de costo-beneficio de retrasar un pedido anterior. Por lo tanto, el sistema debería poder extraer datos en tiempo real sobre inventario, pedidos comprometidos, materia prima entrante, restricciones de producción, etc. Para respaldar estas decisiones, se desarrolló un DSS (Sistemas de soporte a decisiones) en tiempo real para encontrar una asignación óptima del inventario disponible y para respaldar análisis hipotéticos adicionales. El DSS utiliza un conjunto de modelos de programación de enteros mixtos que se resuelven mediante software comercial.

Hasta aqui la columna de hoy. Síguenos en nuestras redes para estar enterad@ de la nueva temporada de podcast y recomendarnos nuevas temáticas que te gustaría explorar para este blog.

Equipo Datlas

– Keep it weird –

Fuente de imagen de portada: https://gravitar.biz/bi/tipos-analitica/

La analítica de datos para la recuperación de Turismo post pandemia. – Investigación Datlas

En los dos últimos años el sector turístico ha dado un giro drástico y muchas de aquellas cosas que hacíamos para disfrutar del tiempo libre, no son tan sencillas en el mundo COVID. Una de ellas, que sin duda es de la que más echamos de menos, es viajar y hacer turismo.

** Te puede interesar: Conocer el tamaño del PIB TURÍSTICO por ESTADO de la República para México

Este cambio ha tenido para el sector turístico un impacto negativo y ha dejado cifras demoledoras. Debido a la pandemia, los ingresos de 2020 en el sector turismo cayeron más de 77%, con casi menos de 90 millones de turistas internacionales y un gasto inferior en un 80%, respecto a 2019.

Ante esta situación para Datlas es importante tener una debida recopilación todos los datos que genera un hotel o cualquier otro tipo de empresa turística y sacarles el máximo resultado, obteniendo respuestas sobre el debido manejo para obtener una respuesta satisfactoria y cuáles deberán ser los pasos a seguir a cerca del negocio, se convierte en imprescindible. Se trata de una ventaja competitiva que reducirá la incertidumbre al mínimo y permitirá a las empresas de este sector tan castigado tener un mejor resultado.

*** Te puede interesar : «Desarrollando un Dahsboard de Inteligencia Turística»

¿Qué es el análisis de datos?

El análisis de datos es el conjunto de herramientas informáticas que permiten manipular, gestionar y transformar datos, independientemente de su volumen, con el objetivo de obtener respuestas objetivas y eficaces. La tecnología nos proporciona herramientas que simplifican el proceso y ofrecen información útil y efectiva.

El análisis de datos en el sector turístico.

El análisis de datos y el uso de herramientas para el tratamiento del sector turístico se ha convertido en los últimos años en un gran aliado de la transformación digital de las empresas. Si, además, incorporamos el factor pandemia a la problemática a la que nos presentamos en el tiempo COVID, un sector clave de la economía es el turismo por ello necesita reaccionar pronto y rápido.

El análisis de datos nos permite transformar los datos en información útil para las empresas del sector turístico y les permite obtener respuestas objetivas que sirvan como cimientos para definir y optimizar sus estrategias de ventas.

** Te puede interesar: Análisis de AIRBNB: Monterrey VS. Mérida

¿Qué beneficios aporta el análisis de datos al sector turístico?

El principal atractivo del análisis de datos está en su capacidad de predecir comportamientos, expectativas y necesidades futuras de los consumidores, permitiendo a las empresas tomar decisiones de negocio más inteligentes y seguras. Como lo son:

  • Detectar tendencias
  • Conocer al cliente
  • Agilizar la toma de decisiones
  • Optimizar procesos
  • Atraer y fidelizar clientes
  • Desarrollar productos y servicios personalizados

El análisis de datos es uno de los grandes proyectos públicos en transformación digital, esto se hace posible gracias al análisis masivo de datos, dotando de soluciones tecnológicas.

Todo ese ecosistema de información genera un destino turístico inteligente en el que la comunicación y la publicidad se reducen al máximo y se transforman en información útil. En ese sentido, los destinos inteligentes conectan y centralizan toda clase de soluciones digitales, desde mapas, audioguías y puntos de interés turístico basados en la geolocalización y la realidad aumentada, hasta aplicaciones móviles con horarios y opciones de transporte o webs que visualizan la información en tiempo real.

Equipo Datlas

– Keep it Weird-

¿QUÉ ES UN GEOHASH Y PARA QUE SIRVE? – INVESTIGACIÓN DATLAS

La utilidad de un mapa es inmensa, estos tienen un sinfín de posibilidades.

En Datlas usamos mapas todos los días con el propósito de brindarles soluciones a nuestros clientes. En algunos casos estos mapas son hechos a la medida, mediante el servicio de personalización de plataformas que ofrecemos, estos mapas albergan la inteligencia comercial que puede hacer la diferencia en este mundo de competitividad económica.

¿Pero que tienen de especial estos mapas?

La respuesta depende de cuáles son tus necesidades, ¿Tu compañía busca expanderse mediante el modelo de franquicias?, ¿Buscan segmentar los puntos de venta? o ¿Qué tal un análisis RFM?

El punto es que el mapa que desarrollamos para ti y el que desarrollamos para otro cliente es muy diferente porque las necesidades son distintas, lo que nos lleva a que los datos georreferenciados de los mapas son distintos.

Al trabajar con un universo tan grande de información, nos topamos con datos que están georreferenciados de multiples maneras.

¿Qué es la georreferenciación?

Es una técnica de posicionamiento espacial donde ubicamos en el mapa un objeto[1].

Si nos queremos poner técnicos, la georreferenciación es el posicionamiento espacial de una entidad en una localización geográfica única y bien definida mediante el uso de un sistema de coordenadas y datum específicos.

Al final, todo esto se traduce a poner un punto en el mapa.

Tipos de georreferenciación

Ya sabemos que el mapa es la representación geográfica de un lugar y las coordenadas son la dirección para llegar a cualquiera de estos lugares.

Puntos

Un punto es un objeto de cero dimensiones ubicado en el mapa mediante las coordenadas latitud y longitud.

Estos puntos son de gran utilidad para ubicar negocios en un mapa, o los puntos de venta o incluso puntos que se mueven en el tiempo, como un auto o camión.

** Te invitamos a leer la siguiente columna: AIRBNB En la zona metropolitana de Monterrey – DATLAS COLUMNA DE INVESTIGACIÓN para ver un uso practico del analisis de puntos.

Líneas

El siguiente nivel son las líneas, podemos pensar en las líneas como un conjunto de puntos. Estas son de gran utilidad para mapear objetos como curvas de nivel para topografía, las calles de una ciudad, líneas de metro, limites municipales o de colonias, etc.

Polígonos

Por último tenemos el polígono, estos son un conjunto de líneas utilizadas para representar la superficie, son figuras geométricas irregulares que pueden ajustarse al perímetro o frontera geográfica del elemento que representan.

Multiples fuentes

Ya vimos que los datos pueden ser georreferenciados de diferentes maneras, pero también es importante considerar que cuando creamos un mapa le agregamos información de múltiples fuentes.

Estas fuentes pueden ser del orden público, como datos del INEGI u otras fuentes gubernamentales o pueden ser privados como datos propios de tu empresa.

Al agrupar datos de distintas características y de distintas fuentes se crea un reto. ¿Qué pasa cuando queremos calcular una metrica para una ubicación, cuando esta ubicación tiene datos en agregado de un municipio y de un AGEB?

Estos datos están a diferente “tamaño” uno siendo el municipio que en una zona urbana puede ser mucho más extenso que un AGEB.

** Si te interesa saber mas sobre los AGEBs y de la utilidad que proporcionan, te invitamos a leer la columna: ¿QUÉ ES UN AGEB Y PARA QUE SIRVE? – INVESTIGACIÓN DATLAS

Existen muchas técnicas para analizar los datos en estas situaciones, una de ellas es mediante el uso de geohashes.

¿Qué es un Geohash?

Un geohash es un sistema de geocódigos del dominio público creado por Gustavo Niemeyer[2] en el 2008 en donde se codifica la ubicación geográfica en un texto corto de letras y números.

¿Como se utiliza este sistema?

El mundo se divide en 32 células mediante el uso de una cuadricula, estas están diferenciadas con una letra o un número. En el caso de México, podemos ver que casi todo el país se encuentra ubicado en el geohash “9”, a excepción de Yucatán y Quintana Roo que residen en el geohash “d”.

A este nivel de resolución la utilidad de este sistema de geocodigos es limitada, pero la utilidad de este sistema incrementa al hacerle “zoom” al mapa.

El beneficio de este sistema es que se puede hacer zoom al mapa o aumentar la resolución, al hacer esto podemos ver que se van agregando dígitos al código.

Este mecanismo de aumento de resolución se puede hacer hasta tener un código de 12 dígitos lo cual representaría un cuadro geográfico de tan solo 3.7cm por 1.9cm, sin duda un espacio muy pequeño.

Para un uso más práctico, encontremos el geohash donde se encuentra el Ángel de la Independencia en la Ciudad de México a 8 y 9 niveles.

En 8 niveles podemos observar la siguiente cuadricula, donde se encuentra el Ángel de la independencia, y en el geohash azul al centro de la imagen de 9 niveles, que tan solo mide 4.80 metros por 4.80 metros.

¿Qué tamaño tienen los Geohashes?

Como definimos antes, al crecer el nivel de caracteres que tiene el código del geohash, disminuye el tamaño que representa ese espacio.

El tamaño de cada uno de los 12 niveles que encontramos en este geocódigo es el siguiente:

¿Qué beneficios tiene usar este sistema?

Existen múltiples beneficios de poner en práctica el uso de geohashes en tu organización, el primero es que dado que podemos generar códigos de un tamaño tan pequeño, es difícil que aun que nuestra base de datos de ubicaciones sea extensa, se repita la ubicación del algunos de los geohashes, esto significa que podemos utilizarlos para identificar a cada uno de nuestras ubicaciones, esto se conoce como geotagging.

Otro beneficio es el del bajo costo computacional al utilizar este sistema para hacer consultas a un geo-servidor.

Cuando hacemos consultas a un geo-servidor podemos tener una situación donde sea muy grande la carga computacional, imagínate que le pedimos al servidor que nos de todos los puntos que estén en nuestra base de datos en un área de 1km de radio de una ubicación, la consulta va a ser muy grande dado que se tienen que calcular distancias entre la ubicación y los puntos de la base de datos. Si por otro lado tenemos todos nuestros puntos geohashados podemos hacer una consulta más siempre, algo así como: Tráeme todos los puntos que estén en este geohash. ¿Quieres hace más grande el área de consulta? Entonces tráeme todos los puntos que empiecen con algunos dígitos en su geohash.

Otros dos beneficios de usar este sistema son, primero la curva de aprendizaje amigable, al leer esta coluna ya tienes los básicos para empezar a usarlo. Y por último el costo, dado que nuestro amigo Gustavo Niemeyer [@] creo este sistema y lo coloco en el dominio público es gratis.

¿Como pongo en práctica el geohashing?

Para hacer uso de este sistema primero necesitamos coordenadas, te invito a abrir una hoja en Excel y hacer las siguientes columnas, id, nombre, latitud, longitud y geohash.

Coloca el nombre de tres ubicaciones que gustes y busca sus coordenadas en Google Maps[3].

El siguiente paso es buscar el geohash de estas tres ubicaciones, para eso podemos poner en práctica nuestras habilidades de código mediante el uso de bibliotecas como “Geohash 1.0” para el lenguaje de programación Python[4].

Pero en este caso haremos uso de unas páginas de internet muy utiles, la primera: https://geohash.tools/ donde podemos colocar nuestro primer set de coordenadas.

Esta herramienta nos da como resultado el geohash a 6 niveles de nuestras coordenadas. Un poco amplio el espacio, intentemos ahora con otra herramienta, la página: https://www.movable-type.co.uk/scripts/geohash.html y coloquemos las coordenadas de nuestra segunda ubicación, en este caso solicitemos el nivel a 7 caracteres.

Y por último repitamos el ejercicio en la misma página solicitando la tercera ubicación a un nivel de 8 caracteres.

Al concluir los tres ejercicios, tu tabla debe de estar completa.

Nota como la longitud de tu geohash fue subiendo de caracteres, pero al mismo tiempo el espacio representado por cada código fue disminuyendo.

Hasta aqui la columna de hoy ¿Qué otras aplicaciones has escuchado con Geohashes? Únete a la conversación en @DatlasMX y aprende más de geohashes en Datlas Academy.

Equipo Datlas

– Keep it weird-


Referencias bibiliograficas:

[1] https://es.wikipedia.org/wiki/Georreferenciaci%C3%B3n

[2] https://web.archive.org/web/20080305223755/http://blog.labix.org/#post-85

[3] https://www.google.com/maps

[4] https://pypi.org/project/Geohash/

Estándares de calidad para Datos (Data quality standards) – Investigación Datlas

Los sistemas de datos y analítica avanzada son cada vez más complejos. Nuevas herramientas, formatos, técnicas y métodos son implementados para descifrar hallazgos de una manera más automatizada acercándonos cada vez más a la verdadera analítica prescriptiva. Además, MIT estima que una mala calidad de datos puede representar entre el 15%-25% de costos sobre los ingresos de una compañía. (Fuente: https://sloanreview.mit.edu/article/seizing-opportunity-in-data-quality/) Pero, volviendo a los fundamentales, o como dicen en inglés «Back to basics» ¿Cómo podríamos monitorear que estos procesos funcionen con calidad? ¿Cómo asegurarme que todos los proyectos de analítica en mi organización tengan un mínimo nivel de calidad?

En esta columna revisaremos los principios de calidad de los datos y compartiremos algunas prácticas básicas que en el equipo Datlas hemos aprendido durante la trayectoria de varios proyectos. Esta columna te interesará si lideras o buscas liderar iniciativas de analítica en tu organización.

I) ¿Qué son los estándares de calidad?

Según el libro de «Managing Data Quality» la calidad de los datos se puede definir como: El efecto fundamental de la calidad de los datos es que los datos correctos estén disponibles en el momento correcto para los usuarios correctos, para tomar la decisión correcta y lograr el resultado correcto. Esto se puede ampliar considerando que los datos de buena calidad son seguros, legales y se procesan de manera justa, correcta y segura .

Cuando nos referimos a calidad de datos tenemos en cuenta el método, la organización y la habilitación de sistemas que nos permitan generar una base sostenible de calidad de datos durante el tiempo

II) ¿Cuáles son los términos más importantes en calidad de datos?

  • Proveedores de datos: Los creadores de fuentes de datos
  • Recipientes de datos: Recipientes dinámicos y estáticos de fuentes de información
  • Fuentes primarias: Referencias de primera mano de información, también conocidos como los datos que provienen de la fuente original
  • Fuentes secundarias: Referencias de segunda mano, que un intermediario integro, alteró, agrego o modificó para fines de desarrollo de métricas

** También te puede interesar: «Arquitectura de proyectos de datos» . Liga: https://blogdatlas.wordpress.com/2021/02/08/arquitectura-de-proyectos-de-datos-data-warehouses-vs-data-lake-vs-data-mart-datlas-manuales/

III) ¿Cuáles son las dimensiones de calidad de los datos?

  • Que los datos no estén incompletos, es decir que el nivel de cobertura sea cercano al 100%. Ejemplo si estamos hablando de una base de datos transaccional de una gran cadena comercial ¿ A la fecha del corte, cuánta información tenemos disponible?
  • Qué existe integridad entre la relación de los datos
  • Los datos disponibles son lo más actualizados posibles. Y son vigentes para los escenarios de análisis que requiere la organización
  • Cumplimiento de la estructura de datos, de acuerdo a los parámetros establecidos. Ejemplo que todos los campos temporales sean consistentes en todo el sistema. Si se registran a nivel minuto-segundo, que así sea. Si la semana comienza en domingo, que sea así para todos los sistemas
  • Disponibilidad de los datos cuando se requieren. Es decir, que la fuente permita tener información de manera oportuna
  • Que las herramientas disponibles para registrar datos sean las correctas. Buenos métodos y registros en las unidades que el sistema lo requiere. Recomendable que existan registros de identificadores únicos
  • Finalmente, pero no menos importante, que los datos sean consistentes entre sistemas . Es decir, que entre áreas y equipos tengan los mismos estándares de consultas para que , por ejemplo, todos tengan la misma venta

IV) 10 Consejos prácticos para mantener calidad de los datos

En materia práctica ¿Qué podemos utilizar? En nuestra investigación queremos citar y complementar los consejos de Talend.

1) Hay que volver a la calidad de los datos una prioridad

2) Establece buenas métricas de calidad de datos con base a las dimensiones establecidas

3) Profundiza en investigar las fallas en la calidad de los datos

4) Invierte en entrenamiento interno

5) Establece, implementa y monitorea buenas guías de gobernanza de datos

6) Genera procesos de auditoría buscando: Bases de datos incompletos, faltantes, datos erróneos, inconsistencias, datos viejos, entre otros

7) Asigna un administrador de calidad de datos en cada departamento

8) Declara y gestiona una fuente única de referencia de datos

9) Automatiza los flujos de datos de buena calidad

10) Impulsa el uso de la nube y la cultura de trabajo colaborativo con «plantillas y glosarios» de datos

V) Sobre el ISO relacionado a la calidad de los datos

Finalmente y, en cumplimiento a los estándares con la que muchas compañías trabajan, se puede poner en práctica lo que dice el compendio «Data quality — Part 61: Data quality management: Process reference model».

** También te puede interesar: Metodologías para preparar tus bases de datos. Liga: https://blogdatlas.wordpress.com/2020/07/09/4-pasos-para-preparar-tus-bases-de-datos-para-analisis/

Hasta aqui la columna de hoy . Y tu ¿Qué prácticas de calidad de datos tienes en tu día a día o con tu equipo? ¿Quién monitorea la calidad de información y que los hallazgos en sus análisis vengan de buenas fuentes?

Comparte tu conocimiento con la comunidad en redes con @datlasmx

Ahora puedes revivir gratuitamente el SIMPOSIUM DE DATLAS ACADEMY donde tuvimos a expertas y expertos de corporativos en México charlando de sus grandes proyectos

Equipo Datlas

– Keep it weird –

Fuentes:

¿Conviene actualmente abrir una juguetería? – Caso de uso DATLAS (Especial día del niño)

La era digital ha revolucionado muchas cosas cotidianas, desde aparatos de comunicación, dispositivos de entretenimiento, el dinero, hasta medios de transporte. Sin duda vivimos en una era donde casi todo es digital y lo que no es aún, se está ideando cómo convertirlo digital, sin embargo hay cosas que no se pueden hacer 100% digitales como lo son los juguetes para niños. Muchas personas podrían pensar que las jugueterías están destinadas a extinguirse porque actualmente los niños prefieren aparatos de entretenimiento digitales. Esto puede que tenga algo de cierto si se ve a grandes rasgos y generalizando pero si nos vamos a específicos nos daremos cuenta que con el uso de los datos inteligentes una juguetería podría seguir sobreviviendo en este mundo digital.

Este blog tiene como propósito explicar cómo se utiliza la analítica y la Big Data para encontrar el mejor lugar para abrir una juguetería nueva en este caso. Nos pondremos en el papel del dueño de esta juguetería con el propósito de llegar a la máxima cantidad de familias posibles para maximizar nuestras ventas.

Utilizaremos un mapa de inteligencia propiedad de Datlas para realizar este caso. Te puede interesar este blog

Primeramente necesitaríamos las bases de datos necesarias para poder mapear, en este caso utilizaremos las siguientes:

  • Nivel Socioeconómico
  • Censo 2020
  • DENUE
  • Códigos postales
  • Categoría Social

Todas estas bases de datos estarán mapeadas delimitadas por AGEB. Si gustas conocer más de esto te puede interesar este blog

Una vez que tenemos nuestras bases de datos mapeadas empezaremos a utilizar nuestras herramientas de análisis para poder tomar la mejor decisión. Iremos paso a paso.

Paso 1: Ubicar a las familias potenciales

Utilizando los datos del CENSO podemos observar dónde son los AGEBs que tienen más personas infantes que son los «clientes» potenciales para una guardería.

Paso 2: Revisar el Nivel Socioeconómico

Con la capa de Nivel Socioeconómico podemos revisar los AGEBs con mayor o menor nivel y dependiendo de ello podemos saber el rango de precios o a qué sector de la población estaría dirigida nuestra guardería.

Paso 3: Observar la Categoría Social

Al momento de tener mapeada la categoría social de cada AGEB nos muestra que tipo de dicha categoría abunda en él, en este caso nos enfocaremos en la categoría de «Familia con Niños» que es de color verde en el mapa.

Paso 4: Activamos la capa de Códigos Postales

En este caso activamos la capa de Códigos Postales en conjunto con la capa de Categoría Social, esto con el fin de analizar cuáles son estos código postales donde existe una gran cantidad de familias con «clientes potenciales».

Paso 5: Sacamos conclusiones

Una vez observado las capaz, de hacer nuestros análisis, podemos llegar a algunas conclusiones importantes. Para fines prácticos se presentará la conclusión de cuáles son los mejores códigos postales para ubicar una juguetería actualmente.

Top 5 CP para ubicar una juguetería:

  • 67257
  • 64103
  • 66612
  • 66647
  • 64984

Se escogieron las zonas donde más abundan los «clientes potenciales» y también los CP donde existe una fácil vía de acceso para llegar a una juguetería.

A grandes rasgos así es como una juguetería podría utilizar el Big Data mediante las herramientas de DATLAS para potencializar sus ventas y seguir existiendo en este mundo cada vez más digitalizado, es un reto difícil pero no imposible. Teniendo a los datos y a la analítica de tu lado siempre irás por el camino correcto.

Equipo Datlas

– Keep it weird –

«La clase media: Los que no son pobres ni son Carlos Slim» ¿En realidad existe la clase media? (Una revisión de desigualdad social en México y niveles socioeconómicos para Nuevo León) – COLUMNA DE INVESTIGACIÓN DATLAS

Conceptos a ver en este blog:

  • Pobreza
  • Canasta básica
  • Desigualdad Social
  • Coeficiente de Gini
  • Curva de Lorenz
  • Nivel Socio Económico
  • Posibles causas de la desigualdad social
  • Porque es importante hablar de desigualdad y pobreza

México es un país rico en cultura, especies, y comida, hemos tenido artistas reconocidos internacionalmente como Juan Gabriel, contamos con especies únicas de animales endémicos y sorprendentes como el Axolote, y sazones que a cualquier mexicano le duele no tener en el extranjero. Por el otro lado, lamentablemente también somos un país con demasiada pobreza en cuestión de calidad de vida, tanta y tan variada, que para un análisis más robusto no basta con medidir las clases sociales en 3 niveles (alto, mediano, y bajo), si no, en 7. Enterate en este blog cuales son estos 7 niveles y cómo son medidos.

Antes de empezar con el tema fuerte de este blog, creemos es pertinente hablar del título, y es que es probable que al existir gente famosa en nuestro país con una riqueza enorme como lo son Carlos Slim, Germán Larrea, Alberto Baillères y Ricardo Salinas Pliego (quienes se supone tienen el 9% de la riqueza del país), pero al mismo tiempo mucha gente que muere de hambre, nos hayamos hecho alguna vez las preguntas: ¿México es un país rico o pobre? y ¿Cómo y quién mide la pobreza?

Para la primera pregunta habría que esperar al final de este blog, pero para la segunda, seremos lo más breves posibles.

Gráficas por elaboración propia. Fuente: INEGI, CONEVAL

En México la organización encargada de medir la situación de pobreza, es el CONEVAL, el cual tiene diferentes metodologías, pero la más sencilla es mediante la canasta básica. Aquí mediante muchos cálculos que buscan representar la cantidad mínima de dinero para comprar una canasta de bienes considerados indispensables, definen esta cantidad de dinero como una línea de pobreza, y si los hogares ganan menos de esa cantidad, son considerados que viven en situación de pobreza.

Nota: Es importante mencionar que para determinar esta canasta con bienes indispensables, se calcula el gasto de las familias en función de las calorías necesarias (su energía). Así como existen otras medidas de la pobreza tales como: Rezago educativo, acceso a los servicios de salud, acceso a la seguridad social, calidad y espacios de la vivienda, acceso a los servicios básicos en la vivienda, y acceso a la alimentación nutritiva y de calidad.

En la gráfica podemos contemplar cómo ha aumentado la línea de pobreza a lo largo de los años, en la izquierda tenemos su comportamiento estacional en las áreas urbanas, y a la derecha su parentezco con la inflación, pues a principios del año aumenta, para bajar en abirl, y luego seguir aumentando hasta finales del año. Esto mostrando un poco que a las personas en situación de pobreza les es más difícil sobrellevar la inflación, pues al estar la mayoría en el sector informal, sus gastos aumentan pero sus salarios no.

** También te puede interesar leer nuestra columna: “La inflación: un enemigo silencioso”

Mapa por elaboración propia. Fuente: CONEVAL

A partir de lo antes mencionado, creamos este mapa con los porcentajes de hogares en situación de pobreza según cada estado de la república. Aquí empezamos a ver uno de los temas principales de este blog, mientras que en Nuevo León el 24.33% de las personas en el 2020 se encontraban en situación de pobreza, en Chiapas el porcentaje era del 75.49%, lo cual refleja un contexto de calidad de vida completamente diferente, este fenómeno, es conocido como desigualdad social. Y aquí estamos viendo cifras comparando estado con estado, pero ¿Cómo podríamos entonces comparar a todos los ciudadanos del país?

Coeficiente de Gini y Curva de Lorenz

Para responder a esta última pregunta, una manera muy útil de medir la desigualdad, es mediante el Coeficiente de Gini, este al igual que la canasta básica, es una cifra en función del ingreso de las personas, la gran diferencia, es que esta cifra va del 0 al 1, donde 0 es igualdad absoluta (todos en México tienen la misma cantidad de dinero), y 1 es desigualdad absoluta (1 persona tiene todo el dinero del país).

En el 2021, el Coeficiente de Gini de México era de 0.503, pero en el 2018 era de 0.454 cuando al mismo tiempo en países europeos como Francia y España el el coeficiente era de 0.285 y 0.335, y en países latinoamericanos como Uruguay era de 0.397. A nivel estatal el Coeficiente de Nuevo León es de 0.447.

Gráfica por elaboración propia. Fuente: INEGI, Data NL, y European Data Lab

Al obtener los Coeficientes de Gini podemos ver que tanto vamos mejorando en materia de desigualdad y cómo están otros países. Sin embargo, si queremos ver esta desigualdad de manera gráfica y obtener otras conclusiones podemos utilizar la Curva de Lorenz. Gracias a las gráficas anteriores podemos ver dónde se acumula mayormente la desigualdad, y que el 10% de la población en México tiene el 32% del ingreso y gasto (1 – 68%), mientras que en Nuevo León solo es del 29%, y en Francia el 23%.

Nivel Socio Económico

Imagen con los Niveles Socio Económicos: A/B, C-, D, y E

Ojo, muchas veces la conversación se queda en estas cifras y distribuciones, pero después de indagar en el tema, hay algo muy importante que no estamos calculando. Y es que el Coeficiente de Gini nos muestra sólo la desigualdad de ingresos, que si bien es una de las variables más importantes para determinar la calidad de vida en la sociedad. En Datlas llevamos rato trabajando con un concepto que nos mostrará un panorama mucho más amplio de la calidad de vida en México y en Nuevo León, este concepto es el dichoso Nivel Socio Económico.

Como bien comentamos en el blog de la paridad de compra, poco importa el ingreso de las personas, si no vemos su poder adquisitivo. Un apartamento y un desayuno no cuestan igual en Ciudad Victoria y en Monterrey, entonces si alguien con cierto ingreso puede vivir muy bien en Cd. Victoria, probablemente batalle mucho más si con ese ingreso viviera en Monterrey.

** También te puede interesar leer nuestra columna: “El dólar USD está muy caro, pero ¿Más de lo que debería? – Entérate aquí cómo saber si una divisa está sobrevalorada (Poder de Paridad de Compra)”

Retomando el tema del NSE, esta métrica es medida por el AMAI y se divide en 7 niveles: A/B, C+, C, C-, D+, D, y E. Cada uno cuenta con características las cuales describen un contexto de calidad de vida diferente como se puede observar en la imagen anterior.

El A/B por ejemplo, en su mayoría el jefe de familia tiene estudios profesionales o posgrado (80%). Siete de cada diez viviendas (72.5%) tienen al menos 3 dormitorios y un 67% cuentan con al menos dos automóviles. Mientras que el nivel E, la mayoría (82%) tienen un jefe del hogar con estudios no mayores a primaria. Siete de cada diez viviendas tienen solamente un dormitorio y 83% no cuentan con baño completo. La tenencia de internet en la vivienda es muy bajo (0.3%), y más de la mitad del gasto se asigna a alimentos (52%) y solo el 1% a educación. Todas estas características están en la página del AMAI dedicada al NSE, y vale la pena leerlas para saber en cuál NSE estamos.

Fuente: AMAI

Como podemos observar, ya no solo estamos hablando de ingreso, si no, de la educación del jefe del hogar, equipamiento (si tienen televisión, refri, etc), transporte y demás. Pero, ¿Cómo se distribuye esto en los diferentes estados del país? Una Manera de verlo es mediante las distribuciones presentadas en el manual del AMAI, donde podemos ver la gran diferencia de estado a estado. En este caso en el 2020 en Nuevo León el 44% está en los primeros 3 niveles y solo el 38% está en los últimos 3. Mientras que en Chiapas solo el 15% está en los primeros 3 niveles y mucho más de la mitad (79%) está en los últimos tres niveles.

Mapa inteligente de Datlas en Monterrey, con los 7 NSE

Otra manera de ver esta distribución es en un mapa inteligente como los que tenemos en Datlas de todos los estados de la república, y de los cuales podemos obtener los datos del Censo 2020 entre otras fuentes de datos de cierto polígono de interés en cualquier punto del mapa para evaluar una ubicación.

Hasta este punto ya hemos tenido un buen recorrido por los temas más relevantes de la desigualdad social, y al mismo tiempo de la pobreza del país. Para cerrar estos temas, vale la pena mencionar que México se encuentra en el 25% de los países más desiguales del mundo, y es el segundo más desigual de la OCDE. Según Esquivel Hernández, G. (2016), mientras el PIB per cápita crece a menos del 1% anual, la fortuna de los 16 mexicanos más ricos se multiplica por cinco.

Posibles causas de la desigualdad

Cuando hablamos de causas mucho se le atribuye a que las personas tienen problemas de diversidad geográfica, étnica, política y social. Tenemos comunidades en muchos lugares rurales que son casi impenetrables y que hacen muy difícil que haya calidad educativa, acceso al crédito, etc. Sin embargo, no hay que irnos tan lejos, el problema de la pobreza se hace más grande incluso en los lugares menos margniados.

Al vivir en situación de pobreza, todo es más caro, los traslados son más difíciles por la ubicación y el tiempo del transporte, no alcanaza para comprar a mayoreo, los bancos y casas de préstamo cobran una comisión más alta para todo, por la poca confianza, y como vimos en el NSE E, el 52% del ingreso familiar se va a la comida, y con el otro 48% se debe de destinar a necesidades básicas, sin tomar en cuenta que todos estamos expuestos a algún gasto grande e inesperado como algún problema médico, alguna pandemia, sequía, o algun aumento acelerado de la inflación (pero no de los salarios). Por ende, tendría sentido pensar que el vivir en situación de pobreza es un círculo vicioso y cada vez es más difícil de salir.

Este círculo vicioso claro que es más fácil de caer en un país con las siguientes caractarísticas:

  • Corrupción. El desvío de fondos reducen los recursos destinados a las inversiones en la población más vulnerable.
  • Desempleo. La falta de empleos productivos hace que un importante segmento de la población se dedique a actividades informales de baja remuneración. En el 2021 el porcentaje de mexicanos en situación informal era del 55.8%.
  • Discriminación. Al juzgar a las personas por su situación y/o apariencia, hace que sea más difícil conseguir mejores oportunidades.

** También te puede interesar leer nuestra columna: “¿ESCASEZ DE AGUA EN NL? POR DÓNDE COMENZAR A INVESTIGAR (UNA REVISIÓN CON MAPAS Y RESPONSABLES DE LA IP)…”

¿Por qué es relevante hablar de pobreza y desigualdad?

Después de ver cómo México tiene escenarios muy diferentes a lo largo del país, esperemos y se hayan llevado la conclusión de que esto implica oportunidades diferentes, y el evadir esta clase de temas, significa no ver la imagen completa de gran parte de la población y sus problemas. De la misma manera, nos invita a reducir desde nuestra trinchera las posibles causas de desigualdad social.

Que el privilegio no te nuble la empatía

– Ita María

Hasta aquí la columna de hoy, esperemos se hayan quedado con varios conceptos interesantes de economía, y cómo muchas veces los aplicamos los analistas de datos. Y ustedes, ¿En qué NSE se encuentran? ¿Qué les pareció la columna?


Equipo Datlas

– Keep it weird-

Fuentes:

Las 5 de Datlas en tendencias camino al SuperBowl LVI – COLUMNA DE INVESTIGACIÓN DATLAS

Estamos a muy pocos días de vivir uno de los eventos más grandes del Futbol Americano para aquellos conocedores y apasionados a este deporte en dónde los Bengalies de Cincinnati se enfrentarán en la casa de los Rams de los Ángeles en el SoFi Stadium el próximo domingo.

En Datlas nos gusta monitorear datos en tiempo real y más si son temas que dan mucho de que hablar, pues esta columna esta dedicada a todas aquellas tendencias de los fieles seguidores de la NFL que han estado haciendo estas búsquedas camino al SuperBowl.

Acompáñanos en la siguiente columna para explicarte más acerca de esta metodología y las 5 tendencias más buscadas en la internet por parte del próximo partido de la NFL.

Para la realización de este ejercicio se utilizo la herramienta de Google Trends para analizar cada una de las tendencias que mostraremos durante el blog.

Tendencias Google (Google Trends, en inglés) es una aplicación de Google que permite monitorear las búsquedas de ciertos términos claves a través de los motores de búsqueda de Google y su red.

Qué es Google Trends y cómo podemos sacarle partido - ProximaHost

La herramienta permite ver el histórico de búsquedas, comparar contra otras palabras claves, segregar las búsquedas por geografía y más.

La medición de estas tendencias es con base a un indicador de 0 a 100 que se va contabilizando por día. El valor de 100 significa que, durante el horizonte temporal analizado, ese día se llego al nivel máximo de búsquedas relativo a otros momento durante ese período de análisis

1. «NFL»

Comenzamos con el termino «NFL» en los últimos 5 años, uno de los insights más relevantes que podemos observar es que el incremento en las búsquedas en relación a los demás años es notorio para la actual temporada de 2021-2022 como se muestra en la siguiente gráfica:

*Consulta «NFL« vía Google Trends realizada el 10 de febrero de 2022

Además de que podemos analizar que EEUU es unos de los países con mayor número de búsquedas para «NFL» le sigue Canadá, México, República Dominicana y después Irlanda como su TOP 5.

2. «Super Bowl»

*Consulta «Super Bowl» vía Google Trends realizada el 10 de febrero de 2022

«Super Bowl» es uno de los términos más buscados en estas fechas debido a la proximidad del evento de acuerdo a los datos de últimos 5 años, notamos que 2018 fue uno de los mejores años en búsquedas vía Google pues en ese entonces el Super Bowl LIII dónde las Águilas de Philadephia derrotaron a los Patriotas de Nueva Inglaterra.

NFL: Super Bowl 2018: Resumen y resultado de la victoria de los Eagles en  la final de la NFL | Marca.com
Super Bowl 2018

Dentro de la gráfica en esta terminología podemos notar que a diferencia de los años pasados se encuentran un número bajo de búsquedas debido a que el Super Bowl de este año se recorrió una semana por temas agregación de partidos.

*Consulta «Super Bowl« vía Google Trends realizada el 10 de febrero de 2022

Hablemos de los temas y consultas más relacionados al buscar «Super Bowl» por nuestro navegador de Google, dentro de este análisis podemos observar una búsqueda guiada a eventos pasados como 2018 y 2019 ¿Será que la gente le gusta estar informada de la historia antes de ver esta edicions?

*Consulta «Super Bowl« vía Google Trends realizada el 10 de febrero de 2022

3. «Super Bowl Tickets»

Quien quiera ir al Super Bowl deberá estar ahorrando todo el año para poder pagar su entrada y es asi como las tendencias se comportan de una manera extraña (color amarillo) para empezar a realizar sus proyecciones de cuanto pagaran por un boleto para ver a los mejores equipos de la NFL antes del evento.

*Consulta «Super Bowl Tickets» vía Google Trends realizada el 10 de febrero de 2022

2018 ha sido uno de los mejores años en dónde a las personas les ha interesado asistir al Super Bowl en relación a los demás años, ¿pero que ocurrió en 2020? vemos de que manera la tendencia es muchísimo más baja en contraste a los otros años…esta pandemia !si que pego duro!

Mientras observamos 2021 es uno de los años prometedores pues la tendencia va a la alza ¿crees que las personas hayan ahorrado lo suficiente resguardadas del COVID?

A continuación te mostramos los precios promedios de las zonas para asistir al Super Bowl LVI:

Puede ser una imagen de texto que dice "SEAT Super Bowl LVI: Cincinnati Bengals GEEK Sun Feb 13 at 3:30pm Quantity $5,474 Low prices $6,703 Best seats Inclu $6,162 $5,979 F447 $10,182 $9,345 $5,874 $14,960 $6,942 $9,719 $15,487 6,632 $8,415 $22,902 $10,413 $7,241 $12,809 RAMS 6,229 $10,182 $5,785 $9,326 $6,374 $13,115 403 $9,812 $6,959 $23, $23,141 212 $16,267 $5,193 334 $9,111 $7,868 VIP219 $15,4 From $6,556 $8,1 Section 422 listing $5,724 4110 $6,259 $5,682 View list"
Precios en USD en diferentes zonas del SoFi Stadium para el Super Bowl LVI, Fuente: Seat Geek
Puede ser una imagen de texto que dice "ACADEMY DATLAS SIMPOSIUM datlasacademy.com POWERED 24 de Febrero Miércoles 23 de Febrero Conferencias Horario del evento 2:30a7p.m DANIEL MONTOYA INNOVATION JUAN ANTONIO GONZÁLEZ HEAD OF DATA AND ANALYTICS RAGASA PANEL MAURICIO MAGDALENO DIRECTOR CLÚSTER DE TURISMO LEON LUCÍA GARZA P OSVALDO SILVA COORDINADOR DE NUEVOS PROYECTOS|U- CALLI Jueves 24 de Febrero Talleres Horario del evento 9:30 a.m. FERNANDA TREJO DENSIDAD CANAL MASIVO CÉSAR MONTEMAYOR CO-FOUNDER CBDO SORA ISAAC CARRADA PRODUCT MARKETING MANAGER PADESALADRS DESARRO MICROSOFT EVANGELISTA ECNOLOGICO CONFERENCISTAA CIBERSEGURIDAD CLOUD Adquiere tu boleto en: www.bit.ly/SimposiumDatlasAcademy umDatlasAcademy Asistencia Virtual* DATLAS® www.datlas.mx CIIA Actividad Formación Integral H IISE"

4. «Espectáculo de medio tiempo del Super Bowl»

*Consulta «Espectáculo de medio tiempo del Super Bowl» vía Google Trends realizada el 10 de febrero de 2022

Muchas personas desean disfrutar del gran espectáculo del partido…otras prefieren sólo disfrutar del espectáculo del medio tiempo pues !Vaya artistas! y es que retrocedamos un poco al pasado a 2019 dónde se presentaron Maroon Five, Travis Scott y Big Boi aquel 3 de febrero en el Mercedes-Benz Stadium dándo uno de los mejores experiencias a espectadores del Super Bowl.

Vaya congruencia con los datos que traemos pues es muy notoria la tendencia en 2019 en contraste a los años pasados y siguientes, 2022 ¿Qué esta sucediendo? ¿Será que Dr. Dre, Eminem, Snoop Dogg, Mary J. Blige y Kendrick Lamar irán a la alza o se quedarán por debajo de Maroon Five?

Watch Super Bowl 2019 halftime show: Maroon 5, Big Boi and Travis Scott  take the stage - ABC7 San Francisco
Show de medio de tiempo del Super Bowl, 2019

5. «Super Bowl vs Copa Mundial de Clubes de la FIFA vs Bad Bunny»

Si de temas de actualidad vamos a hablar aparte del Super Bowl ¿Qué tal el Mundial de Clubes? o el lanzamiento del Tour de Bad Bunny en estas últimas fechas !Que locura!

*Consulta «Super Bowl vs Copa Mundial de Clubes de la FIFA vs Bad Bunny« vía Google Trends realizada el 10 de febrero de 2022

Echémosle un vistazo a estas tendencias que han estado estos últimos 30 días en las noticias, y es que el Super Bowl sigue siendo de los eventos más buscados, seguido de un comportamiento a partir de 24 de enero con el lanzamiento del Tour 2022 de Bad Bunny y la locura de su venta de boletos en línea.

De esta manera también vemos un comportamiento relativo con el inicio de los partidos del mundial de clubes estas últimas semanas a partir del 3 de febrero, pregúntenle a su amigo regio y rayado de corazón ¿Cómo le fue? he ahí sus búsquedas para ver como quedaron sus equipos favoritos.

Hasta aquí la columna de hoy, déjanos tus comentarios acerca de esta lectura y recuerda que estamos próximos a nuestro 1er Simposium Datlas no olvides inscribirte por medio de este link: www.bit.ly/SimposiumDatlasAcademy dónde podrás conseguir tu acceso completamente GRATUITO.

Equipo Datlas

– Keep it weird –