¿QUÉ ES UN SHAPEFILE Y PARA QUE SIRVE? – INVESTIGACIÓN DATLAS

En Datlas nos especializamos en brindarles a nuestros clientes las mejores opciones para transformar sus datos en decisiones inteligentes, para ello tenemos una oferta grande de soluciones. Los tableros de inteligencia que ofrecemos son muy buenos en explicar los datos, mediante el uso de visuales podemos detectar tendencias y producir hallazgos. Por otro lado, tenemos el uso de Mapas, estos facilitan la interpretación de los datos que están georreferenciados.

Si quieres conocer mas acercaa de los Tableros de Inteligencia, te invitamos a leer «Dashboards de negocios, guía para principiantes – MANUALES DATLAS»

¿Que tienen de especial los mapas en Datlas?

El uso de nuestros mapas resuelve muchos de los retos actuales que tienen los negocios. Desde mapas de expansión comercial, hasta mapas que integran información de ventas de tu negocio.

Una de las solicitudes que hemos atendido es la de integrar distintos tipos de información georreferenciada al mismo mapa. Esto tiene como objetivo crear un mapa con toda la información que se necesita, logrando así un mapa completamente personalizado.

La solución tecnológica para poder integrar múltiples fuentes y múltiples tipos de datos a un solo mapa se atiende de múltiples maneras. Antes hemos hablado de que es un “Geohash” o para que sirve un “AGEB”, pero en esta columna queremos platicarles de que es un Shapefile, de que se conforma, cuál es su utilidad y de cómo podemos crear uno nosotros.

Te invitamos a leer las siguientes columnas para conocer mas de geohash y AGEBs.

¿QUÉ ES UN AGEB Y PARA QUE SIRVE? – INVESTIGACIÓN DATLAS

¿QUÉ ES UN GEOHASH Y PARA QUE SIRVE? – INVESTIGACIÓN DATLAS

¿Qué es la georreferenciación?

Esta es una técnica de posicionamiento espacial donde ubicamos en el mapa un objeto.

Si nos queremos poner técnicos, la georreferenciación es el posicionamiento espacial de una entidad en una localización geográfica única y bien definida mediante el uso de un sistema de coordenadas y datum específicos.

Todo esto se traduce en poner un punto en el mapa.

¿Qué encontramos en un Mapa?

Cualquier mapa que utilicemos desde Google maps hasta algún mapa viejo en papel tiene información desplegada. Toda esta información se encuentra en el mapa tomando alguna forma, esta puede ser un punto, línea o un polígono.

Puntos

Los puntos son objetos que no tienen ninguna dimensión, solo están ubicados dentro del mapa, pero tienen cero “volumen”, estos tienen a ser usados para representar mucha de la información y sin duda alguna es el tipo más común que encontramos en la mayoría de los mapas.

Uno uso común de los puntos es marcar la ubicación de un negocio, parque, centro comercial, etc. Estos lugares sin duda tienen un espacio o un “volumen” en tres dimensiones, pero para fines de simpleza, tienden a ser representados con un solo punto en el centro de su ubicación.

Por ejemplo, en esta captura de pantalla de Google Maps, encontramos al parque fundidora de la ciudad de Monterrey como un solo punto, al centro del parque.

Líneas

El segundo tipo que tocaremos será las líneas, para ello podemos pensar en la silueta o contorno de un lugar. Las líneas tienen un mundo de usos, uno de los más comunes es colocar los niveles topográficos del lugar. En algunos mapas también pueden ser usadas para desplegar información como calles, líneas de metro, límites territoriales, etc.

Polígonos

El polígono tiene la función de formar objetos en 2 dimensiones, en Datlas los utilizamos para delimitar una zona del mapa y agrupar sus características.

Por ejemplo, en esta imagen tenemos algunos polígonos de la Ciudad de Monterrey del mapa demo Datlas.

Trabajando con Múltiples Tipos

Cuando desarrollamos un proyecto nuevo en Datlas, es normal tener múltiples tipos de datos, así como múltiples fuentes.

Al tener todos estos datos georreferenciados, podemos colocarlos en el mismo mapa sin importar de que tipo sean.

Para eso trabajamos con nuestro habilitadores tecnológicos de GIS (geographic information system) que nos permiten procesar la información para colocarla en el mapa.

Nuestro software favorito tiene el nombre de QGIS.

Este es un software libre y de código abierto (open source) que habilita a nuestro equipo de manera importante para hacer procesamientos geoespaciales.

URL: https://www.qgis.org/en/site/index.html

Al trabajar con este tipo de programas podemos hacer uso de múltiples tipos de datos y de distintos formatos.

Lo que nos lleva al famoso SHAPEFILE. Este es un tipo de formato que nos permite trabajar con información georreferenciada ya sean puntos, líneas, polígonos, entre otros.

¿Qué es un Shapefile?

Un shapefile es un formato, así como tus imágenes tiene “.jpg” o tu documento de Word tiene “.docx” los shapefiles o comúnmente abreviados como “shp” son formatos de vectores geoespaciales de datos para el uso de software GIS.

Este formato de shapefile fue desarrollado y es regulado por ESRI como un estándar abierto para la interoperabilidad entre ESRI y distintos softwares de GIS.

Ahora para confundirte:

Cuando decimos “Shapefile” podemos estar diciendo dos cosas distintas. En la industria estas dos cosas tienen el mismo nombre, pero no te preocupes, aquí te decimos por qué y cuáles son las diferencias.

El primero y el que es técnicamente correcto es nombrar “shapefile” al archivo que termina en “.shp”, este es un solo archivo que tiene las características de la geometría de tus puntos, líneas o polígonos.

El problema aquí es que un archivo .shp no puede ser utilizado por sí mismo, tiene que ir acompañado de otros archivos con terminaciones .shx, .prj & .dbf.

Y he allí la confusión, como requerimos de mínimo estos cuatro archivos juntos para poder hacer uso de la información que almacenan, también se conoce como “shapefile” al conjunto de archivos que trabajan juntos para desplegar información en un sistema de información geográfica (GIS).

Mas adelante exploraremos cuales son las funciones de los otros tres archivos necesarios y de todos los otros que pueden acompañar a nuestro “shapefile” que son opcionales.

¿Cueles son los formatos que conforman un Shapefile?

De ahora en adelante llamaremos al conjunto de archivos que trabajan juntos para desplegar la información como “shapefile”.

Sin duda al trabajar con este tipo de documentos y sistemas por primera vez surge la duda de cómo hacer que funcione, por lo general al hacer uso de un archivo solo hacemos clic en él y si tenemos el programa adecuado, este se abre.

Para que un shapefile funcione de manera adecuada solo tenemos que asegurarnos de que todos los archivos que conforman un shapefile tengan el mismo nombre y estén en el mismo directorio o carpeta.

Por ejemplo, si tengo un shapefile que almacena información de un punto de interés se vería de esta manera en mi computadora.

Al importar estos archivos al QGIS o software de sistema de información geográfica de tu preferencia, se desplegará la información de manera adecuada y sin errores.

¿Qué función tienen los archivos que conforman un Shapefile?

Como lo mencionamos antes, un .shp se acompaña de 3 archivos indispensables para su correcto funcionamiento.

Estos son .dbf, .shx y .prj y su función es la que sigue:

.shp

Formato de la forma o, en otras palabras, almacena la geometría.

.shx

Almacena la indexación o forma del índice de la geometría, permitiendo su consulta en ambas direcciones del índice

.dbf

Almacena los atributos de formato, para cada figura del archivo.

.prj

Dentro de este archivo se encuentra la información sobre la proyección de la información. En sí, este archivo tiene los datos necesarios para georreferenciar el shapefile.

¿Qué otros archivos pueden acompañar un Shapefile?

Existen otra serie de archivos que pueden o no acompañar a los 4 esenciales, estos le agregan funciones o atributos al shapefiles.

Algunos de estos archivos son:

.sbn & .sbx

Indexación espacial de los atributos.

.fbn  & .fbx

Indexación espacial de los atributos, con la diferencia de que es solo para la lectura y no se pueden modificar.

.shp.xml (pegado)

Metadatos geoespaciales en formato .xml.

Existen muchos otros tipos de formatos de archivos que se pueden agregar a un shapefile, pero con esta introducción es más que suficiente para empezar a hacer uso de tus propios datos.

¿Dónde empezar?

La barrera de entrada para hacer uso de esta tecnología es baja, si tienes una computadora y puedes descargar información de internet, tienes todo lo que necesitas.

Empieza descargando QGIS desde https://www.qgis.org/es/site/ y utilízalo como tu software para procesamiento de información geográfica, este está disponible para Mac, Windows & Linux. Es seguro y gratuito.

Accede a la documentación en https://docs.qgis.org/3.22/es/docs/user_manual/ para familiarizarte con el programa.

¿Y los datos?

¿Qué crees?, no te tienes que preocupar por encontrar algunos shapefiles. Existe un mundo de información muy accesible y completamente gratuita que es generada por gobiernos, ONGs y entusiastas del mundo de los datos.

Te recomendamos usar tu motor de búsqueda al que más confianza le tengas (para mí: duckduckgo.com) y busques los shapefiles que más te llamen la atención.


Hasta aqui la columna de hoy ¿Qué otras aplicaciones has escuchado para los shapefiles? Únete a la conversación en @DatlasMX y aprende más del tema en Datlas Academy.

Equipo Datlas

– Keep it weird-

¿Qué son los ISÓCRONAS y para qué sirven? – Investigación Datlas

Alguna vez te has puesto a pensar ¿Qué tan bien esta desarrollada una ciudad para movilizarse en ella? Ya sea por medio de transporte, auto, moto, bicicleta, etc. En este blog te explicaremos a detalle desde dónde parte un mapa de Isócronas, qué es, algunos casos de uso y recomendaciones.

Te ponemos un ejemplo para que entiendas mejor…¿Conoces la Ciudad de La Plata en Argentina? esta ciudad es la capital de la Provincia de Buenos Aires la cual es una de las mejores urbanizadas y diseñadas para una fácil transportación.

Estaremos analizando una de las mejores ciudades desarrolladas vs una de las peores para que entendamos más el concepto del mapa de Isócronas.

Ciudad de La Plata Argentina, una de las Ciudades en el mundo con mejor planificación urbana

¿Qué es un Isócrona?

Un mapa de Isócronas nos sirve para identificar las distancias de un punto (epicentro) ya sea una ciudad o región en dónde nos muestre los tiempos de recorrido analizando las rutas de acceso del destino en su mayoría con mapas de calor.

El mapa Isócrona nos ayudan a planificar una ciudad o región de una mejor manera para el futuro de crecimiento urbano, en el programa el cual se desarrolla QGIS podemos hacer las simulaciones con traslados para peatones, bicicletas, autobuses, automóviles, entre otros vehículos.

** Te puede interesar leer nuestro blog sobre: https://blogdatlas.wordpress.com/2021/05/16/como-hacer-isocronas-en-qgis-manuales-datlas/

Entendiendo la composición de un Isócrona

A veces nos cuesta mucho entender un mapa de Isócronas, y es que el objetivo de esta columna es que no te vayas con ninguna duda, te daremos las suficientes herramientas para entender y desarrollar Isócronas de manera autónoma.

Un mapa de Isócrona se compone de:

Fuente: https://geoestrategias.com.mx/blog/2020/09/15/que-son-las-isocronas/

Caso de Uso utilizando QGIS para desarrollar mapas de Isócrona

El equipo Datlas se dio a la tarea de desarrollar un caso de uso por medio de QGIS plataforma la cual nos da a la vanguardia de crear mapas de Isócronas, durante este ejercicio investigamos las ciudades mejores planificadas vs las peores planificadas.

Esto es lo que estuvimos desarrollando:

1- Seleccionamos un radio de 10 km en la Ciudad de La Plata en Argentina a un lado de Buenos Aires, es considerada como una de las Ciudades mejor desarrolladas de manera urbana. Para ello utilizamos nuestro mapa de inteligencia para medir las distancias desde un epicentro hasta la extensión de 10 kilómetros.

Fuente: Vía Datlas, mapas de inteligencia.

2- Vía QGIS hacemos una simulación por medio de traslados de automóviles y encendemos la Ciudad de La Plata con Isócronas las cuales nos indican los tiempos de recorridos hacia el epicentro del mapa, es interesante como la Ciudad conectan algunos puntos por su planificación bien efectuada y los tiempos de camino son considerables.

Te dejamos el análisis de Isócronas de una de las Ciudades mejores planificadas en la próxima lámina ¿Qué oportunidades de negocios, gobiernos, escuelas, transporte podemos aprovechar?

Fuente: Vía Datlas, metodología propia por medio de QGIS.

3- Así como esta lo bonito de un cuento siempre esta el lado oscuro y es que te traemos a la mesa una de las peores Ciudades planificadas y que siempre esta en constante crecimiento, sus caminos son muy diferentes a la Ciudad de La Plata.

Fuente: Vía Datlas, mapas de inteligencia.

4- Por este lado la Ciudad de Jakarta aplicada con mapa de Isócronas, la simulación muestra una gran diferencia de esparcimiento de tiempos entre los 10 y 20 minutos para llegar al epicentro con una distancia de 10 km como radio.

¿Interesante no? ¿Qué otra Ciudad o región del mundo se te ocurre aplicar algo similar?

Fuente: Vía Datlas, metodología propia por medio de QGIS.

Conclusión y recomendación

Ahora que somos expertos en análisis de mapas por Isócronas, lo que este blog nos ha destacado de ellos, para que nos sirven, lo que lo componen y sabemos aplicar un caso de uso por medio de QGIS nos suena interesante consultar esta información a detalle para posicionarnos de una mejor manera en el mercado, tomando decisiones inteligentes.

¿Qué te parece complementarlo con nuestros mapas de inteligencia que reúne datos de negocios, niveles socioeconómicos, población y más? Te compartimos uno de nuestros mapas de inteligencia que desarrollamos actualmente en Datlas que tienen como finalidad comercializar, expandir y capitalizar la región que deseemos con algunos clics y el acompañamiento personalizado.

Fuente: Vía Datlas, mapas de inteligencia.

¿Qué esperas para registrarte y probar nuestro DEMO gratis? También conoce DATLAS ACADEMY

Equipo Datlas

– Keep it weird-

¡NEOLEONESES SE QUEDAN SIN OTRA PRESA, MÁS! – Columna de Investigación Datlas

El agua para los habitantes de Nuevo León y la mayoría de las Entidades del país han dado mucho de que hablar en los últimos meses a partir de la sequía que se ha estado viviendo en el país a causa de las altas temperaturas.

Durante este blog te platicaremos acerca de este desabasto de agua que han estado experimentando los neoleoneses en México, Nuevo León y sus presas a causa de esta sequía interminable.

*** Te puede interesar: ¿Escacez de agua en NL? Por dónde empezar

¿Pero que tanto es tantito?

Como lo habíamos comentado anteriormente el país esta pasando por una sequía que ha causado grandes afectaciones a los Estados del Norte en su mayoría a Baja California, Norte, Sinaloa, Chihuahua, Coahuila, Nuevo León y Tamaulipas

A continuación te mostraremos un monitor de la República por parte de la CONAGUA el cual tiene diferentes indicadores para medir la sequía en los Estados del país;

  • Sin sequía
  • Anormalmente seco
  • Sequía moderada
  • Sequía severa
  • Sequía extrema
  • Sequía expecional

¿Encontraste tu Estado? ¿Mucho calor verdad?


Monitor de sequía de México al 30 de junio de 2022 emitido por CONAGUA
image-7

¿De verdad creíste que esta ha sido de las peores sequías que has vivido actualmente en México?

Porcentaje de área afectada con sequía en México al 2022 emitido por CONAGUA

Déjanos decirte que en el 2012 se vivió con una de las peores sequías en todo el país en comparación del año actual, ¿Apoco te quedaste sin agua en 2012? contamos con un incremento pequeño desde el 2021 hasta ahora en día en 2022.

image-8

Si todos somos parte del mismo problema todos somos parte de la solu… ¡¿Pero por que no nos duran las presas?!

Anteriormente en Nuevo León, este mismo año a sólo algunos meses de comenzar con el intenso calor en la región la extinción de una de las presas que suministraba agua para todo los neoloneses con más de 40 millones de metros cúbicos de agua lamentablemente la perdimos

** También te puede interesar: Monitoreo de impacto ambiental

Ahora OTRA de las presas que también suministraba agua a las familias de los neoloneses la han descuidado y perdido, pues poco cerca de los 29.250 millones de metros cúbicos de agua, se han agotado y la presa ya no cuenta con capacidad mínima para suministrar a las familias

image-9

Análisis Presa Cierro Prieto, Nuevo León ANTES-DESPÚES

Es interesante como hemos contado esta historia de principio a fin para hacer el siguiente desenlace de esta investigación, a continuación daremos un zoom al municipio de Linares dónde se encuentra la Presa Cierro Prieto desde FEBRERO 2022 vs JULIO 2022

Video Análisis por medio de Plataforma Landviewer con imágenes satélites recientes capturas a la Presa Cierro Prieto en Nuevo León

Datos Importantes a Analizar Presa Cerro Prieto en Linares Nuevo León

La Presa Cierro Prieto es literalmente una de las más importantes en Nuevo León

  • La Presa Cierro Prieto es literalmente una de las más importantes en Nuevo León la cual suministra agua a los neoleoneses después de cierre de la Presa la Boca
  • Cuenta con una capacidad máxima para 300 millones de metros cúbicos de agua
  • Actualmente sólo tiene 0.077 millones de metros cúbicos de almacenamiento
  • Estamos hablando de un llenado de aproximadamente 0.48%
  • Aportando 0.104 litros por segundo

Fuente: https://www.eleconomista.com.mx/estados/A-punto-de-extinguirse-el-suministro-de-la-presa-de-Cerro-Prieto-Juan-Ignacio-Barragan-20220711-0039.html

Captura de LandViewer con imágenes satélites recientes capturas a la Presa Cierro Prieto en Nuevo León FEBRERO 2022 vs JULIO 2022

Esta columna es resultado de todas las capacidades investigación que hay en el presente, donde utilizamos herramientas de analítica avanzada para compartir aprendizajes que generen valor y crezca este ecosistema como lo hemos hecho en anteriores ocasiones, HOY el agua en este país es un tema muy importante de que hablar y el como podemos tomar nuestra próxima decisión para seguir cuidándola es la clave.

*** Te puede interesar: Detección de incendios

Hasta aquí la columna de hoy, si disfrutas de la lectura de esta investigación cada semana te tenemos una diferentes para tí, escríbenos y sigue formando parte de este ecosistema de datos.

image-10

Equipo Datlas

Keep it weird

Implementando la Gestión del Cambio en tu empresa – MANUAL DATLAS

Se habla mucho de nuevos métodos de trabajo e inteligencia artificial que facilitan los procesos, sin embargo implementar estos métodos y capacitar al personal para utilizar este tipo de tecnología no es tan sencillo como adquirir un refresco en la máquina de auto venta.

En este blog te explicamos que es la gestión del cambio y cómo se lleva a cabo en las empresas.

¿Qué es la gestión del cambio?

La gestión del cambio es el proceso de gestionar su organización a medida que cambia. En general, el proceso de gestión del cambio prepara todo lo necesario para pasar a un nuevo cambio, reúne el apoyo de la organización para el cambio en cuestión y lo implementa de manera oportuna.
Lo más importante en la gestión del cambio es ser consciente y abordar estos cambios desde diferentes perspectivas. Antes de realizar cualquier cambio en su organización, piense en su impacto en los diferentes niveles y miembros de la organización de su equipo. Por esta razón, los métodos de cambio generalmente permiten la implementación gradual de cambios entre equipos a lo largo del tiempo, pruebas en partes de la organización o confirmación de la aprobación de las partes interesadas antes de lanzar una nueva iniciativa. Incluye estrategias para hacer.
La gestión del cambio es tanto un proceso como una metodología. Probablemente no haya pasado demasiado tiempo pensando en cómo implementar una iniciativa de cambio. Y eso está bien. Al seguir el proceso de gestión de cambios, puede preparar mejor a su equipo y organización para asegurarse de que los nuevos cambios beneficien a todos.

Metodología ADKAR 

Introducido por Jeff Hiatt, ADKAR (Awareness, Desire, Knowledge, Ability and Reinforcement) es un modelo de gestión del cambio para ayudar a los empleados a guiarlos a través del proceso de cambio dentro de una organización. ADKAR está destinado a ayudar a las organizaciones a realizar cambios sensibles, identificar los desafíos asociados y planificar el éxito de dichos cambios.

¿Qué tipo de cambios organizacionales hay?

Sobra decir que las empresas realizan cambios, ajustes e innovaciones a diario, por lo que por razones prácticas se aprecian mejoras en el proceso. Sin embargo, algunas conversiones son tan serias que debe pasar por este proceso.


Cambios estructurales
Estas son transformaciones que abarcan toda la arquitectura empresarial y el nivel de jerarquía y requieren nuevas estrategias y objetivos. Este es el caso, por ejemplo, de nuevas culturas, formatos lingüísticos, modelos de gestión y, por supuesto, procesos de internacionalización que necesitan adaptarse a nuevos objetivos.


Cambios culturales
Por ejemplo, una fusión, adquisición o cambio de directorio de una empresa puede representar una ruptura importante con la cultura organizacional a la que los empleados ya están acostumbrados. Repensar la realidad de la empresa y del mercado afecta el comportamiento de todos los involucrados y cambia los valores, creencias y reglas de conducta de la empresa.


Cambios tecnológicos
Uno de los tipos de cambio más populares en la actualidad es el impulsado por la tecnología. A medida que avanzamos cada vez más rápido, cambiar los sistemas de gestión o los equipos utilizados en el lugar de trabajo puede mejorar la productividad, el ahorro de costos, la calidad y más, lo que puede tener un impacto significativo en los resultados de la organización.
De acuerdo con las pautas de gestión de cambios de ITIL (Biblioteca de infraestructura de tecnología de la información), el ciclo de vida del cambio debe administrarse para minimizar el impacto de las interrupciones en los servicios de tecnología de la información y mantener la estabilidad operativa.
cambios en la cartera de productos
Por lo general, los servicios y productos proporcionados por la empresa son el pilar. Toda la organización evita lo que se ofrece a los clientes, accionistas o gobierno. La introducción de innovaciones de productos
o los cambios en sus componentes reflejan muchas de las implicaciones de la vida empresarial cotidiana. Toda la cadena de producción se ve afectada y requiere una gestión adecuada para evitar futuras interrupciones.

Desafíos de la gestión del cambio
Las organizaciones que crean programas de gestión del cambio desde cero a menudo enfrentan desafíos desafiantes. Además de comprender la cultura organizacional, el proceso de gestión del cambio requiere un mapeo preciso de los sistemas, las aplicaciones y las personas afectadas por el cambio. Otros desafíos de la gestión del cambio son:


Gestión de recursos:
Gestión de activos/recursos físicos, financieros, humanos, de información e intangibles. Todos ellos contribuyen a la planificación estratégica de la organización. Si esto no tiene éxito, el cambio será aún más difícil de implementar.

Resistencia:
Los gerentes y empleados más afectados por el cambio pueden resistirlo. Es común que persista la resistencia, ya que el cambio puede causar un trabajo adicional innecesario. La transparencia, la capacitación, la planificación y la paciencia pueden ayudar a reducir la resistencia.

Comunicación:
En muchos casos, las empresas no comunican constantemente las iniciativas de cambio ni involucran a los empleados en el proceso. Necesita un número razonable de mensajes para comunicar sus cambios. Involucrar a suficientes partes interesadas para transmitir el mensaje a través de múltiples canales de comunicación.

Nueva técnica:
La aplicación de nueva tecnología puede interrumpir todo el flujo de trabajo de los empleados. Si no se planifica con anticipación, los cambios se anularán. Las organizaciones pueden evitar esto mediante la creación de una red de aprendices tempranos que puedan defender las nuevas tecnologías.

Múltiples perspectivas:
En la gestión del cambio, los factores de éxito varían de una persona a otra, según su función en la organización. Esto crea el desafío de gestionar múltiples prioridades al mismo tiempo.
Problema de programación:

En Datlas decidimos si el programa de cambio se debe atender a corto o largo plazo, comprender el flujo de trabajo en las empresas a veces es complicado, sin embargo, el tener herramientas y una agenda de desarrollo alimenta la gestión del cambio

Si deseas conocer más acerca de la gestión del cambio te invito a que visites http://www.datlas.mx y revises nuestras soluciones en Consultoría en Analítica y contrates nuestros servicios para tener una mayor productividad en tu empresa.

Make it simple.

EQUIPO DATLAS

– Keep it weird-

Fuentes:
https://www.toolshero.com/change-management/adkar-model-of-change/
https://www.free-power-point-templates.com/articles/adkar-model-and-adkar-powerpoint-templates/

¿QUÉ ES UN GEOHASH Y PARA QUE SIRVE? – INVESTIGACIÓN DATLAS

La utilidad de un mapa es inmensa, estos tienen un sinfín de posibilidades.

En Datlas usamos mapas todos los días con el propósito de brindarles soluciones a nuestros clientes. En algunos casos estos mapas son hechos a la medida, mediante el servicio de personalización de plataformas que ofrecemos, estos mapas albergan la inteligencia comercial que puede hacer la diferencia en este mundo de competitividad económica.

¿Pero que tienen de especial estos mapas?

La respuesta depende de cuáles son tus necesidades, ¿Tu compañía busca expanderse mediante el modelo de franquicias?, ¿Buscan segmentar los puntos de venta? o ¿Qué tal un análisis RFM?

El punto es que el mapa que desarrollamos para ti y el que desarrollamos para otro cliente es muy diferente porque las necesidades son distintas, lo que nos lleva a que los datos georreferenciados de los mapas son distintos.

Al trabajar con un universo tan grande de información, nos topamos con datos que están georreferenciados de multiples maneras.

¿Qué es la georreferenciación?

Es una técnica de posicionamiento espacial donde ubicamos en el mapa un objeto[1].

Si nos queremos poner técnicos, la georreferenciación es el posicionamiento espacial de una entidad en una localización geográfica única y bien definida mediante el uso de un sistema de coordenadas y datum específicos.

Al final, todo esto se traduce a poner un punto en el mapa.

Tipos de georreferenciación

Ya sabemos que el mapa es la representación geográfica de un lugar y las coordenadas son la dirección para llegar a cualquiera de estos lugares.

Puntos

Un punto es un objeto de cero dimensiones ubicado en el mapa mediante las coordenadas latitud y longitud.

Estos puntos son de gran utilidad para ubicar negocios en un mapa, o los puntos de venta o incluso puntos que se mueven en el tiempo, como un auto o camión.

** Te invitamos a leer la siguiente columna: AIRBNB En la zona metropolitana de Monterrey – DATLAS COLUMNA DE INVESTIGACIÓN para ver un uso practico del analisis de puntos.

Líneas

El siguiente nivel son las líneas, podemos pensar en las líneas como un conjunto de puntos. Estas son de gran utilidad para mapear objetos como curvas de nivel para topografía, las calles de una ciudad, líneas de metro, limites municipales o de colonias, etc.

Polígonos

Por último tenemos el polígono, estos son un conjunto de líneas utilizadas para representar la superficie, son figuras geométricas irregulares que pueden ajustarse al perímetro o frontera geográfica del elemento que representan.

Multiples fuentes

Ya vimos que los datos pueden ser georreferenciados de diferentes maneras, pero también es importante considerar que cuando creamos un mapa le agregamos información de múltiples fuentes.

Estas fuentes pueden ser del orden público, como datos del INEGI u otras fuentes gubernamentales o pueden ser privados como datos propios de tu empresa.

Al agrupar datos de distintas características y de distintas fuentes se crea un reto. ¿Qué pasa cuando queremos calcular una metrica para una ubicación, cuando esta ubicación tiene datos en agregado de un municipio y de un AGEB?

Estos datos están a diferente “tamaño” uno siendo el municipio que en una zona urbana puede ser mucho más extenso que un AGEB.

** Si te interesa saber mas sobre los AGEBs y de la utilidad que proporcionan, te invitamos a leer la columna: ¿QUÉ ES UN AGEB Y PARA QUE SIRVE? – INVESTIGACIÓN DATLAS

Existen muchas técnicas para analizar los datos en estas situaciones, una de ellas es mediante el uso de geohashes.

¿Qué es un Geohash?

Un geohash es un sistema de geocódigos del dominio público creado por Gustavo Niemeyer[2] en el 2008 en donde se codifica la ubicación geográfica en un texto corto de letras y números.

¿Como se utiliza este sistema?

El mundo se divide en 32 células mediante el uso de una cuadricula, estas están diferenciadas con una letra o un número. En el caso de México, podemos ver que casi todo el país se encuentra ubicado en el geohash “9”, a excepción de Yucatán y Quintana Roo que residen en el geohash “d”.

A este nivel de resolución la utilidad de este sistema de geocodigos es limitada, pero la utilidad de este sistema incrementa al hacerle “zoom” al mapa.

El beneficio de este sistema es que se puede hacer zoom al mapa o aumentar la resolución, al hacer esto podemos ver que se van agregando dígitos al código.

Este mecanismo de aumento de resolución se puede hacer hasta tener un código de 12 dígitos lo cual representaría un cuadro geográfico de tan solo 3.7cm por 1.9cm, sin duda un espacio muy pequeño.

Para un uso más práctico, encontremos el geohash donde se encuentra el Ángel de la Independencia en la Ciudad de México a 8 y 9 niveles.

En 8 niveles podemos observar la siguiente cuadricula, donde se encuentra el Ángel de la independencia, y en el geohash azul al centro de la imagen de 9 niveles, que tan solo mide 4.80 metros por 4.80 metros.

¿Qué tamaño tienen los Geohashes?

Como definimos antes, al crecer el nivel de caracteres que tiene el código del geohash, disminuye el tamaño que representa ese espacio.

El tamaño de cada uno de los 12 niveles que encontramos en este geocódigo es el siguiente:

¿Qué beneficios tiene usar este sistema?

Existen múltiples beneficios de poner en práctica el uso de geohashes en tu organización, el primero es que dado que podemos generar códigos de un tamaño tan pequeño, es difícil que aun que nuestra base de datos de ubicaciones sea extensa, se repita la ubicación del algunos de los geohashes, esto significa que podemos utilizarlos para identificar a cada uno de nuestras ubicaciones, esto se conoce como geotagging.

Otro beneficio es el del bajo costo computacional al utilizar este sistema para hacer consultas a un geo-servidor.

Cuando hacemos consultas a un geo-servidor podemos tener una situación donde sea muy grande la carga computacional, imagínate que le pedimos al servidor que nos de todos los puntos que estén en nuestra base de datos en un área de 1km de radio de una ubicación, la consulta va a ser muy grande dado que se tienen que calcular distancias entre la ubicación y los puntos de la base de datos. Si por otro lado tenemos todos nuestros puntos geohashados podemos hacer una consulta más siempre, algo así como: Tráeme todos los puntos que estén en este geohash. ¿Quieres hace más grande el área de consulta? Entonces tráeme todos los puntos que empiecen con algunos dígitos en su geohash.

Otros dos beneficios de usar este sistema son, primero la curva de aprendizaje amigable, al leer esta coluna ya tienes los básicos para empezar a usarlo. Y por último el costo, dado que nuestro amigo Gustavo Niemeyer [@] creo este sistema y lo coloco en el dominio público es gratis.

¿Como pongo en práctica el geohashing?

Para hacer uso de este sistema primero necesitamos coordenadas, te invito a abrir una hoja en Excel y hacer las siguientes columnas, id, nombre, latitud, longitud y geohash.

Coloca el nombre de tres ubicaciones que gustes y busca sus coordenadas en Google Maps[3].

El siguiente paso es buscar el geohash de estas tres ubicaciones, para eso podemos poner en práctica nuestras habilidades de código mediante el uso de bibliotecas como “Geohash 1.0” para el lenguaje de programación Python[4].

Pero en este caso haremos uso de unas páginas de internet muy utiles, la primera: https://geohash.tools/ donde podemos colocar nuestro primer set de coordenadas.

Esta herramienta nos da como resultado el geohash a 6 niveles de nuestras coordenadas. Un poco amplio el espacio, intentemos ahora con otra herramienta, la página: https://www.movable-type.co.uk/scripts/geohash.html y coloquemos las coordenadas de nuestra segunda ubicación, en este caso solicitemos el nivel a 7 caracteres.

Y por último repitamos el ejercicio en la misma página solicitando la tercera ubicación a un nivel de 8 caracteres.

Al concluir los tres ejercicios, tu tabla debe de estar completa.

Nota como la longitud de tu geohash fue subiendo de caracteres, pero al mismo tiempo el espacio representado por cada código fue disminuyendo.

Hasta aqui la columna de hoy ¿Qué otras aplicaciones has escuchado con Geohashes? Únete a la conversación en @DatlasMX y aprende más de geohashes en Datlas Academy.

Equipo Datlas

– Keep it weird-


Referencias bibiliograficas:

[1] https://es.wikipedia.org/wiki/Georreferenciaci%C3%B3n

[2] https://web.archive.org/web/20080305223755/http://blog.labix.org/#post-85

[3] https://www.google.com/maps

[4] https://pypi.org/project/Geohash/

Estándares de calidad para Datos (Data quality standards) – Investigación Datlas

Los sistemas de datos y analítica avanzada son cada vez más complejos. Nuevas herramientas, formatos, técnicas y métodos son implementados para descifrar hallazgos de una manera más automatizada acercándonos cada vez más a la verdadera analítica prescriptiva. Además, MIT estima que una mala calidad de datos puede representar entre el 15%-25% de costos sobre los ingresos de una compañía. (Fuente: https://sloanreview.mit.edu/article/seizing-opportunity-in-data-quality/) Pero, volviendo a los fundamentales, o como dicen en inglés «Back to basics» ¿Cómo podríamos monitorear que estos procesos funcionen con calidad? ¿Cómo asegurarme que todos los proyectos de analítica en mi organización tengan un mínimo nivel de calidad?

En esta columna revisaremos los principios de calidad de los datos y compartiremos algunas prácticas básicas que en el equipo Datlas hemos aprendido durante la trayectoria de varios proyectos. Esta columna te interesará si lideras o buscas liderar iniciativas de analítica en tu organización.

I) ¿Qué son los estándares de calidad?

Según el libro de «Managing Data Quality» la calidad de los datos se puede definir como: El efecto fundamental de la calidad de los datos es que los datos correctos estén disponibles en el momento correcto para los usuarios correctos, para tomar la decisión correcta y lograr el resultado correcto. Esto se puede ampliar considerando que los datos de buena calidad son seguros, legales y se procesan de manera justa, correcta y segura .

Cuando nos referimos a calidad de datos tenemos en cuenta el método, la organización y la habilitación de sistemas que nos permitan generar una base sostenible de calidad de datos durante el tiempo

II) ¿Cuáles son los términos más importantes en calidad de datos?

  • Proveedores de datos: Los creadores de fuentes de datos
  • Recipientes de datos: Recipientes dinámicos y estáticos de fuentes de información
  • Fuentes primarias: Referencias de primera mano de información, también conocidos como los datos que provienen de la fuente original
  • Fuentes secundarias: Referencias de segunda mano, que un intermediario integro, alteró, agrego o modificó para fines de desarrollo de métricas

** También te puede interesar: «Arquitectura de proyectos de datos» . Liga: https://blogdatlas.wordpress.com/2021/02/08/arquitectura-de-proyectos-de-datos-data-warehouses-vs-data-lake-vs-data-mart-datlas-manuales/

III) ¿Cuáles son las dimensiones de calidad de los datos?

  • Que los datos no estén incompletos, es decir que el nivel de cobertura sea cercano al 100%. Ejemplo si estamos hablando de una base de datos transaccional de una gran cadena comercial ¿ A la fecha del corte, cuánta información tenemos disponible?
  • Qué existe integridad entre la relación de los datos
  • Los datos disponibles son lo más actualizados posibles. Y son vigentes para los escenarios de análisis que requiere la organización
  • Cumplimiento de la estructura de datos, de acuerdo a los parámetros establecidos. Ejemplo que todos los campos temporales sean consistentes en todo el sistema. Si se registran a nivel minuto-segundo, que así sea. Si la semana comienza en domingo, que sea así para todos los sistemas
  • Disponibilidad de los datos cuando se requieren. Es decir, que la fuente permita tener información de manera oportuna
  • Que las herramientas disponibles para registrar datos sean las correctas. Buenos métodos y registros en las unidades que el sistema lo requiere. Recomendable que existan registros de identificadores únicos
  • Finalmente, pero no menos importante, que los datos sean consistentes entre sistemas . Es decir, que entre áreas y equipos tengan los mismos estándares de consultas para que , por ejemplo, todos tengan la misma venta

IV) 10 Consejos prácticos para mantener calidad de los datos

En materia práctica ¿Qué podemos utilizar? En nuestra investigación queremos citar y complementar los consejos de Talend.

1) Hay que volver a la calidad de los datos una prioridad

2) Establece buenas métricas de calidad de datos con base a las dimensiones establecidas

3) Profundiza en investigar las fallas en la calidad de los datos

4) Invierte en entrenamiento interno

5) Establece, implementa y monitorea buenas guías de gobernanza de datos

6) Genera procesos de auditoría buscando: Bases de datos incompletos, faltantes, datos erróneos, inconsistencias, datos viejos, entre otros

7) Asigna un administrador de calidad de datos en cada departamento

8) Declara y gestiona una fuente única de referencia de datos

9) Automatiza los flujos de datos de buena calidad

10) Impulsa el uso de la nube y la cultura de trabajo colaborativo con «plantillas y glosarios» de datos

V) Sobre el ISO relacionado a la calidad de los datos

Finalmente y, en cumplimiento a los estándares con la que muchas compañías trabajan, se puede poner en práctica lo que dice el compendio «Data quality — Part 61: Data quality management: Process reference model».

** También te puede interesar: Metodologías para preparar tus bases de datos. Liga: https://blogdatlas.wordpress.com/2020/07/09/4-pasos-para-preparar-tus-bases-de-datos-para-analisis/

Hasta aqui la columna de hoy . Y tu ¿Qué prácticas de calidad de datos tienes en tu día a día o con tu equipo? ¿Quién monitorea la calidad de información y que los hallazgos en sus análisis vengan de buenas fuentes?

Comparte tu conocimiento con la comunidad en redes con @datlasmx

Ahora puedes revivir gratuitamente el SIMPOSIUM DE DATLAS ACADEMY donde tuvimos a expertas y expertos de corporativos en México charlando de sus grandes proyectos

Equipo Datlas

– Keep it weird –

Fuentes:

Análisis de Detección de Incendios y Vegetación : Caso de Uso Sierra de Santiago, Nuevo León, México – Manuales Datlas

Ante el incendio que se registro hace algunas semanas en la Sierra de Santiago en Nuevo León nos hemos dado a la tarea a desarrollar un ejercicio con una herramienta la cual permite identificar ciertos análisis de capas tales como índices de detección de incendio, vegetación, penetración atmosférica entre otros esto por medio de capturas vía satélite.

Durante este blog te presentaremos esta herramienta llamada LandViewer que nos ha ayudado a realizar este ejercicio, así como también un caso de uso el cual nos va a permitir sensibilizar la dimensión de lo qué es un incendio forestal y el cómo más de 2,000 hectáreas afectadas repercuten en la calidad de aire de una ciudad.

LandViewer – Herramienta de Análisis Satelital

Esta herramienta es una aplicación online la cuál nos permite navegar en cualquier parte del mundo y visualizar imágenes satelitales con capas como agricultura, vegetación, cobertura forestal, detección de incendios y muchas más.

Esta herramienta es creada por EOS Data Analytics y reúne imágenes por parte de los satélites Landsat-7, Landsat-8, Sentinel-2 y Modis para hacer posible cualquier tipo de análisis por medio de un interfaz en su página web.

Te puede interesar este estudio de escasez de agua en presas para Nuevo León, México:

Caso de Uso – Sierra de Santiago Nuevo León, México

¿Qué sabemos de este incendio?

El pasado 14 de marzo inicio un incendio en la Sierra de Santiago a las afueras de la Ciudad de Monterrey a causas de la poca conciencia de quemas de basura en la comunidades rurales, este incendio logro contenerse al 90% el 3 de abril afectando más de 2,000 hectáreas de vegetación.

De esta manera el interés de poder hacer un análisis por capturas satelitales surgió de un tweet por parte del Astronauta Thomas H. Marshburn el cual mostro imágenes de la Sierra Madre Oriental específicamente en la Ciudad de Monterrey.

Eso sucedió un 11 de febrero, un mes después aproximadamente se desató el incendio en la Sierra de Santiago y en Datlas nos hicimos la pregunta ¿Y por que no realizar un análisis satelital de lo sucedido en Santiago por medio de LandViewer?

Te puede interesar también ¿Cómo hacer isocronas en QGIS?

¿Qué nos permite identificar LandViewer a partir del incendio?

De primera identificamos a la Ciudad de Monterrey Nuevo León y en la parte de abajo podemos percatarnos del Municipio de Santiago, del lado derecho LandViewer nos permite activar una considerable cantidad de análisis en cuestión de vegetación, drenaje, índices de incendios y otros más.

Captura Satelital al 30 de marzo de 2022

Hallazgos LandViewer

Por medio de la capa «Penetración Atmosférica» podemos identificar la Sierra de Santiago de color azul e identificando una parte del incendio en varias marcas color rojo.

«El Índice de Diferencia Normalizada de la Vegetación o NDVI (Normalized Differential Vegetation Index) es a menudo usado para monitorear las sequías, para monitorear y predecir la producción agrícola, para ayudar a la predicción de zonas susceptibles de incendios y para los mapas de desertización.»

Así de esta manera citamos lo que LandViewer es posible identificar en la siguiente capa y es que encontramos una oportunidad de visualizar las zonas susceptibilidad de incendios en la Sierra como tal.

En la capa de nubosidad podemos visualizar la parte de abajo del mapa que la Sierra se encuentra en un tono más rojizo esto afecta tanto a su alrededor como a la Ciudad de Monterrey como tal.

Conclusión

La concientización de lo que estamos haciendo con nuestra Ciudad y el cómo podemos identificar estas áreas de oportunidad de zonas de riesgo de incendio, a partir de conocer el dimensionamiento de la vegetación en zonas rurales son oportunidades que nos dan esta y más herramientas de análisis de datos.

Afortunadamente la Sierra de Santiago estos últimos días se ha contenido y ha arrojado aire limpio, del que nuestra ciudad respira, siendo los cerros pulmones de la Ciudad que debemos cuidar con medidas de precaución y concientización.

Análisis 9 abril 2022 «Fuego Activo» vs 24 abril 2022 «Contención de Incendio». Observa la nubosidad de la ciudad con respecto a la captura más reciente con aire más limpio después de la contención.

¿Quieres aprender acerca de esta y otras herramientas de análisis de datos?

Equipo Datlas

– Keep it weird –

¿Conviene actualmente abrir una juguetería? – Caso de uso DATLAS (Especial día del niño)

La era digital ha revolucionado muchas cosas cotidianas, desde aparatos de comunicación, dispositivos de entretenimiento, el dinero, hasta medios de transporte. Sin duda vivimos en una era donde casi todo es digital y lo que no es aún, se está ideando cómo convertirlo digital, sin embargo hay cosas que no se pueden hacer 100% digitales como lo son los juguetes para niños. Muchas personas podrían pensar que las jugueterías están destinadas a extinguirse porque actualmente los niños prefieren aparatos de entretenimiento digitales. Esto puede que tenga algo de cierto si se ve a grandes rasgos y generalizando pero si nos vamos a específicos nos daremos cuenta que con el uso de los datos inteligentes una juguetería podría seguir sobreviviendo en este mundo digital.

Este blog tiene como propósito explicar cómo se utiliza la analítica y la Big Data para encontrar el mejor lugar para abrir una juguetería nueva en este caso. Nos pondremos en el papel del dueño de esta juguetería con el propósito de llegar a la máxima cantidad de familias posibles para maximizar nuestras ventas.

Utilizaremos un mapa de inteligencia propiedad de Datlas para realizar este caso. Te puede interesar este blog

Primeramente necesitaríamos las bases de datos necesarias para poder mapear, en este caso utilizaremos las siguientes:

  • Nivel Socioeconómico
  • Censo 2020
  • DENUE
  • Códigos postales
  • Categoría Social

Todas estas bases de datos estarán mapeadas delimitadas por AGEB. Si gustas conocer más de esto te puede interesar este blog

Una vez que tenemos nuestras bases de datos mapeadas empezaremos a utilizar nuestras herramientas de análisis para poder tomar la mejor decisión. Iremos paso a paso.

Paso 1: Ubicar a las familias potenciales

Utilizando los datos del CENSO podemos observar dónde son los AGEBs que tienen más personas infantes que son los «clientes» potenciales para una guardería.

Paso 2: Revisar el Nivel Socioeconómico

Con la capa de Nivel Socioeconómico podemos revisar los AGEBs con mayor o menor nivel y dependiendo de ello podemos saber el rango de precios o a qué sector de la población estaría dirigida nuestra guardería.

Paso 3: Observar la Categoría Social

Al momento de tener mapeada la categoría social de cada AGEB nos muestra que tipo de dicha categoría abunda en él, en este caso nos enfocaremos en la categoría de «Familia con Niños» que es de color verde en el mapa.

Paso 4: Activamos la capa de Códigos Postales

En este caso activamos la capa de Códigos Postales en conjunto con la capa de Categoría Social, esto con el fin de analizar cuáles son estos código postales donde existe una gran cantidad de familias con «clientes potenciales».

Paso 5: Sacamos conclusiones

Una vez observado las capaz, de hacer nuestros análisis, podemos llegar a algunas conclusiones importantes. Para fines prácticos se presentará la conclusión de cuáles son los mejores códigos postales para ubicar una juguetería actualmente.

Top 5 CP para ubicar una juguetería:

  • 67257
  • 64103
  • 66612
  • 66647
  • 64984

Se escogieron las zonas donde más abundan los «clientes potenciales» y también los CP donde existe una fácil vía de acceso para llegar a una juguetería.

A grandes rasgos así es como una juguetería podría utilizar el Big Data mediante las herramientas de DATLAS para potencializar sus ventas y seguir existiendo en este mundo cada vez más digitalizado, es un reto difícil pero no imposible. Teniendo a los datos y a la analítica de tu lado siempre irás por el camino correcto.

Equipo Datlas

– Keep it weird –

¿Qué es y para qué sirve el análisis topológico de datos? – Columna de Investigación Datlas

La generación de información es algo que ha sobrepasado límites que hace no mucho tiempo eran impensables. Para 2020, la media de información almacenada mundial en internet ha sobrepasado los 35 zetabytes (1 zetabyte = 1 billón de terabytes), lo cual ha llevado tanto a la ciencia de datos como al Big Data a convertirse en herramientas clave para conseguir el éxito de organizaciones y empresas. Sin embargo, en ocasiones, es simplemente demasiada información con la cual lidiar, por lo que el proceso de análisis y de obtención de recomendaciones basadas en datos, se vuelve más lento y contraintuitivo.

Ante esta problemática, es de esperarse que nuevas técnicas y metodologías comiencen a ver la luz conforme la tecnología avanza y el poder computacional al que somos capaces de acceder aumenta también. Entre estas nuevas técnicas, hay una que se está volviendo cada vez más relevante por sus excelentes capacidades para lidiar con grandes nubes de datos y poder extraer información de utilidad de ellas; el Análisis Topológico de Datos (o TDA por sus siglas en inglés).

Para entenderla, primero tenemos que entender qué es la topología. La topología es una rama de las matemáticas relativamente joven (nació apenas en el siglo 17), y su objetivo es el estudio de las propiedades invariantes de las figuras en el espacio… Bien, lo anterior podría no tener mucho sentido a menos que se esté un tanto familiarizado con el argot matemático, por lo que ahora, para ponerlo en términos simples, usaremos el siguiente ejemplo:

Imagina por un momento una bola típica de plastilina en tus manos, todos estamos de acuerdo en que la plastilina es un material maleable, ¿verdad? Uno puede usar esa bola para hacer distintas figuras, por ejemplo, con suficiente dedicación, podemos moldear un cubo, una pirámide u otros poliedros. En matemáticas, al acto de moldear esas figuritas de plastilina, le llamamos transformación. Bueno, con esto en mente, podemos decir que una bola de plastilina es topológicamente equivalente a un cubo de la misma plastilina, puesto que podemos formar uno a partir del otro. Sin embargo, tenemos una sola regla: No se puede romper la plastilina ni se le pueden hacer hoyos. Entonces, las preguntas que se haría un topólogo sobre la plastilina son: ¿Qué es lo que hace que podamos formar un cubo a partir de una esfera? ¿o viceversa? ¿Qué aspectos de la figura siguen igual a pesar de aplicarle una transformación?

Para un topólogo, un circulo es lo mismo que una elipse, una esfera es lo mismo que un cubo, y se aplica un razonamiento similar para otras figuras. Incluso, existe un chiste un tanto popular entre matemáticos, que dice que un topólogo no puede distinguir entre una taza de café y una dona.

Ahora bien, volviendo al punto principal. ¿Qué tienen que ver las figuras de plastilina con el análisis de datos?

Si nosotros tomamos una figura y colocamos dos puntos cualesquiera sobre ella, esos puntos van a estar a cierta distancia uno del otro, ¿cierto? Por ejemplo, la distancia del trabajo a casa es un ejemplo de colocar dos puntos sobre una esfera (la tierra). Pero, ¿Qué pasa con esa distancia si la figura original se deforma siguiendo la única regla de la topología? Pues evidentemente, dependiendo de la transformación, esa distancia puede hacerse mas grande o más pequeña. Por ejemplo, si La Tierra fuera de plastilina, y la convirtiéramos en otra figura, entonces la distancia entre la casa y el trabajo evidentemente cambiaría, ¿verdad?

Bueno, el ejemplo anterior fue solamente utilizando dos puntos, la casa, y el trabajo. Pero ahora imagina una base de datos gigantesca, con millones de puntos, como las que empresas como Facebook o Google generan todos los días. ¿Esos puntos sobre qué figura están? La respuesta es muy simple, están sobre el plano cartesiano en algo que los matemáticos llamamos Rn (R a la n potencia)  . Es decir, en el espacio. Como recordaremos de la secundaría, el plano cartesiano es algo así para 2 y 3 dimensiones.

Entonces, aplicando lo que hemos aprendido, si yo tomara el plano cartesiano y lo deformo, ¿Qué les sucede a los puntos que están sobre él? Evidentemente la distancia entre ellos cambia y puntos que estarían lejos entre sí, ahora puede que estén más cerca, u otras cosas muy interesantes pueden pasar.

Además, recordemos que muchos métodos de clasificación utilizan la “distancia” como forma de afirmar si existe una similitud fuerte o no entre varias observaciones. Por lo tanto, si deformamos el plano de forma correcta, es posible que podamos encontrar patrones en los datos que de otra forma estarían ocultos para nosotros y para nuestros algoritmos. Entonces, estas nubes enormes de datos pueden ser subdivididas en clústeres más pequeños y cada uno de estos, ser unido con sus vecinos en relación con la distancia que exista entre ellos, formando así, lo que en topología conocemos como complejos simpliciales.

El TDA definitivamente es mucho más complicado matemáticamente hablando, sin embargo, es una herramienta muy poderosa que está siendo desarrollada para facilitar el trabajo con grandes cantidades de datos.

¿Quieres aprender acerca de esta y otras técnicas innovadoras de análisis de datos?

Equipo Datlas

– Keep it weird –

Referencias:

Carlsson, G.: Topology and Data., Bulletin of the American Mathematical Society no. 46 (2009) 255–308.

Eaton, C., Deroos, D., Deutsch, T., Lapis, G., Zikopoulos, P.: Understanding Big Data. Analytics for enterprise class Hadoop and Streaming Data, The McGraw Hill Companies, 2012

Kahle, M.: Random geometric complexes., Discrete and Computational Geometry 45 no. 3 (2011).

San Valentin Geográfico para Nuevo León ¿Dónde hay más Casad@s y Solter@s? – Columna de Investigación DATLAS

Es día de San Valentin. Una festividad que, al menos en México , se celebra cada 14 de Febrero y nos hace recordar el amor en las parejas. Y aunque no solamente se tiene/debe expresar un día el año, es importante traer a la mesa su significado. Los Institutos estadísticos de los países, por reglas oficiales, cuantifican la cantidad de Población soltera, casada, separada y/ viuda en sus censos. En este blog tomaremos esas y otras estadísticas para compartir algunos hallazgos para el Estado Norteño de Nuevo León, México

Nuevo León es un Estado donde se cuantifican poco más de 5M de habitantes en sus zonas urbanas.  Particularmente en este Estado, en contraste con México en general, habitan más hombres que mujeres.

En cuanto a las estadísticas básicas, y cuando hablamos de personas de 12 y más años de edad, nos encontramos con que la mayoría de sus habitantes están Casados. Después la categoría de solteros y finalmente Separados y/o Viudos.

En términos comparables, y para el resto del ejercicio, usamos una base de 1000 habitantes para generar los siguientes indicadores:

556 personas por cada mil están casadas. 334 por cada mil están solteras y 110 por cada mil están viúdas o separadas

A Niveles Totales

Generamos una tabla de datos para 3 condiciones: Solteras, Casados y/o Separados-Viudos. En esta imagen el ordenamiento es por casados.

Top Municipios por Casados

Municipios a las afueras de la zona metropolitana es donde se excede por 100 personas, aproximadamente, el nivel a nivel Estatal de Población Casada.

Top Municipios por Solteras

Podemos «rankear» los municipios por orden de personas solteras. San Pedro y San Nicolás son las zonas con más solteros mayores de 12 años, según datos del CENSO INEGI 2020

Top Municipios por Separados y/o Viudos

Finalmente, de Separados y Viudos, algunas zonas también a las afueras de la ciudad

A nivel Suburbio (AGEB)

Top Suburbios por Población Casada

Top Suburbios por Población Soltera

Top Suburbios por Población Separada y/o Viuda

Para el cierre, revisamos la fuente «Exploding Topics» registramos que «autoamor» o «self-love» es de lo más revisado

Hasta aqui la columna de hoy . ¿Qué te parecieron las imágenes de nuestros mapas? ¿Ya ubicaste dónde dar serenata? Cuéntanos cómo la pasarás este día en nuestras redes @DatlasMX y si encuentras algún otro dato interesante

Equipo Datlas

– Keep it weird-