Algoritmo de vocación de ubicación ¿Qué negocio abro en esta zona? ¿Por qué? – Columna de Investigación Datlas

A juzgar por el título, pareciera que el tema de este blog es equivalente a algo sumamente técnico y difícil de comprender, que si bien nos adentraremos en conceptos y hallazgos técnicos, intentaremos hacerlo de la manera más lenta y digerible posible, hasta llegar al punto donde alguien con conocimientos nulos en el tema, se pueda llevar varios aprendizajes interesantes.

Ejemplo de datos georeferenciados. Incrementos de COVID-19 en EUA (izquierda), y ubicaciones de KFC (derecha), con algunas de sus similitudes en círculos.

Y es que hasta este punto, sabrán que uno de los muchos servicios que ofrece Datlas como empresa de analítica, es el análisis espacial, o análisis a través de puntos georeferenciados, que en español, no es más que el análisis a partir de datos que podemos ver en un mapa. Un ejemplo de datos georeferenciados es la imagen anterior, podemos ver los casos de COVID con su % de cambio, o las ubicaciones de locales de KFC del lado derecho, sin embargo, los datos georeferenciados van mucho más allá, podemos ver el tráfico de la ruta que tomamos al trabajo, las zonas más seguras de una ciudad, o los usuarios de alguna red social como instagram o facebook según sus preferencias.

** También te puede interesar leer nuestra columna: Análisis de Detección de Incendios y Vegetación : Caso de Uso Sierra de Santiago, Nuevo León, México – Manuales Datlas

Antes de pasar a lo que serían los varios casos de uso donde hemos logrado hallazgos interesantes a partir de datos georeferenciados, o lo que propone la división de R&D de Datlas, hay que introducir un concepto muy importante que hasta forma parte del título de esta columna: los polígonos.

Los choques y siniestros representados como puntos (izquierda), las líneas que dividen cada código postal (medio), y códigos postales (derecha).

Como hemos visto, es fácil imaginar los ejemplos del párrafo anterior como puntos en un mapa, pero no todos los datos espaciales se comportan como tal. Así como podemos ver un dato como un punto, que no es más que un dato cualquiera con coordendadas (como lo son los choques y siniestros en mty), también podemos ver datos que forman por completo una línea (las calles que dividen los códigos postales), o polígonos (el área que cubren los códigos postales coloreados por incidencia de choques).

** También te puede interesar leer nuestra columna: No te sientes al frente si vas en un carro blanco por gonzalitos (Caso de ANÁLISIS DE CHOQUES PARA NUEVO LEÓN, MÉXICO)

Es a partir de estos polígonos como nosotros muchas veces llegamos a hallazgos muy interesantes, pues ya sea que podamos dividir un mapa por AGEBs, códigos postales, municipios, o estados, entre otros, podemos llenar este mismo mapa con bases de datos que ya tienen estas variables, si no me creen, ¿no se les viene a la mente las veces que les han preguntado su código postal o municipio en una encuesta?, (sin contar las veces que nuestro celular recopila esta información sin preguntarnos), y ¿qué se puede hacer con esta información? Pues la respuesta está en los ejemplos siguientes. Todas las capas a continuación son elaboradas por el equipo de Datlas, y contamos con un mapa demo donde podrán utilizar algunas de ellas de manera gratuita.

Caso número 1: Nivel Socioecónómico (NSE)

Mapa de Datlas que incluye los 7 NSE (AB, C+, C,…, E), siendo AB el más alto (con mejor calidad de vida).

Ya existe un blog al respecto donde vemos cómo se puede dividir la calidad de vida en 7 niveles, que significa cada uno y que perspectiva nos da de la desigualdad del país a partir de una cifra llamada Nivel Socioeconómico, sin embargo, ahí solo hacemos una pequeña mención a la capa que tiene Datlas del NSE, y no tanto al análisis que podemos obtener a partir de esta.

** También te puede interesar leer nuestra columna: «La clase media: Los que no son pobres ni son Carlos Slim» ¿En realidad existe la clase media? (Una revisión de desigualdad social en México y niveles socioeconómicos para Nuevo León)

Gracias a que sabemos el contexto social que viven las personas en las diferentes zonas de una ciudad, podríamos generar las siguientes hipótesis:

  • La mayoría de mis clientes son de cierto NSE.
  • Puedo segmentar mis promociones según el poder adquisitivo de la zona y hacer más ventas.
  • Cierto NSE impide la entrada a más competencia.
  • Existen más negocios de cierto giro en cierto NSE.
  • Si mi punto de venta o local se encuentra en cierto NSE, se incrementa en cierto % mis ventas.

O si bien queremos comparar como nos afecta cierta competencia ya sea para bien o para mal a nuestro negocio, podríamos hacer un sencillo ejercicio de A/B testing, donde escogemos dos zonas, una con mucha competencia, y otra con poca, pero que ambas zonas estén en el mismo NSE. De esta manera bajo el supuesto de que los clientes tienen preferencias de consumo muy parecidads, podríamos repetir varias veces el ejercicio y llegar a la conclusión de que las zonas con mayor competencia afectan de cierta manera a nuestro negocio.

Caso número 2: Polígonos urbanos por categoría social

Capa de Datlas de polígonos urbanos por categoría social

Esta capa al igual que muchas hechas por Datlas, busca ver el contexto social de cierta zona de interés en cualquier parte de la república. Sin embargo, ahora nuestro objetivo no es conocer el poder adquisitivo de la zona o su calidad de vida, más bien, la categoría social de los habitantes. Si nosotros como buenos conocedores de nuestro negocio sabemos que la mayoría de nuestros clientes son niños, padres de familia, solteros, o adultos mayores, podríamos mapear el porcentaje de cada uno de ellos según nuestra zona de interés.

De esta manera podríamos generar las siguientes hipótesis:

  • La mayoría de mis ventas son empleadas en cierta categoría social.
  • La mayoría de mis clientes se ubican en zonas con niños a pesar de que nuestro negocio no es para niños.
  • Un barrio familiar, pero cerca de un barrio donde en su mayoría hay solteros, no vende igual que uno familiar cerca de uno donde la mayoría hay adultos mayores.
  • Si mi punto de venta o local se encuentra en cierta categoría social, se incrementa en cierto % mis ventas.

Caso número 3: Uso de suelo habitacional

Capa de Datlas de polígonos urbanos por uso de suelo habitacional

Nuestro tercer caso de uso de polígonos de vocación es de nuestros favoritos, pues de igualmanera nos da un contexto enorme de dónde se ubican nuestros locales o puntos de venta, gracias a que nos dice si los establecimientos en un polígono son en su mayoría comerciales, escolares, industriales, residenciales, o de usos mixtos.

De esta manera podríamos generar las siguientes hipótesis:

  • La mayoría de mis ventas son empleadas en cierta giro de negocio.
  • Abrir un local donde el barrio es en su mayoría comercial, es mucho más difícil que en uno residencial.
  • Si mi punto de venta o local se encuentra en cierta categoría de uso habitacional, se incrementa en cierto % mis ventas.

Anexos

Herramientas del mapa

Fuera de lo que se puede lograr con solo ver los mapas de Datlas a simple vista, las diferentes herramientas de nuestra plataforma, permiten descargar la información en un excel de lo que serían diferentes fuentes de información para nuestro análisis.

Las herramientas pueden ser la selección de polígonos de interés con ciertas figuras predeterminadas o una que nosotros de manera personalizada eligamos de que parte del mapa queremos descargar dicha información. Así como utilizar otra base de mapas, obtener distancas, o navegar por el street view de nuestras zonas de interés.

Estadística espacial

Para la creación de algunas capas se utilizaron cálculos de estadística descriptiva a partir de los datos hechos por la encuesta del Censo 2020 del INEGI, entre muchas otras fuentes de datos privados y públicos. Sin embargo, existen diferentes enfoques de análisis espacial muy sonados como son la autocorrelación espacial, que nos dice que si un polígono es de cierto NSE o tiene tantos crímenes reportados (una variable de interés), los polígonos vecinos tienen cierta probabilidad de ser de un NSE parecido o tener una cantidad de crímenes parecidos.

Si están familiarizados con las regresiones lineales y parecidos, existen modelos estadísticos como el GWR (Geographically Weighted Regression), que tienen en común una matriz de vecinos inmediatos. Esta matriz nos dice si un polígono es vecino de otro, y gracias a ella podemos asumir que el error se distribuye iid a pesar de la autocorrelación espacial.

Hasta aquí la columna de hoy, si esto les despertó al menos un poco de interés, existe mucha literatura de lo que se ha logrado gracias al análisis espacial. Les recordamos que contamos con las capas mencionadas en este blog, más otras igual de interesantes o personalizadas, y existe una versión demo donde podrán jugar con algunas de ellas.


Equipo Datlas

– Keep it weird-

Deja una respuesta

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Salir /  Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Salir /  Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Salir /  Cambiar )

Conectando a %s

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.