¿QUÉ ES UN GEOHASH Y PARA QUE SIRVE? – INVESTIGACIÓN DATLAS

La utilidad de un mapa es inmensa, estos tienen un sinfín de posibilidades.

En Datlas usamos mapas todos los días con el propósito de brindarles soluciones a nuestros clientes. En algunos casos estos mapas son hechos a la medida, mediante el servicio de personalización de plataformas que ofrecemos, estos mapas albergan la inteligencia comercial que puede hacer la diferencia en este mundo de competitividad económica.

¿Pero que tienen de especial estos mapas?

La respuesta depende de cuáles son tus necesidades, ¿Tu compañía busca expanderse mediante el modelo de franquicias?, ¿Buscan segmentar los puntos de venta? o ¿Qué tal un análisis RFM?

El punto es que el mapa que desarrollamos para ti y el que desarrollamos para otro cliente es muy diferente porque las necesidades son distintas, lo que nos lleva a que los datos georreferenciados de los mapas son distintos.

Al trabajar con un universo tan grande de información, nos topamos con datos que están georreferenciados de multiples maneras.

¿Qué es la georreferenciación?

Es una técnica de posicionamiento espacial donde ubicamos en el mapa un objeto[1].

Si nos queremos poner técnicos, la georreferenciación es el posicionamiento espacial de una entidad en una localización geográfica única y bien definida mediante el uso de un sistema de coordenadas y datum específicos.

Al final, todo esto se traduce a poner un punto en el mapa.

Tipos de georreferenciación

Ya sabemos que el mapa es la representación geográfica de un lugar y las coordenadas son la dirección para llegar a cualquiera de estos lugares.

Puntos

Un punto es un objeto de cero dimensiones ubicado en el mapa mediante las coordenadas latitud y longitud.

Estos puntos son de gran utilidad para ubicar negocios en un mapa, o los puntos de venta o incluso puntos que se mueven en el tiempo, como un auto o camión.

** Te invitamos a leer la siguiente columna: AIRBNB En la zona metropolitana de Monterrey – DATLAS COLUMNA DE INVESTIGACIÓN para ver un uso practico del analisis de puntos.

Líneas

El siguiente nivel son las líneas, podemos pensar en las líneas como un conjunto de puntos. Estas son de gran utilidad para mapear objetos como curvas de nivel para topografía, las calles de una ciudad, líneas de metro, limites municipales o de colonias, etc.

Polígonos

Por último tenemos el polígono, estos son un conjunto de líneas utilizadas para representar la superficie, son figuras geométricas irregulares que pueden ajustarse al perímetro o frontera geográfica del elemento que representan.

Multiples fuentes

Ya vimos que los datos pueden ser georreferenciados de diferentes maneras, pero también es importante considerar que cuando creamos un mapa le agregamos información de múltiples fuentes.

Estas fuentes pueden ser del orden público, como datos del INEGI u otras fuentes gubernamentales o pueden ser privados como datos propios de tu empresa.

Al agrupar datos de distintas características y de distintas fuentes se crea un reto. ¿Qué pasa cuando queremos calcular una metrica para una ubicación, cuando esta ubicación tiene datos en agregado de un municipio y de un AGEB?

Estos datos están a diferente “tamaño” uno siendo el municipio que en una zona urbana puede ser mucho más extenso que un AGEB.

** Si te interesa saber mas sobre los AGEBs y de la utilidad que proporcionan, te invitamos a leer la columna: ¿QUÉ ES UN AGEB Y PARA QUE SIRVE? – INVESTIGACIÓN DATLAS

Existen muchas técnicas para analizar los datos en estas situaciones, una de ellas es mediante el uso de geohashes.

¿Qué es un Geohash?

Un geohash es un sistema de geocódigos del dominio público creado por Gustavo Niemeyer[2] en el 2008 en donde se codifica la ubicación geográfica en un texto corto de letras y números.

¿Como se utiliza este sistema?

El mundo se divide en 32 células mediante el uso de una cuadricula, estas están diferenciadas con una letra o un número. En el caso de México, podemos ver que casi todo el país se encuentra ubicado en el geohash “9”, a excepción de Yucatán y Quintana Roo que residen en el geohash “d”.

A este nivel de resolución la utilidad de este sistema de geocodigos es limitada, pero la utilidad de este sistema incrementa al hacerle “zoom” al mapa.

El beneficio de este sistema es que se puede hacer zoom al mapa o aumentar la resolución, al hacer esto podemos ver que se van agregando dígitos al código.

Este mecanismo de aumento de resolución se puede hacer hasta tener un código de 12 dígitos lo cual representaría un cuadro geográfico de tan solo 3.7cm por 1.9cm, sin duda un espacio muy pequeño.

Para un uso más práctico, encontremos el geohash donde se encuentra el Ángel de la Independencia en la Ciudad de México a 8 y 9 niveles.

En 8 niveles podemos observar la siguiente cuadricula, donde se encuentra el Ángel de la independencia, y en el geohash azul al centro de la imagen de 9 niveles, que tan solo mide 4.80 metros por 4.80 metros.

¿Qué tamaño tienen los Geohashes?

Como definimos antes, al crecer el nivel de caracteres que tiene el código del geohash, disminuye el tamaño que representa ese espacio.

El tamaño de cada uno de los 12 niveles que encontramos en este geocódigo es el siguiente:

¿Qué beneficios tiene usar este sistema?

Existen múltiples beneficios de poner en práctica el uso de geohashes en tu organización, el primero es que dado que podemos generar códigos de un tamaño tan pequeño, es difícil que aun que nuestra base de datos de ubicaciones sea extensa, se repita la ubicación del algunos de los geohashes, esto significa que podemos utilizarlos para identificar a cada uno de nuestras ubicaciones, esto se conoce como geotagging.

Otro beneficio es el del bajo costo computacional al utilizar este sistema para hacer consultas a un geo-servidor.

Cuando hacemos consultas a un geo-servidor podemos tener una situación donde sea muy grande la carga computacional, imagínate que le pedimos al servidor que nos de todos los puntos que estén en nuestra base de datos en un área de 1km de radio de una ubicación, la consulta va a ser muy grande dado que se tienen que calcular distancias entre la ubicación y los puntos de la base de datos. Si por otro lado tenemos todos nuestros puntos geohashados podemos hacer una consulta más siempre, algo así como: Tráeme todos los puntos que estén en este geohash. ¿Quieres hace más grande el área de consulta? Entonces tráeme todos los puntos que empiecen con algunos dígitos en su geohash.

Otros dos beneficios de usar este sistema son, primero la curva de aprendizaje amigable, al leer esta coluna ya tienes los básicos para empezar a usarlo. Y por último el costo, dado que nuestro amigo Gustavo Niemeyer [@] creo este sistema y lo coloco en el dominio público es gratis.

¿Como pongo en práctica el geohashing?

Para hacer uso de este sistema primero necesitamos coordenadas, te invito a abrir una hoja en Excel y hacer las siguientes columnas, id, nombre, latitud, longitud y geohash.

Coloca el nombre de tres ubicaciones que gustes y busca sus coordenadas en Google Maps[3].

El siguiente paso es buscar el geohash de estas tres ubicaciones, para eso podemos poner en práctica nuestras habilidades de código mediante el uso de bibliotecas como “Geohash 1.0” para el lenguaje de programación Python[4].

Pero en este caso haremos uso de unas páginas de internet muy utiles, la primera: https://geohash.tools/ donde podemos colocar nuestro primer set de coordenadas.

Esta herramienta nos da como resultado el geohash a 6 niveles de nuestras coordenadas. Un poco amplio el espacio, intentemos ahora con otra herramienta, la página: https://www.movable-type.co.uk/scripts/geohash.html y coloquemos las coordenadas de nuestra segunda ubicación, en este caso solicitemos el nivel a 7 caracteres.

Y por último repitamos el ejercicio en la misma página solicitando la tercera ubicación a un nivel de 8 caracteres.

Al concluir los tres ejercicios, tu tabla debe de estar completa.

Nota como la longitud de tu geohash fue subiendo de caracteres, pero al mismo tiempo el espacio representado por cada código fue disminuyendo.

Hasta aqui la columna de hoy ¿Qué otras aplicaciones has escuchado con Geohashes? Únete a la conversación en @DatlasMX y aprende más de geohashes en Datlas Academy.

Equipo Datlas

– Keep it weird-


Referencias bibiliograficas:

[1] https://es.wikipedia.org/wiki/Georreferenciaci%C3%B3n

[2] https://web.archive.org/web/20080305223755/http://blog.labix.org/#post-85

[3] https://www.google.com/maps

[4] https://pypi.org/project/Geohash/

¿Conviene actualmente abrir una juguetería? – Caso de uso DATLAS (Especial día del niño)

La era digital ha revolucionado muchas cosas cotidianas, desde aparatos de comunicación, dispositivos de entretenimiento, el dinero, hasta medios de transporte. Sin duda vivimos en una era donde casi todo es digital y lo que no es aún, se está ideando cómo convertirlo digital, sin embargo hay cosas que no se pueden hacer 100% digitales como lo son los juguetes para niños. Muchas personas podrían pensar que las jugueterías están destinadas a extinguirse porque actualmente los niños prefieren aparatos de entretenimiento digitales. Esto puede que tenga algo de cierto si se ve a grandes rasgos y generalizando pero si nos vamos a específicos nos daremos cuenta que con el uso de los datos inteligentes una juguetería podría seguir sobreviviendo en este mundo digital.

Este blog tiene como propósito explicar cómo se utiliza la analítica y la Big Data para encontrar el mejor lugar para abrir una juguetería nueva en este caso. Nos pondremos en el papel del dueño de esta juguetería con el propósito de llegar a la máxima cantidad de familias posibles para maximizar nuestras ventas.

Utilizaremos un mapa de inteligencia propiedad de Datlas para realizar este caso. Te puede interesar este blog

Primeramente necesitaríamos las bases de datos necesarias para poder mapear, en este caso utilizaremos las siguientes:

  • Nivel Socioeconómico
  • Censo 2020
  • DENUE
  • Códigos postales
  • Categoría Social

Todas estas bases de datos estarán mapeadas delimitadas por AGEB. Si gustas conocer más de esto te puede interesar este blog

Una vez que tenemos nuestras bases de datos mapeadas empezaremos a utilizar nuestras herramientas de análisis para poder tomar la mejor decisión. Iremos paso a paso.

Paso 1: Ubicar a las familias potenciales

Utilizando los datos del CENSO podemos observar dónde son los AGEBs que tienen más personas infantes que son los «clientes» potenciales para una guardería.

Paso 2: Revisar el Nivel Socioeconómico

Con la capa de Nivel Socioeconómico podemos revisar los AGEBs con mayor o menor nivel y dependiendo de ello podemos saber el rango de precios o a qué sector de la población estaría dirigida nuestra guardería.

Paso 3: Observar la Categoría Social

Al momento de tener mapeada la categoría social de cada AGEB nos muestra que tipo de dicha categoría abunda en él, en este caso nos enfocaremos en la categoría de «Familia con Niños» que es de color verde en el mapa.

Paso 4: Activamos la capa de Códigos Postales

En este caso activamos la capa de Códigos Postales en conjunto con la capa de Categoría Social, esto con el fin de analizar cuáles son estos código postales donde existe una gran cantidad de familias con «clientes potenciales».

Paso 5: Sacamos conclusiones

Una vez observado las capaz, de hacer nuestros análisis, podemos llegar a algunas conclusiones importantes. Para fines prácticos se presentará la conclusión de cuáles son los mejores códigos postales para ubicar una juguetería actualmente.

Top 5 CP para ubicar una juguetería:

  • 67257
  • 64103
  • 66612
  • 66647
  • 64984

Se escogieron las zonas donde más abundan los «clientes potenciales» y también los CP donde existe una fácil vía de acceso para llegar a una juguetería.

A grandes rasgos así es como una juguetería podría utilizar el Big Data mediante las herramientas de DATLAS para potencializar sus ventas y seguir existiendo en este mundo cada vez más digitalizado, es un reto difícil pero no imposible. Teniendo a los datos y a la analítica de tu lado siempre irás por el camino correcto.

Equipo Datlas

– Keep it weird –

La inseguridad en México, ¿Percepción o Realidad? – Datlas Research

Ahora que estuvimos en Campus Party y este año hemos tenido la oportunidad en el equipo Datlas de visitar casi 10 ciudades… es común que al decirle a los locales que somos de Monterrey nos pregunten:

¿Y de la inseguridad ya más tranquilo?

Uno se queda un poco incómodo y no sabe qué responder, mientras quizás te cruza la mente preguntarle: «¿Percepción o realidad?»

Datlas_Blog_Promo_SuscriberFree

Por un lado, ya no amanecemos con narcomensajes en los puentes más importantes de la ciudad o balaceras en calles principales a la luz del día, pero en la prensa se ven noticias de muertes en casi todas las ciudades del país. («Junio pudo haber sido el mes más violento desde 1990» @diegovalle)

¿Acaso la gente se ha quedado con la imágen de hace algunos años y no sabemos en realidad si México es seguro en la actualidad?

Pensamos que existe mala información en este ámbito ya que no se comunica con poca certidumbre lo que pasa alrededor del crimen en el país. O por otro lado nos enteramos de boca de otras personas sin mucho respaldo de hechos y datos. Nosotros en Datlas quisimos darnos la oportunidad de explotar algunas bases de datos e informar un poco sobre los temas de seguridad en México.

La nota de hoy es una reflexión al tema de percepción vs. realidad en cuanto a la inseguridad desde un punto de vista de datos y analítica que tenemos a nuestro alcance y las aportaciones de @diegovalle, uno de los principales exponentes de información de crimen en México que ha desarrollado sitios de investigación de datos como: elcri.men.

1) ¿Con qué velocidad han crecido las muertes reportadas en México?

Este mapa de México presenta un histórico por estado de enero 2014 a junio 2017

Grid_Inseguridad_PorEstado_Mexico
@diegovalle comparte su código en Github

#elDato: En México, en promedio, mueren 452 personas por semana por homicidio; en su mayoría hombres entre 20 a 40 años de edad que trabajan. (Datos estimados con información de INEGI 2016)

Datlas_Promo_Facebook_Suscribe

2) ¿Cuáles son los Estados más siniestrados? ¿Puedes adivinar?

  • Con más secuestros: Tamaulipas, Tabasco y Morelos
  • Con más homicidios intencionales: Colima, Chihuahua y Guerrero
  • Con más robos de vehículo: Sinaloa, México y Tamaulipas

Inseguridad_Datlas_TOp2.png

3) ¿Por qué no podemos confiar en todas las bases de información (INEGI vs. SESNSP)?

Resulta difícil realizar este tipo de análisis usando registros en bases de datos únicamente, ya que se puede llegar a conclusiones equivocadas por este medio, pues del total de muertes en siniestros en México, aquellas que se reportan/registran en bases de datos que podemos analizar son un número menor, y desconocemos si sea representativo, es decir quizás las bases de datos indiquen que hay más reportes de homicidio en una ciudad, pero no necesariamente sea esta ciudad en la que realmente más homicidios hay, simplemente es en donde más se ha reportado, por lo cual una conclusión más certera podría ser que la gente en dicho estado suele tener más hábito de reportar este tipo de sucesos.

De igual manera, una base de datos podría diferir respecto a otra y al hacer una comparativa, guiarnos en direcciones opuestas.

Tal es el caso del Secretariado Ejecutivo del Sistema Nacional de Seguridad Pública (SESNSP) vs el Instituto Nacional de Estadística y Geografía (INEGI) donde reportan los homicidios en México presentando variaciones relevantes.

DiegoValle_Junio_Mesviolento2

En la gráfica anterior, se puede observar que los homicidios reportados por el INEGI difieren con respecto a los reportados por el SESNSP, sin embargo ambos concuerdan en que la tasa de homicidios en México incrementará a cifras no registradas anteriormente, esperemos se equivoquen.

«Hay datos suficientes para confirmar que la inseguridad no es sólo una cuestión de percepción; es una realidad y el primer error de los encargados de nuestra seguridad es no reconocerlo y comunicarlo»

Finalmente, hay que continuar haciendo nuestra vida en paralelo a estos hechos. Pero el llamado va a que entidades de gobierno puedan robustecer sus unidades de inteligencia preventiva y post-sucesos para que haya más transparencia en este tipo de información.

Datlas_Promo_Podcast_Suscribe

Aquí termina la columna del día de hoy. Dejamos la reflexión abierta a pensar si con estos niveles de datos podemos afianzar que es una realidad o percepción el crecimiento de inseguridad en nuestro país.

Saludos

-Keep it weird-

Fuentes: