¿QUÉ ES UN SHAPEFILE Y PARA QUE SIRVE? – INVESTIGACIÓN DATLAS

En Datlas nos especializamos en brindarles a nuestros clientes las mejores opciones para transformar sus datos en decisiones inteligentes, para ello tenemos una oferta grande de soluciones. Los tableros de inteligencia que ofrecemos son muy buenos en explicar los datos, mediante el uso de visuales podemos detectar tendencias y producir hallazgos. Por otro lado, tenemos el uso de Mapas, estos facilitan la interpretación de los datos que están georreferenciados.

Si quieres conocer mas acercaa de los Tableros de Inteligencia, te invitamos a leer «Dashboards de negocios, guía para principiantes – MANUALES DATLAS»

¿Que tienen de especial los mapas en Datlas?

El uso de nuestros mapas resuelve muchos de los retos actuales que tienen los negocios. Desde mapas de expansión comercial, hasta mapas que integran información de ventas de tu negocio.

Una de las solicitudes que hemos atendido es la de integrar distintos tipos de información georreferenciada al mismo mapa. Esto tiene como objetivo crear un mapa con toda la información que se necesita, logrando así un mapa completamente personalizado.

La solución tecnológica para poder integrar múltiples fuentes y múltiples tipos de datos a un solo mapa se atiende de múltiples maneras. Antes hemos hablado de que es un “Geohash” o para que sirve un “AGEB”, pero en esta columna queremos platicarles de que es un Shapefile, de que se conforma, cuál es su utilidad y de cómo podemos crear uno nosotros.

Te invitamos a leer las siguientes columnas para conocer mas de geohash y AGEBs.

¿QUÉ ES UN AGEB Y PARA QUE SIRVE? – INVESTIGACIÓN DATLAS

¿QUÉ ES UN GEOHASH Y PARA QUE SIRVE? – INVESTIGACIÓN DATLAS

¿Qué es la georreferenciación?

Esta es una técnica de posicionamiento espacial donde ubicamos en el mapa un objeto.

Si nos queremos poner técnicos, la georreferenciación es el posicionamiento espacial de una entidad en una localización geográfica única y bien definida mediante el uso de un sistema de coordenadas y datum específicos.

Todo esto se traduce en poner un punto en el mapa.

¿Qué encontramos en un Mapa?

Cualquier mapa que utilicemos desde Google maps hasta algún mapa viejo en papel tiene información desplegada. Toda esta información se encuentra en el mapa tomando alguna forma, esta puede ser un punto, línea o un polígono.

Puntos

Los puntos son objetos que no tienen ninguna dimensión, solo están ubicados dentro del mapa, pero tienen cero “volumen”, estos tienen a ser usados para representar mucha de la información y sin duda alguna es el tipo más común que encontramos en la mayoría de los mapas.

Uno uso común de los puntos es marcar la ubicación de un negocio, parque, centro comercial, etc. Estos lugares sin duda tienen un espacio o un “volumen” en tres dimensiones, pero para fines de simpleza, tienden a ser representados con un solo punto en el centro de su ubicación.

Por ejemplo, en esta captura de pantalla de Google Maps, encontramos al parque fundidora de la ciudad de Monterrey como un solo punto, al centro del parque.

Líneas

El segundo tipo que tocaremos será las líneas, para ello podemos pensar en la silueta o contorno de un lugar. Las líneas tienen un mundo de usos, uno de los más comunes es colocar los niveles topográficos del lugar. En algunos mapas también pueden ser usadas para desplegar información como calles, líneas de metro, límites territoriales, etc.

Polígonos

El polígono tiene la función de formar objetos en 2 dimensiones, en Datlas los utilizamos para delimitar una zona del mapa y agrupar sus características.

Por ejemplo, en esta imagen tenemos algunos polígonos de la Ciudad de Monterrey del mapa demo Datlas.

Trabajando con Múltiples Tipos

Cuando desarrollamos un proyecto nuevo en Datlas, es normal tener múltiples tipos de datos, así como múltiples fuentes.

Al tener todos estos datos georreferenciados, podemos colocarlos en el mismo mapa sin importar de que tipo sean.

Para eso trabajamos con nuestro habilitadores tecnológicos de GIS (geographic information system) que nos permiten procesar la información para colocarla en el mapa.

Nuestro software favorito tiene el nombre de QGIS.

Este es un software libre y de código abierto (open source) que habilita a nuestro equipo de manera importante para hacer procesamientos geoespaciales.

URL: https://www.qgis.org/en/site/index.html

Al trabajar con este tipo de programas podemos hacer uso de múltiples tipos de datos y de distintos formatos.

Lo que nos lleva al famoso SHAPEFILE. Este es un tipo de formato que nos permite trabajar con información georreferenciada ya sean puntos, líneas, polígonos, entre otros.

¿Qué es un Shapefile?

Un shapefile es un formato, así como tus imágenes tiene “.jpg” o tu documento de Word tiene “.docx” los shapefiles o comúnmente abreviados como “shp” son formatos de vectores geoespaciales de datos para el uso de software GIS.

Este formato de shapefile fue desarrollado y es regulado por ESRI como un estándar abierto para la interoperabilidad entre ESRI y distintos softwares de GIS.

Ahora para confundirte:

Cuando decimos “Shapefile” podemos estar diciendo dos cosas distintas. En la industria estas dos cosas tienen el mismo nombre, pero no te preocupes, aquí te decimos por qué y cuáles son las diferencias.

El primero y el que es técnicamente correcto es nombrar “shapefile” al archivo que termina en “.shp”, este es un solo archivo que tiene las características de la geometría de tus puntos, líneas o polígonos.

El problema aquí es que un archivo .shp no puede ser utilizado por sí mismo, tiene que ir acompañado de otros archivos con terminaciones .shx, .prj & .dbf.

Y he allí la confusión, como requerimos de mínimo estos cuatro archivos juntos para poder hacer uso de la información que almacenan, también se conoce como “shapefile” al conjunto de archivos que trabajan juntos para desplegar información en un sistema de información geográfica (GIS).

Mas adelante exploraremos cuales son las funciones de los otros tres archivos necesarios y de todos los otros que pueden acompañar a nuestro “shapefile” que son opcionales.

¿Cueles son los formatos que conforman un Shapefile?

De ahora en adelante llamaremos al conjunto de archivos que trabajan juntos para desplegar la información como “shapefile”.

Sin duda al trabajar con este tipo de documentos y sistemas por primera vez surge la duda de cómo hacer que funcione, por lo general al hacer uso de un archivo solo hacemos clic en él y si tenemos el programa adecuado, este se abre.

Para que un shapefile funcione de manera adecuada solo tenemos que asegurarnos de que todos los archivos que conforman un shapefile tengan el mismo nombre y estén en el mismo directorio o carpeta.

Por ejemplo, si tengo un shapefile que almacena información de un punto de interés se vería de esta manera en mi computadora.

Al importar estos archivos al QGIS o software de sistema de información geográfica de tu preferencia, se desplegará la información de manera adecuada y sin errores.

¿Qué función tienen los archivos que conforman un Shapefile?

Como lo mencionamos antes, un .shp se acompaña de 3 archivos indispensables para su correcto funcionamiento.

Estos son .dbf, .shx y .prj y su función es la que sigue:

.shp

Formato de la forma o, en otras palabras, almacena la geometría.

.shx

Almacena la indexación o forma del índice de la geometría, permitiendo su consulta en ambas direcciones del índice

.dbf

Almacena los atributos de formato, para cada figura del archivo.

.prj

Dentro de este archivo se encuentra la información sobre la proyección de la información. En sí, este archivo tiene los datos necesarios para georreferenciar el shapefile.

¿Qué otros archivos pueden acompañar un Shapefile?

Existen otra serie de archivos que pueden o no acompañar a los 4 esenciales, estos le agregan funciones o atributos al shapefiles.

Algunos de estos archivos son:

.sbn & .sbx

Indexación espacial de los atributos.

.fbn  & .fbx

Indexación espacial de los atributos, con la diferencia de que es solo para la lectura y no se pueden modificar.

.shp.xml (pegado)

Metadatos geoespaciales en formato .xml.

Existen muchos otros tipos de formatos de archivos que se pueden agregar a un shapefile, pero con esta introducción es más que suficiente para empezar a hacer uso de tus propios datos.

¿Dónde empezar?

La barrera de entrada para hacer uso de esta tecnología es baja, si tienes una computadora y puedes descargar información de internet, tienes todo lo que necesitas.

Empieza descargando QGIS desde https://www.qgis.org/es/site/ y utilízalo como tu software para procesamiento de información geográfica, este está disponible para Mac, Windows & Linux. Es seguro y gratuito.

Accede a la documentación en https://docs.qgis.org/3.22/es/docs/user_manual/ para familiarizarte con el programa.

¿Y los datos?

¿Qué crees?, no te tienes que preocupar por encontrar algunos shapefiles. Existe un mundo de información muy accesible y completamente gratuita que es generada por gobiernos, ONGs y entusiastas del mundo de los datos.

Te recomendamos usar tu motor de búsqueda al que más confianza le tengas (para mí: duckduckgo.com) y busques los shapefiles que más te llamen la atención.


Hasta aqui la columna de hoy ¿Qué otras aplicaciones has escuchado para los shapefiles? Únete a la conversación en @DatlasMX y aprende más del tema en Datlas Academy.

Equipo Datlas

– Keep it weird-

12 Preguntas de Analítica y Tecnología que puedes responder con Podcast – Ecosistemas Datlas

En un mundo con abundancia de información y con mucho interés en aprender ciencia de datos ¿Cómo priorizo? Bueno pues te hicimos la tarea. En este blog priorizamos y desarrollamos los blogs más relevantes para que termines este 2022 escuchando mucho de lo que tienes que aprender para estrategias de ciencia de datos y analítica.

Adicional, sabemos que muchas de las personas que nos siguen estarán interesad@s en temas de tecnología como innnovación y complementamos el listado con algunos de los mejores episodios de estos tópicos. No olvides suscribirte y evaluarnos en CAFE DE DATOS una vez que escuches cualquier episodio en la lista.

1) ¿Qué demonios son los analytics?

Click al episodio; Comencemos con lo básico, desde el equipo de DATLAS ponemos a tod@s en el mismo piso de entendimeinto

2) ¿Cómo estructurar equipos de Analytics?

Click al episodio ; Desde el equipo de DATLAS te contamos la experiencia y la investigación que realizamos para estructurar equipos de analítica avanzada

3) ¿Cómo iniciar y vender internamente en mi organización una estrategia de Analítica?

Click al episodio ; Tuvimos un episodio con DAVID PUENTE de ARCA CONTINENTAL quien nos habló de la venta interna de proyectos y estructura de soluciones para el equipo de ARCA

4) ¿Qué oportunidad de innovación tiene un corporativo al implementar analítica de datos?

Click al episodio; Estuvo con nosotros CARL WALLACE quien nos dió los contrastes de implementaciones de analytics en el mundo startups vs. mundo corportaivo

5) Analíticas a la Moneyball ¿Cómo aprovechar analítica en industrias de retail?

Click al episodio; Estuvo con nosotros Edwin Hernández Directivo de Farmacias del Ahorro quien con algunas analogías nos habló de casos de uso y aprovechamiento de datos en retail

6) ¿Cómo aprovechar datos públicos para investigaciones y exploraciones de análisis?

Click al episodio; Estuvo con nosotros el Dr. Santaella, ahora ex-presidente del INEGI quien nos compartió los avances del instituto que más datos públicos genera en México en materia de ciencia de datos y tecnología

7) ¿Cuáles son algunas tendencias importantes que líderes de equipo deben de tomar en cuenta en analytics?

Click al episodio; Recopilamos y sintetizamos desde el equipo directivo de Datlas las 5 tendencias de mayor impacto para el 2022 en analítica

8) ¿Qué casos de éxito existen de transformación digital impulsada por analítica en empresas?

Click al episodio; Tuvimos al Director de XPERTAL Rodrigo Rey quien con su experiencia en FEMSA y antres en NEORIS enriqueció nuestros puntos de vistas de digital

9) ¿Qué es la econometría espacial y cuáles son algunas aplicaciones con datos geo-referenciados?

Click al episodio; Nos visitó en el episodio el Dr. Miguel Flores especialista en econometría espacial de la UANL

10) ¿Cuál es el rol de un traductor de datos en el negocio y cómo funciona?

Click al episodio; Nos acompañó Néstor García de OXXO para hablarnos de los Data Champions

11) ¿Cómo impulsar la creativas y el interés social?

Click al episodio; LABNL participó con nosotros vía Idalia Santos para compartirnos su expertise de este tema

12) ¿Cuáles son los ejemplos más recientes de implementación de analítica en negocios transaccionales o de salud?

Click al episodio; Participó con nosotros Mail Laredo quien se introduce como responsable de parte del desarrollo para una de las Farmacias más grandes de México

Hasta aqui el episodio de hoy. Recuerda continuar aprendiendo activamente y si eres quien consume mejor contenido por lectura te invitamos a revisar nuestro último lanzamiento de DATA PLAYBOOK 2022 para aprender de las últimas experiencias del equipo ¿De qué otros temas te gustaría que habláramos en el podcast? Compártenos en @datlasmx.

Equipo Datlas

– Keep it weird – –

¿QUÉ ES UN GEOHASH Y PARA QUE SIRVE? – INVESTIGACIÓN DATLAS

La utilidad de un mapa es inmensa, estos tienen un sinfín de posibilidades.

En Datlas usamos mapas todos los días con el propósito de brindarles soluciones a nuestros clientes. En algunos casos estos mapas son hechos a la medida, mediante el servicio de personalización de plataformas que ofrecemos, estos mapas albergan la inteligencia comercial que puede hacer la diferencia en este mundo de competitividad económica.

¿Pero que tienen de especial estos mapas?

La respuesta depende de cuáles son tus necesidades, ¿Tu compañía busca expanderse mediante el modelo de franquicias?, ¿Buscan segmentar los puntos de venta? o ¿Qué tal un análisis RFM?

El punto es que el mapa que desarrollamos para ti y el que desarrollamos para otro cliente es muy diferente porque las necesidades son distintas, lo que nos lleva a que los datos georreferenciados de los mapas son distintos.

Al trabajar con un universo tan grande de información, nos topamos con datos que están georreferenciados de multiples maneras.

¿Qué es la georreferenciación?

Es una técnica de posicionamiento espacial donde ubicamos en el mapa un objeto[1].

Si nos queremos poner técnicos, la georreferenciación es el posicionamiento espacial de una entidad en una localización geográfica única y bien definida mediante el uso de un sistema de coordenadas y datum específicos.

Al final, todo esto se traduce a poner un punto en el mapa.

Tipos de georreferenciación

Ya sabemos que el mapa es la representación geográfica de un lugar y las coordenadas son la dirección para llegar a cualquiera de estos lugares.

Puntos

Un punto es un objeto de cero dimensiones ubicado en el mapa mediante las coordenadas latitud y longitud.

Estos puntos son de gran utilidad para ubicar negocios en un mapa, o los puntos de venta o incluso puntos que se mueven en el tiempo, como un auto o camión.

** Te invitamos a leer la siguiente columna: AIRBNB En la zona metropolitana de Monterrey – DATLAS COLUMNA DE INVESTIGACIÓN para ver un uso practico del analisis de puntos.

Líneas

El siguiente nivel son las líneas, podemos pensar en las líneas como un conjunto de puntos. Estas son de gran utilidad para mapear objetos como curvas de nivel para topografía, las calles de una ciudad, líneas de metro, limites municipales o de colonias, etc.

Polígonos

Por último tenemos el polígono, estos son un conjunto de líneas utilizadas para representar la superficie, son figuras geométricas irregulares que pueden ajustarse al perímetro o frontera geográfica del elemento que representan.

Multiples fuentes

Ya vimos que los datos pueden ser georreferenciados de diferentes maneras, pero también es importante considerar que cuando creamos un mapa le agregamos información de múltiples fuentes.

Estas fuentes pueden ser del orden público, como datos del INEGI u otras fuentes gubernamentales o pueden ser privados como datos propios de tu empresa.

Al agrupar datos de distintas características y de distintas fuentes se crea un reto. ¿Qué pasa cuando queremos calcular una metrica para una ubicación, cuando esta ubicación tiene datos en agregado de un municipio y de un AGEB?

Estos datos están a diferente “tamaño” uno siendo el municipio que en una zona urbana puede ser mucho más extenso que un AGEB.

** Si te interesa saber mas sobre los AGEBs y de la utilidad que proporcionan, te invitamos a leer la columna: ¿QUÉ ES UN AGEB Y PARA QUE SIRVE? – INVESTIGACIÓN DATLAS

Existen muchas técnicas para analizar los datos en estas situaciones, una de ellas es mediante el uso de geohashes.

¿Qué es un Geohash?

Un geohash es un sistema de geocódigos del dominio público creado por Gustavo Niemeyer[2] en el 2008 en donde se codifica la ubicación geográfica en un texto corto de letras y números.

¿Como se utiliza este sistema?

El mundo se divide en 32 células mediante el uso de una cuadricula, estas están diferenciadas con una letra o un número. En el caso de México, podemos ver que casi todo el país se encuentra ubicado en el geohash “9”, a excepción de Yucatán y Quintana Roo que residen en el geohash “d”.

A este nivel de resolución la utilidad de este sistema de geocodigos es limitada, pero la utilidad de este sistema incrementa al hacerle “zoom” al mapa.

El beneficio de este sistema es que se puede hacer zoom al mapa o aumentar la resolución, al hacer esto podemos ver que se van agregando dígitos al código.

Este mecanismo de aumento de resolución se puede hacer hasta tener un código de 12 dígitos lo cual representaría un cuadro geográfico de tan solo 3.7cm por 1.9cm, sin duda un espacio muy pequeño.

Para un uso más práctico, encontremos el geohash donde se encuentra el Ángel de la Independencia en la Ciudad de México a 8 y 9 niveles.

En 8 niveles podemos observar la siguiente cuadricula, donde se encuentra el Ángel de la independencia, y en el geohash azul al centro de la imagen de 9 niveles, que tan solo mide 4.80 metros por 4.80 metros.

¿Qué tamaño tienen los Geohashes?

Como definimos antes, al crecer el nivel de caracteres que tiene el código del geohash, disminuye el tamaño que representa ese espacio.

El tamaño de cada uno de los 12 niveles que encontramos en este geocódigo es el siguiente:

¿Qué beneficios tiene usar este sistema?

Existen múltiples beneficios de poner en práctica el uso de geohashes en tu organización, el primero es que dado que podemos generar códigos de un tamaño tan pequeño, es difícil que aun que nuestra base de datos de ubicaciones sea extensa, se repita la ubicación del algunos de los geohashes, esto significa que podemos utilizarlos para identificar a cada uno de nuestras ubicaciones, esto se conoce como geotagging.

Otro beneficio es el del bajo costo computacional al utilizar este sistema para hacer consultas a un geo-servidor.

Cuando hacemos consultas a un geo-servidor podemos tener una situación donde sea muy grande la carga computacional, imagínate que le pedimos al servidor que nos de todos los puntos que estén en nuestra base de datos en un área de 1km de radio de una ubicación, la consulta va a ser muy grande dado que se tienen que calcular distancias entre la ubicación y los puntos de la base de datos. Si por otro lado tenemos todos nuestros puntos geohashados podemos hacer una consulta más siempre, algo así como: Tráeme todos los puntos que estén en este geohash. ¿Quieres hace más grande el área de consulta? Entonces tráeme todos los puntos que empiecen con algunos dígitos en su geohash.

Otros dos beneficios de usar este sistema son, primero la curva de aprendizaje amigable, al leer esta coluna ya tienes los básicos para empezar a usarlo. Y por último el costo, dado que nuestro amigo Gustavo Niemeyer [@] creo este sistema y lo coloco en el dominio público es gratis.

¿Como pongo en práctica el geohashing?

Para hacer uso de este sistema primero necesitamos coordenadas, te invito a abrir una hoja en Excel y hacer las siguientes columnas, id, nombre, latitud, longitud y geohash.

Coloca el nombre de tres ubicaciones que gustes y busca sus coordenadas en Google Maps[3].

El siguiente paso es buscar el geohash de estas tres ubicaciones, para eso podemos poner en práctica nuestras habilidades de código mediante el uso de bibliotecas como “Geohash 1.0” para el lenguaje de programación Python[4].

Pero en este caso haremos uso de unas páginas de internet muy utiles, la primera: https://geohash.tools/ donde podemos colocar nuestro primer set de coordenadas.

Esta herramienta nos da como resultado el geohash a 6 niveles de nuestras coordenadas. Un poco amplio el espacio, intentemos ahora con otra herramienta, la página: https://www.movable-type.co.uk/scripts/geohash.html y coloquemos las coordenadas de nuestra segunda ubicación, en este caso solicitemos el nivel a 7 caracteres.

Y por último repitamos el ejercicio en la misma página solicitando la tercera ubicación a un nivel de 8 caracteres.

Al concluir los tres ejercicios, tu tabla debe de estar completa.

Nota como la longitud de tu geohash fue subiendo de caracteres, pero al mismo tiempo el espacio representado por cada código fue disminuyendo.

Hasta aqui la columna de hoy ¿Qué otras aplicaciones has escuchado con Geohashes? Únete a la conversación en @DatlasMX y aprende más de geohashes en Datlas Academy.

Equipo Datlas

– Keep it weird-


Referencias bibiliograficas:

[1] https://es.wikipedia.org/wiki/Georreferenciaci%C3%B3n

[2] https://web.archive.org/web/20080305223755/http://blog.labix.org/#post-85

[3] https://www.google.com/maps

[4] https://pypi.org/project/Geohash/

¿Qué es la Ciencia de Datos (Data Science)? Según Google – MANUALES DATLAS

Durante varios blogs Datlas y podcast de Café de Datos hemos hablado de casos de éxito/fracaso en ciencia de datos. La realidad es que el entendimiento durante el tiempo de este campo de la ciencia se ha ido diversificando. A menudo pensamos que forzosamente tiene que estar vinculado a determinada herramienta, qué tiene que ser desarrollado por ciertos perfiles y/o que sólo aplica si impacta de gran medida a la organización. Google Cloud en sus recursos de de aprendizaje comparten una guía de 6 pasos a seguir para la ejecución de proyectos de «Ciencia de Datos».

** También te puede interesar «Dimensionando la Industria de Inteligencia Artificial»

Como aviso previo, estos pasos están relacionados a procesos de análisis facilitados por un área de ciencia de datos. No tanto por un área de inteligencia de negocios. Para mayor claridad puedes conocer los distintos roles que hay en un equipo de ciencia de datos o algunas de las aristas para formar un buen equipo de datos.

I) Ingeniería de Datos

Es un momento clave en donde a la luz de un problema de negocios se extraen datos, se ingesta a un sistema de variables, se generan catálogos y a través de un procesamiento estos se vuelven información de valor. Con experiencia Datlas, agregamos una etapa de desarrollo de «Glosario de Datos» como parte de documentación y control de actualización de variables.

I.1 Ingestión de Datos y Descubrimiento

I.2 Preprocesamiento de datos

I.3 Almacenamiento de Datos

I.4 Glosario de Datos

II) Análisis de Datos

Desde análisis descriptivo hasta visualización de datos la parte de análisis integra distintos procesos estadísticos para generar hallazgos. Es altamente iterativo y caemos muchas veces en experimentación. Estas exploraciones apoyan a realizar las preguntas correcta sobre los datos que estamos evaluando. Resalta la sección, al final, de planificar la comunicación de los hallazgos.

II.1 Exploración de Datos

II.2 Pre-procesamiento

II.3 Insights de Datos

II.4 Comunicarlos

III) Desarrollo de Modelo

A través de los hallazgos de la etapa previa, se podrá seleccionar el mejor modelo de Machine Learning para detonar el aprovechamiento del histórico de datos así como la infraestructura usada para resolver problemas de análisis.

III.1 Simplificación de datos (Feature Engineering)

III.2 Entrenamiento de modelos

III.3 Evaluación de modelos

IV) Ingeniería de Machine Learning

Habilitar el servicio en línea para que otros usuarios puedan consumir los modelos. Asimismo monitorear que la estabilidad y los resultados del modelo hagan sentido durante su uso.

IV.1 Modelo de servicio

IV.2 Desarrollo de implementación de modelo

IV.3 Monitoreo de Modelo

V) Activación de descubrimientos

A través de entender los «journeys» de os usuarios de nuestros análisis y entender qué decisiones son ajustadas gracias a los análisis que desarrollamos seleccionaremos el mejor método de «delivery». Podemos hablar de dashboards, reportes u otro tipo de modelos vía API.

V.1 Seguimiento a influencia de decisiones

V.2 Identificar si el cliente final ha cambiado su comportamiento

V.3 Interconectar a otros servicios en la organización

VI) Orquestación y Mantenimiento

Mantenimiento con información actualizada del servicio. Usos replicables entre usuarios y experimentos.

VI.1 Escalamiento

VI.2 Carreteras únicas y APIs

** También te puede interesar «Metodologías para ciencia de datos»

Comentarios Datlas

Adicionalmente, a estos pasos que en su mayoría tienen base técnica. En seguimiento a los procesos de negocios y para que nuestros modelos de ciencia de datos tengan impacto en la organización para la que lo construímos es necesario diagnósticar y comunicar. En un inicio, entender bien el problema de negocio o la hipótesis que estamos validando. Así como, de manera iterativa, en cada paso del proceso identificar la audiencia a la que vale la pena comunicar. A veces sucede que estamos experimentando y queremos llegar a la dirección para influir su toma de decisiones. En realidad, hay que reconocer que a ciertos foros sólo les interesarán los resultados y a otros el método ¿Sabes cuál es cual en tu organización?

Suscríbete a Datlas Academy Gratuitamente.

Equipo Datlas

Keep it weird

Fuentes:

– Feature Engineering: https://www.kdnuggets.com/2018/12/feature-engineering-explained.html

– Data Science 6 steps with Google: https://youtu.be/EQvLUMjz-g4

Las 5 de Datlas en tendencias camino al SuperBowl LVI – COLUMNA DE INVESTIGACIÓN DATLAS

Estamos a muy pocos días de vivir uno de los eventos más grandes del Futbol Americano para aquellos conocedores y apasionados a este deporte en dónde los Bengalies de Cincinnati se enfrentarán en la casa de los Rams de los Ángeles en el SoFi Stadium el próximo domingo.

En Datlas nos gusta monitorear datos en tiempo real y más si son temas que dan mucho de que hablar, pues esta columna esta dedicada a todas aquellas tendencias de los fieles seguidores de la NFL que han estado haciendo estas búsquedas camino al SuperBowl.

Acompáñanos en la siguiente columna para explicarte más acerca de esta metodología y las 5 tendencias más buscadas en la internet por parte del próximo partido de la NFL.

Para la realización de este ejercicio se utilizo la herramienta de Google Trends para analizar cada una de las tendencias que mostraremos durante el blog.

Tendencias Google (Google Trends, en inglés) es una aplicación de Google que permite monitorear las búsquedas de ciertos términos claves a través de los motores de búsqueda de Google y su red.

Qué es Google Trends y cómo podemos sacarle partido - ProximaHost

La herramienta permite ver el histórico de búsquedas, comparar contra otras palabras claves, segregar las búsquedas por geografía y más.

La medición de estas tendencias es con base a un indicador de 0 a 100 que se va contabilizando por día. El valor de 100 significa que, durante el horizonte temporal analizado, ese día se llego al nivel máximo de búsquedas relativo a otros momento durante ese período de análisis

1. «NFL»

Comenzamos con el termino «NFL» en los últimos 5 años, uno de los insights más relevantes que podemos observar es que el incremento en las búsquedas en relación a los demás años es notorio para la actual temporada de 2021-2022 como se muestra en la siguiente gráfica:

*Consulta «NFL« vía Google Trends realizada el 10 de febrero de 2022

Además de que podemos analizar que EEUU es unos de los países con mayor número de búsquedas para «NFL» le sigue Canadá, México, República Dominicana y después Irlanda como su TOP 5.

2. «Super Bowl»

*Consulta «Super Bowl» vía Google Trends realizada el 10 de febrero de 2022

«Super Bowl» es uno de los términos más buscados en estas fechas debido a la proximidad del evento de acuerdo a los datos de últimos 5 años, notamos que 2018 fue uno de los mejores años en búsquedas vía Google pues en ese entonces el Super Bowl LIII dónde las Águilas de Philadephia derrotaron a los Patriotas de Nueva Inglaterra.

NFL: Super Bowl 2018: Resumen y resultado de la victoria de los Eagles en  la final de la NFL | Marca.com
Super Bowl 2018

Dentro de la gráfica en esta terminología podemos notar que a diferencia de los años pasados se encuentran un número bajo de búsquedas debido a que el Super Bowl de este año se recorrió una semana por temas agregación de partidos.

*Consulta «Super Bowl« vía Google Trends realizada el 10 de febrero de 2022

Hablemos de los temas y consultas más relacionados al buscar «Super Bowl» por nuestro navegador de Google, dentro de este análisis podemos observar una búsqueda guiada a eventos pasados como 2018 y 2019 ¿Será que la gente le gusta estar informada de la historia antes de ver esta edicions?

*Consulta «Super Bowl« vía Google Trends realizada el 10 de febrero de 2022

3. «Super Bowl Tickets»

Quien quiera ir al Super Bowl deberá estar ahorrando todo el año para poder pagar su entrada y es asi como las tendencias se comportan de una manera extraña (color amarillo) para empezar a realizar sus proyecciones de cuanto pagaran por un boleto para ver a los mejores equipos de la NFL antes del evento.

*Consulta «Super Bowl Tickets» vía Google Trends realizada el 10 de febrero de 2022

2018 ha sido uno de los mejores años en dónde a las personas les ha interesado asistir al Super Bowl en relación a los demás años, ¿pero que ocurrió en 2020? vemos de que manera la tendencia es muchísimo más baja en contraste a los otros años…esta pandemia !si que pego duro!

Mientras observamos 2021 es uno de los años prometedores pues la tendencia va a la alza ¿crees que las personas hayan ahorrado lo suficiente resguardadas del COVID?

A continuación te mostramos los precios promedios de las zonas para asistir al Super Bowl LVI:

Puede ser una imagen de texto que dice "SEAT Super Bowl LVI: Cincinnati Bengals GEEK Sun Feb 13 at 3:30pm Quantity $5,474 Low prices $6,703 Best seats Inclu $6,162 $5,979 F447 $10,182 $9,345 $5,874 $14,960 $6,942 $9,719 $15,487 6,632 $8,415 $22,902 $10,413 $7,241 $12,809 RAMS 6,229 $10,182 $5,785 $9,326 $6,374 $13,115 403 $9,812 $6,959 $23, $23,141 212 $16,267 $5,193 334 $9,111 $7,868 VIP219 $15,4 From $6,556 $8,1 Section 422 listing $5,724 4110 $6,259 $5,682 View list"
Precios en USD en diferentes zonas del SoFi Stadium para el Super Bowl LVI, Fuente: Seat Geek
Puede ser una imagen de texto que dice "ACADEMY DATLAS SIMPOSIUM datlasacademy.com POWERED 24 de Febrero Miércoles 23 de Febrero Conferencias Horario del evento 2:30a7p.m DANIEL MONTOYA INNOVATION JUAN ANTONIO GONZÁLEZ HEAD OF DATA AND ANALYTICS RAGASA PANEL MAURICIO MAGDALENO DIRECTOR CLÚSTER DE TURISMO LEON LUCÍA GARZA P OSVALDO SILVA COORDINADOR DE NUEVOS PROYECTOS|U- CALLI Jueves 24 de Febrero Talleres Horario del evento 9:30 a.m. FERNANDA TREJO DENSIDAD CANAL MASIVO CÉSAR MONTEMAYOR CO-FOUNDER CBDO SORA ISAAC CARRADA PRODUCT MARKETING MANAGER PADESALADRS DESARRO MICROSOFT EVANGELISTA ECNOLOGICO CONFERENCISTAA CIBERSEGURIDAD CLOUD Adquiere tu boleto en: www.bit.ly/SimposiumDatlasAcademy umDatlasAcademy Asistencia Virtual* DATLAS® www.datlas.mx CIIA Actividad Formación Integral H IISE"

4. «Espectáculo de medio tiempo del Super Bowl»

*Consulta «Espectáculo de medio tiempo del Super Bowl» vía Google Trends realizada el 10 de febrero de 2022

Muchas personas desean disfrutar del gran espectáculo del partido…otras prefieren sólo disfrutar del espectáculo del medio tiempo pues !Vaya artistas! y es que retrocedamos un poco al pasado a 2019 dónde se presentaron Maroon Five, Travis Scott y Big Boi aquel 3 de febrero en el Mercedes-Benz Stadium dándo uno de los mejores experiencias a espectadores del Super Bowl.

Vaya congruencia con los datos que traemos pues es muy notoria la tendencia en 2019 en contraste a los años pasados y siguientes, 2022 ¿Qué esta sucediendo? ¿Será que Dr. Dre, Eminem, Snoop Dogg, Mary J. Blige y Kendrick Lamar irán a la alza o se quedarán por debajo de Maroon Five?

Watch Super Bowl 2019 halftime show: Maroon 5, Big Boi and Travis Scott  take the stage - ABC7 San Francisco
Show de medio de tiempo del Super Bowl, 2019

5. «Super Bowl vs Copa Mundial de Clubes de la FIFA vs Bad Bunny»

Si de temas de actualidad vamos a hablar aparte del Super Bowl ¿Qué tal el Mundial de Clubes? o el lanzamiento del Tour de Bad Bunny en estas últimas fechas !Que locura!

*Consulta «Super Bowl vs Copa Mundial de Clubes de la FIFA vs Bad Bunny« vía Google Trends realizada el 10 de febrero de 2022

Echémosle un vistazo a estas tendencias que han estado estos últimos 30 días en las noticias, y es que el Super Bowl sigue siendo de los eventos más buscados, seguido de un comportamiento a partir de 24 de enero con el lanzamiento del Tour 2022 de Bad Bunny y la locura de su venta de boletos en línea.

De esta manera también vemos un comportamiento relativo con el inicio de los partidos del mundial de clubes estas últimas semanas a partir del 3 de febrero, pregúntenle a su amigo regio y rayado de corazón ¿Cómo le fue? he ahí sus búsquedas para ver como quedaron sus equipos favoritos.

Hasta aquí la columna de hoy, déjanos tus comentarios acerca de esta lectura y recuerda que estamos próximos a nuestro 1er Simposium Datlas no olvides inscribirte por medio de este link: www.bit.ly/SimposiumDatlasAcademy dónde podrás conseguir tu acceso completamente GRATUITO.

Equipo Datlas

– Keep it weird –

Descubre nuestra experiencia desarrollando Dashboards con Microsoft Power BI- COLUMNA DE OPINIÓN DATLAS

Esta experiencia comienza a partir de una gran iniciativa la cual es el aprendizaje, desarrollo y aplicación en tableros de inteligencia llamados «Dashboards», en Datlas nos hemos dado la tarea de innovar siempre procesos.

Es por ello que por medio de este blog te estaremos compartiendo uno de los programas que nos llevará a nuevas fronteras y oportunidades en proyectos dónde el Big Data se resume en tableros de inteligencia con cierto dinamismo para navegar, analizar y tomar decisiones con datos duros.

***Te puede interesar: «Arquitectura de Proyectos de Datos»

Inicios

El equipo Datlas esta viviendo uno de los pasos más importantes para el dominio y desarrollo de Dashboards, uno de las plataformas las cuales dimos vida a estos tableros para las organizaciones fue *Google Data Studio* sitio web en la nube de Google la cual podemos desarrollar aprovechar la información

Cómo automatizar los reportes de ranking de palabras clave, con STAT y Google  Data Studio | MD Blog

Caso de Uso en Data Studio

En Datlas trabajamos con una de las verticales las cuales son una oportunidad inmensa para el análisis de datos, anteriormente presentamos un blog en especial de este desarrollo de dashboard de intelgencia para el monitoreo turístico en Nuevo León llamado «DASHA» este formato fue realizado por la plataforma en línea Google Data Studio.

La experiencia de trabajar con Data Studio fue un motor importante para Datlas para el desarrollo y aplicación de proyectos de dashboard, el aprendizaje y la aplicación fue constante para poder enlazar más de 80 tableros activos que tuvieron la oportunidad de sincronizarse por medio del data warehouse.

A continuación te mostramos algunas visualizaciones que se hicieron posibles por medio de Google Data Studio:

Animated GIF
La imagen tiene un atributo ALT vacío; su nombre de archivo es datlas_blog_promo_suscriberfree.png

Nuevas fronteras rumbo al Business Intelligence

Parte de la innovación y sus procesos es implementar nuevas estrategias que nos sepan adaptar al cambio para transformar información este proceso es el business intelligence el cual nos lleva nuevas fornteras, nuevos objetivos y nuevas herramientas tecnológicas.

Nuestra experiencia para el desarrollo de dashboards comenzo en Google Data Studio este año estamos posicionando nuestros próximos proyectos en una herramienta de análisis empresarial dentro de la nube de Microsoft One Drive esta herramienta es Power BI.

** Te puede interesar: «Dashboards para principantes»

Esta visualización nos muestra los programas dedicados a realizar Dashboards ¿cómo ves la competencia?
Fuente: https://davoy.tech/power-bi-vs-tableau-vs-google-data-studio-in-2021/

Microsoft Power BI

Esta herramienta tiene como propósito analizar una gran cantidad de información dentro de la suite de Microsoft en la nube, la cual permite integrar diferentes fuentes desde un libro de excel hasta tablas dentro de una página web para poder ser visualizadas en tableros e informes que pueden ser publicados.

Power BI es uno de los programas con más cantidad de cursos de aprendizaje sobre la web, ojo aquí científicos de datos pues es una oportunidad para sumar a la metodologías aplicadas para el business intelligence como lo comentabamos anteriormente.

El equipo Datlas recomienda el siguiente curso impartido por Udemy de Power BI para el análisis de datos:

https://www.udemy.com/share/1031Mi3@XRuqenkYYBXMqQ9PvVmjKGjRNq2cn1GE92KRMLqYygWIqLZZNi2dYb6dAYmZrnC8Nw==/

No hay ninguna descripción de la foto disponible.

Esqueleto Microsoft Power BI

De acuerdo al aprendizaje que Datlas se dio a la tarea de conocer y aplicar, estos fueron los puntos a tratar durante la experiencia cuando tomamos el curso:

  • Descarga del producto y conociendo Power BI Desktop: Este apartado en términos generales se vio un reconocimiento que necesitamos entender antes de usar el programa
  • Limpieza, modelado y transformación de información: En esta secciión se vieron los distintos ejercicios para la limpieza de información
  • Visualizaciones, tableros y filtros: Conocimos la variedad de análisis que puede generar un informe al ser presentado por medio de visualizaciones y filtros
  • Lenguaje DAX aplicado: “Data Analysis Expressions” es un lenguaje el cual se vincula a funciones o expresiones matemáticas las cuales se utilizan en referencia a los modelos creados en BI
Interfaz de Microsoft Power BI
La imagen tiene un atributo ALT vacío; su nombre de archivo es datlas_promo_youtube_suscribe-1.png

Caso de Uso en Microsoft Power BI

Una de nuestras primeros informes en Power BI fue un caso de uso para analizar las ventas previstas y generadas por una segmentación de vendedores aplicando diferentes tableros para visualizar desde una tabla de excel hasta ciertos tableros inteligentes los cuales contenían filtros por segmentación.

A continuación te mostramos una visualización del ejercicio de monitoreo;

Animated GIF
Podemos notas que las visualizaciones son dinámicas, que tanto tableros y filtros se conectan al reporte.

Hasta aqui la columna de hoy, recuerda continuar la conversación en nuestras redes via @DATLASMX, y cuéntanos si en tu organización les gustaría algún Dashboard inteligencia con la metodología aprendida.

Equipo Datlas

– Keep it weird –

Sonido Adaptativo (Adaptive Sound) un indicador por la que deberías cambiar tus AIRPODS PRO por los PIXEL BUDS 2nd Gen – Columna de opinión DATLAS

Hace unos días algunas culturas celebraron la «navidad» o en su equivalencia «felices fiestas». Ese momento en el año en donde a finales de Diciembre y principios de Enero en algunas partes del mundo se suele mostrar gratitud al prójimo con obsequios. Principalmente a l@s niñ@s de la casa. Sin embargo, es común que algunos adultos aprovechen los descuentos navideños y el aguinaldo para darse un gustito. Como en este blog hablamos de transformación digital, quisimos hacer una reseña de conversaciones internas en el equipo @DatlasMX que tenemos sobre tecnología y gadgets.

En esta columna haremos un breve contraste entre la experiencia de cómo un indicador llamado «Adaptive Sound» que construyó Google para su tecnología de audición ha mejorado las expectativas con respecto a los audífonos que comercializan con la marca #PixelBuds 2nd gen.

** Te puede interesar el siguiente blog

Audífonos: Airpods Pro Vs. Pixel Buds A-Series

Las opciones principales cuando hablamos de audífonos inalámbricos. Si somos de IOS APPLE probablmente prioricemos algunos Airpods, Airpods 2, Airpods 3 o Airpods Pro. Si eres aún más sofisticad@ podrás adquirir los over-the-ear Airpods Max. Hay del presupuesto desde los $100 a los $600 dólares aproximadamente. (Cualquiera de estos puede ser sintonizado con Sistemas Operativos Android de reciente versión). Particularmente el precio de los Airpods Pro que revisaremos en este blog es de : $250 dólares.

Por otro lado tenemos más variedad cuando nos referimos a Android. Los más populares son los Samsung Buds, los Sony o beats que van desde los $80 hasta los $500 dólares. Particularmente los que analizaremos hoy serán los Pixel Buds 2nd gen que rondan los $100-$140 dólares.

¿Prioridades al seleccionar audífonos?

Después de un par de años de experiencia en el área de los audífonos inalámbricos les puede decir que hay algunos factores importantes:

  • Portabilidad
  • Batería de larga duración
  • Sincronización rápida con el dispositivo móvil
  • Control con múltiples toques

Nice-to-have, lujos de hoy que luego serán el estándar

  • Carga inalámbrica
  • Noise-Cancelling (Cancelación de ruido)
  • Sonido adaptativo
  • Asistentes virtuales a la mano

Atributos: Airpods Pro Vs. Pixel Buds 2 gen

Los atributos principales:

Airpods Pro

  • Inalámbricos
  • Noise Cancelling
  • Siri
  • Batería prolongada

Pixel Buds

  • Inalámbricos
  • Adaptive Sounds
  • Google Assistant
  • Múltiples cargas

** Te puede interesar el blog:

Noise Cancelling Vs. Adaptive Sound, el indicador mágico

Cancelación de ruido by Apple

Con la cancelación activa de ruido, un micrófono o micrófonos orientados hacia el exterior detectan sonidos externos, que AirPods Pro o AirPods Max luego contrarrestan con anti-ruido, cancelando los sonidos externos antes de que los escuches. Un micrófono orientado hacia adentro escucha dentro de su oído en busca de sonidos internos no deseados, que su AirPods Pro o AirPods Max también contrarrestan con anti-ruido.

Audio adaptativo by Google (Ya existía antes en otros equipos)

La función Adaptive Sound utiliza los micrófonos de un teléfono Pixel para evaluar la acústica local y ajustar el ecualizador en consecuencia.

Es una opción fácil de pasar por alto, dada su implementación silenciosa y el hecho de que está desactivada de forma predeterminada.

Conoce más de Adaptive sound: https://support.google.com/googlepixelbuds/answer/9642077?hl=en

¿Por qué es importante el Adaptive Sound?

Es un sistema que funciona ajustando los decibeles que escucha el micrófono de los audífonos y los contrasta con los niveles de sonido que se reproducen. Al revisar las brechas , los audífonos sonarán más alto cuando el entorno sea ruidoso. Por otro lado, regresarán a sus niveles de sonido cuando el entorno regrese a la normalidad. Esta tecnología basada en decibeles y no en niveles de volumen declarado por el usuario es bastante útil con cualquier audífono.

¿Qué opinas? Adaptive Sound te haría cambiar de un Noise-Cancelling de Airpods Pro a los Pixel Buds ¿Qué otra sofisticación con indicadores y análisis de datos crees que venga al futuro del audio? Comparte tus comentarios en esta columna o en nuestras redes @DatlasMX .

Recuerda suscríbirte a Datlas Academy, ya tod@s obtuvieron un regalo de navidad único. Nuestra invitación al Simposium de Febrero 2022. Solicita los tuyos uniéndote a la comunidad.

Equipo Datlas

– Keep it weird –

1 semana usando la cámara del PIXEL 6 (GOOGLE) en México – COLUMNA DE OPINIÓN DATLAS

Google lanzó su primer celular 100% «GOOGLE». Esto significa que, similar a lo que hizo APPLE con sus IPHONE con chip propio, ahora Google hizo lo suyo con los nuevos PIXEL 6 impulsando el chip TENSOR. Tuvimos la oportunidad de echarle el ojo a este nuevo chip enfocado en MACHINE LEARNING que lanzó el gigante tecnológico y en este blog te contaremos un poco de nuestra experiencia.

Búsqueda en Google Trends para México de los últimos 12 meses del término PIXEL 6 y PIXEL 6 PRO.
Consulta el 3 de Noviembre del 2021

El nuevo PIXEL 6 se ha convertido una sensación en redes y en internet. Y es que antes del día de «Halloween» Google completó el «embargo» de su nueva versión de celular PIXEL. Sin embargo poca gente está dando evidencia de lo chulo que ha sido su cámara. A continuación te daremos nuestros destacados:

1) UNA ASOMBROSA CÁMARA, en contraste con otros equipos

El PIXEL 6 se lanzó en $600 dllrs, pero tiene aspectos de gamas más altas. La cámara principal tiene 50 megapixeles. En la siguiente pantalla te mostramos la diferencia contra un IPHONE SE de 12MP y un Samsung A9 de 24MP

¿El secreto de porqué es mejor? No son los megapixeles, es la optimización del software impulsado por los chips de marca propia de cada una de las compañías. Si apreciamos los detalles del cielo, los extremos del ala del avión y los reflejos podemos encontrar como el pixel 6 tiene casi un modo «HDR» fijo que hace que la imagen se vea de muy alta calidad.

Otro contraste, más retador para cualquier cámara, es una fotografía en el atardecer. Se combinan sombras, contraste y brillo al mismo tiempo. La apreciación es distinta en cada uno de los equipos, pero el PIXEL 6 captura mucho mejor los detalles del fondo y balancea la perspectiva del ala con el fondo.

2) El pixel 6 no sólo es cámara, sino toda una suite de edición donde destaca su «MAGIC ERASER«. Con esto podemos hacer ejercicios como borrar esos molestos cables de luz de las fotos «como magia» (En realidad es el machine learning haciendo su trabajo)

No sólo funciona con cables, también con personas para aquellas veces que sientes que te arruinaron una foto.

** Te puede interesar nuestro blog sobre la MAC MINI m1 para data science y videos

3) La estabilización de VIDEO. Algo que me molestaba profundamente de los videos que capturaba en otros celulares es la estabilización de la toma. Y es que el no tener un buen pulso a veces te condena a no tener buenas tomas. Con PIXEL 6 no tienes por qué preocuparte de esto. Desde el origen puede estabilizar, pero también puede

Video 1 de Estabilización en un despegue de avión (Donde normalmente habría muchas vibraciones)

Video 2: Estabilización con movimiento natural de mano

4) Un ZOOM óptico – digital bastante aprovechable. El RIO está a 2.6 kilómetros de donde se tomó la foto y el TREASURE ISLAND a 2km. Para no ser el PIXEL 6 PRO con una cámara telefoto adiciona y más zoom óptico… el PIXEL 6 hace un excelente trabajo. La definición y el hecho de que podamos leer lo que a esta distancia te dice que la cámara está haciendo bien su trabajo.

** Te puede interesar conocer nuestro blog donde hablamos de nuestro lanzamiento «Datlas Academy»

5) Sobre la cámara delantera, sólo puedo decir que toma unas selfies que hacen ver decente a cualquiera. Tiene 8 mega pixeles, y con buena luz las tomas parecen de milagro. A pesar de tener situaciones de contraste donde hay luz y sombras.

6) Finalmente, Un editor de fotografía de envidia. El PIXEL 6 hace mimica de muchos efectos del «photoshop», pero todo en pocos segundos.

¿Qué opinas del PIXEL? Si eres usuario de ANDROID o IOS te gustaría tenerlo. Continua la conversación y revisa todas las especificaciones en esta página. A nosotros nos impresiona el poder del nuevo chip y estamos emocionados de esta nueva ruta que la compañía GOOGLE ha tomado.

Recuerda suscribirte en nuestro podcast «Café de Datos» y en «Datlas Academy» para aprender de analítica y transformación digital.

Equipo Datlas

– Keep it weird-

GOOGLE IO 2021: INTELIGENCIA ARTIFICIAL, COMPUTACIÓN CUÁNTICA Y PRIVACIDAD DE DATOS – COLUMNA DE OPINIÓN DATLAS

«Más de 100 mejoras sólo en el servicio de GOOGLE MAPS con inteligencia artificial avanzada» Esta fue la primera reflexión que tuve la oportunidad de apreciar cuando sintonizábamos esta semana el GOOGLE IO 2021. Este es un evento donde la compañía global de internet GOOGLE anuncia nuevos lanzamientos y mejoras a sus servicios.

En esta columna te compartiremos nuestra opinión y reflexión sobre este evento.

Entre lo más sorprendente se encuentran los próximos 8 avances:

  1. Inteligencia artificial procesa caminos con atributos en «Google Maps». Ahora podemos solicitar una ruta con «buenas vistas» o seguramente en dónde haya «más gasolineras» o más «tiendas». Google Maps se sigue renovando y continuará aumentando las capacidades de la plataforma

2) La prevención con machine learning no sólo es para el «mantenimiento preventivo» de las máquinas. Google hace la apuesta de conversaciones contextuales con su sistema de «GOOGLE ASSISTANT» para poder hasta consultarle de cómo podemos prepararnos para un reto físico como subir una montaña

3) Y los avances no sólo son a nivel de entendimiento de texto. Se amplían a detección de imágenes. Mostraron un ejemplo de como podemos tomar fotografías de unas botas y consultar al sistema si cumplen con lo necesario para subir a un cerro. Eso podrá ser llevado después a sistemas de comercio en línea o hasta de ayuda humanitaria

4) En cuanto a los avances de computación cuántica, en una divertida cápsula, Google abrió su laboratorio a la vista del mundo. En un equipo cuántico en particular, explica que su laboratorio tiene algunas de las zonas con más baja temperatura del mundo. Hasta el momento no se atiende un proyecto específico, pero seguramente en futuros GOOGLE IO escucharemos más de qué uso le están dando a estos equipos

5) Realidad aumentada con el apoyo de atletas olímpicos. Así como hace unos años la empresa NIANTIC sorprendió al mundo en alianza con GOOGLE con juegos como «POKEMON GO» ahora GOOGLE expande la usabilidad de la Realidad Aumentada (AR) a otros aspectos. Entre ellos los deportes en donde será posible seleccionar a algunos de tus atletas favoritos para ver una presentación a través de la pantalla con fondos dinámicos

6) El nuevo «dashboard» de privacidad en ANDROID y sistemas operativos móviles de Google ayudará a identificar de manera ágil qué datos se están compartiendo en cada una de las aplicaciones

7) Dermatólogo bajo demanda como asistente virtual de los smartphones con sistemas operativos Android. Se podrán detectar más de 300 enfermedades y dimensionar la gravedad de la misma para entonces acudir con un profesional

8) Ampliando sus capacidades y aplicaciones de inteligencia artificial avanzada también se presentó un caso de diagnóstico de «cancer de mama» que aumente la velocidad, asertividad y reduzca los costos de este tipo de pruebas

Hasta aqui la columna de hoy

¿Qué opinas de estos lanzamientos? ¿Estamos en el futuro o vamos hacía allá? ¿Google será la empresa que esté haciendo las apuestas más importantes o qué otras compiten por el puesto? Compártenos tus opiniones en nuestras redes @DatlasMX

Equipo Datlas

– Keep it weird-

arquitectura de proyectos de datos (Data warehouses, vs Data lake vs Data mart) – Datlas manuales

Cuando vemos una casa bonita, con buena arquitectura , jardinería bien cuidada e iluminación en su punto lo que menos nos preocupa es cómo está la casa en su plomería y en los cables que hacen que esa iluminación y jardín se vean de primera. Al final tenemos contacto con los interiores y la fachada de la casa ¿Por qué debería de importarme? Bueno si en lugar de una casa habláramos de una plataforma increíble de mapas o dashboard… seguramente tendríamos que entender cómo funciona para poder construir uno para nosotros igual de funcional.

En esta columna hablaremos de la arquitectura para proyectos de datos y cómo funciona la plomería que hace viajar los datos desde su fuente hasta los puntos de consumo por los usuarios.

¿El contexto para el «aprovechamiento de los datos» ?

Desde hace un par de años decidimos comenzar nuestros diálogos sobre data science en foros nacionales con un gráfico así. Nuestra urgencia era comunicar por qué les debería de importar aprovechar todos esos datos que las organizaciones generan.

Ahora, no es tan necesario hablar de esto, la transformación digital a vuelto a los datos los protagonistas del cambio. No hay organización respetable que quiera «dejar valor en la mesa» y no esté ocupando un porcentaje de su tiempo en capitalizar el valor de los datos.

Mencionamos esto como contexto de la columna, el aprovechamiento de los datos muchas veces es dialogado de la parte cultural… pero ¿Cómo perderle el miedo a tratar de entenderlo desde la perspectiva técnica? Esperemos esta columna te apoyo a eso

¿Cómo funciona la plomería detrás de un proyecto de aprovechamiento de datos?

Un proyecto de aprovechamiento de datos para medianas y grandes cantidades de datos se puede ilustrar de la siguiente manera.

  • Existen datos de negocio de distintas fuentes. Puede ser puntos de venta transaccionales, ventas, información adquirida vía terceros (por ejemplo de clima de IBM o negocios de Google Places), de redes sociales, entre otras
  • Estos datos tendrán entrada a nuestros sistemas de información mediante una copia que se dirige a un repositorio de datos denominado «Data Lake» o «Lagos de datos». En este punto la información es de todo tipo y con estructuras diferenciadas
  • A partir de ahi es importante limpiar, estructurar e integrar las bases de datos de una manera en que puedan ser «consumibles» para nuestros proyectos de datos. Por ejemplo, si tenemos datos de clima y de negocio, podríamos generar una base de datos a nivel código postal o suburbio y cruzar estos 2 datos enlazados a una misma zona de la ciudad. Este proceso puede suceder via un ETL (Extract – Transform – Load ; Extraer – Transformar – Cargar) que son pasos programados para que los datos puedan ser casi listos para ser usados
  • Los datos procesados por el ETL serán ahora información. Esta información podrá ser almacenada en un repositorio llamado «Data Warehouse». A diferencia del «Lago de datos», en este «Warehouse» la información compartirá estructura y habrá una mayor homologación entre los sistemas numéricos en los que se registran las variables
  • Estos registros pueden pasar por pasos de «agregación» en donde se hacen sumatorias. Por ejemplo, en el «Warehouse» podríamos tener los registros de toda una semana de una tienda. Pero en la agregación, tendríamos la sumatoria de transacciones por día para poder realizar graficas de resultados diarios
  • Esa agregación la podemos llevar directo a plataformas como dashboards o si queremos manejar cierta discrecionalidad en la información podemos manejar «Data Marts». Por ejemplo, si queremos que el área de Logística sólo vea información operativa y no financiera podremos generar un Data Mart para aislar los datos y habilitar la construcción de tableros sólo con los datos que les corresponde visualizar

Te podrá interesar nuestras otras columnas: Qué es un ingeniero de datos en el diseño de perfiles de equipos de datos o cómo construir iniciativas de datos

¿Cómo varía por tecnología?

Estas rutas pueden variar por cada tecnología. Pero es válido decir que la mayoría de estas etapas se podrían cumplir en cada tecnología.

A continuación te compartirnos una imagen muy interesante que encontramos sobre los «pipelines» y contrastes entre:

  • AWS (amazon web services). De Lambda y S3 hasta Quicksight
  • Microsoft. De AZURE a PowerBI
  • Google. De big query a Data studio
Elaborado por @scgupta

Cuéntanos en @DatlasMX ¿Qué arquitectura preferirías o prefieres para tus proyectos de aprovechamiento de datos?

Liga: https://open.spotify.com/episode/3Y0AEOtTBqMrQHRKzkkWRl?si=60cd752c36bf4212

Hasta aqui la columna de hoy, gracias por leerla y te recomendamos suscribirte a nuestro podcast para seguir aprendiendo de datos y analítica. Conoce más en https://linktr.ee/datlas

Equipo Datlas

– Keep it weird-

Otras fuentes