¿La temperatura está relacionada con los contagios de covid-19? (revisión de correlación para nuevo león, méxico? – ManuAles datlas

El mes de febrero fue una locura para algunas ciudades de México. Esto porque se cruzaron factores como heladas bajo cero, cortes de luz, cortes de electricidad, viviendas sin agua por tuberías sin funcionar y , claro está, la pandemia COVID-19 que ya casi cumple un año.

Nos preguntamos en Datlas si alguna de estas variantes habrá impactado para bien o para mal los contagios del COVID-19. Podemos imaginar que el frío hacer que las personas se aíslen un poco más y una helada impide a una gran población salir de sus casas. En ese sentido y usando los datos que podemos obtener de forma más oportuna analizamos la relación entre la temperatura y los contagios para el Estado de Nuevo León

I. Obtención de datos

Para la recolección de datos acudimos a fuentes secundarias en internet como el sitio Visual Crossing para el clima, el INEGI y Secretaría de Salud en México para los datos de COVID-19

Datos de clima

Datos de COVID-19

II. Alcance de datos

La recolección de los datos tuvo como alcance 3 meses. Para la temperatura se tomó como punto de referencia los promedios de las estaciones meteorológicas de Monterrey. Para los datos de COVID se tomaron en cuenta los municipios enlistados en la gráfica de contagios.

Temperatura en Nuevo León

Contagios de COVID-19

III. Diagnóstico de información

Usando la librerya GGALLY en R se diagnóstico a alto nivel la relación entre variables como temperatura, máximos, mínimos, humedad, visibilidad y contagios confirmados por municipio para tener una lectura de cómo se relacionan las variables

IV. Análisis de Correlacion

Revisamos la correlación tomando en cuenta todos los períodos. En realidad los días de análisis fueron de 13 al 19 de febrero ya que la temperatura promedio fue de 4 C° aproximadamente. Así que también generamos un corte de análisis para un mes.

Correlación (Histórico de 3 meses)

Correlacion (Histórico de 1 mes (26 días))

Estos datos no mostraron relación entre alguna variable meteorológica , o la temperatura, y los contagios de COVID-19 en los municipios de estudios para ninguno de los 2 casos.

Te puede interesar leer también “Cómo el COVID-19 afecta la movilidad para los tapatíos”

Regresión ((Histórico de 1 mes (26 días))

Continuando con el proceso, aunque a sabiendas que existiría poca probabilidad de éxito, corrimos una regresión sin encontrar ninguna relación significativa (p_value)

Revisamos la correlación usando datos expresados en %

En un último ejercicio dejamos expresados los datos en la misma forma, en este caso porcentajes de variación, para evaluar si con esto encontramos alguna relación importante. En realidad no la hay. Es evidente que al menos para este espacio temporal los contagios de COVID-19 y la variación del promedio de temperatura no están relacionadas entre sí.

En estas iteraciones no encontramos ningún caso para indagar. Es decir la temperatura no parece estar relacionada con los contagios de covid-19 de la forma en la que se analizaron los datos en este ejercicio.

Pero para futuras investigaciones se recomienda a los analistas considerar variables rezagadas. Pensando que las personas reaccionan a la temperatura un día después de que se presenta una helada o un cambio drástico de temperatura.

Hasta aqui la columna de hoy. Recomendamos seguir en redes @DatlasMX para que nos cuenten con qué otra variable te gustaría que contrastaramos si el COVID-19 tiene una relación.

Comparte y suscríbete a nuestro podcast Café de Datos, que en Marzo cumple su primer año, y que esta semana lanzamos nuestra 3er temporada

Fuentes de datos:

5 Tendencias DE datos para gerentes de analytics – datlas investigación

La transformación digital en el 2021 continua siendo impulsada por distintos pilares como cultura, tecnología, sistemas de trabajo y análitica de datos. En esta última es importante seguir actualizándonos y el día de hoy dirigimos esta columna a la gerencia de analytics en las organizaciones. Hablaremos de 6 tendencias para analítica y datos en el 2021. Esta columna está inspirada en nuestra meta-investigación y la columna citada en fuentes de @Prukalpa

Te puede interesar también las tendencias del 2021 que investigamos al principio del año. Revísalas aqui.

5 Tendencias de Datos

1) Se mezclan los Data Warehouse y Data Lakes

Recuerda que hablamos sobre arquitectura de proyectos de datos en este blog y te contábamos las diferencias entre data Warehouse vs Data Lakes.

Las líneas que dividen estos conceptos se borran en algunos sistemas y algunas plataformas de analítica se están conectando de manera directa al lago de datos con tecnologías como SnowFlake.

2) Las herramientas de BI tools se hacen “mainstreams”

PowerBI, Qliks y/o Tableau son el nuevo estándar. De hecho plataformas como Tableau acaban de actualizar sus tarifas a puntos de precios bastante asequibles para PYMES ($35 dólares mensuales).

Sin embargo, recuerda tomar en cuenta la arquitectura de datos recomendada en este tipo de proyectos.

3) Los cursos y centros de excelencia de datos se vuelven el nuevo normal

Las capacitaciones de analistas en ciencia de datos se incrementan a alta velocidad. La intención es que más equipos dentro de las organizaciones se sumen a la transformación digital apalancados en plataformas de analítica.

Muchas organizaciones establecieron presupuestos en la contratación de capacitadores, cursos en línea, alianzas con universidades y programas hechos a la medida para aprender las introducciones a la analítica.

Si te interesa conocer un ejemplo de currícula no olvides revisar “Aprendiendo de Ciencia de Datos para Líderes de Equipo”

4) Emergen nuevos roles de datos

Te suena ¿Data Engineer o Data Arquitect? Sin duda alguna son de los principales roles que hemos planteado en estrategias de datos pero muchos analistas “odian” tener dependencias en sus ejercicios de ciencia de datas a la capacidad de obtener información de los ya muy demandados y ocupados “ingenieros o arquitectos de datos”.

En ese sentido se ha buscado empoderar mayormente a los analistas usando plataformas low-code. También abriendoles accesos a los “data-marts” para poder generar reportes con información básica y recurente.

Lo peor que puede suceder en una estrategia de datos es tener más “cadeneros o cuellos de botella” que solucionadores en los procesos planteados.

5) Las alertas inteligentes en negocios se vuelven “pulsos comerciales”

Hemos notado incrementos en solicitudes y RFQ de compañías que quieren estar más enterados de su contexto. Iniciativas como procesamientos de NLP de redes sociales, seguimiento a notas de ubicaciones estratégicas, “feeds” o síntesis de información de industria, entre otras son alguna evidencia del crecimiento de la “inteligencia” que se construye en los negocios.

Sin embargo, tanta información no es de mucha utilidad si esta no genera “alertas o notificaciones” oportunas para reaccionar. Imagínate que en determinado momento te cambian la tarifa del gas y tienes que esperar a la reunión trimestral de consejo para aceptar los cambios. Pero por otro lado, si usando datos y alertas en tiempo real monitoreamos los incrementos en precios de gas en distintos mercados podemos prepararnos con coberturas para el inminente crecimiento en tarifas.

Hasta aqui la columna de hoy ¿Qué opinas de las tendencias? ¿Cuál crees que es importante monitorear? y ¿Qué medios sigues para alertarte de los cambios en la industria? Sigamos la conversación en redes a través de @DatlasMX

Equipo Datlas

– Keep it weird –

Fuentes

Imagenes de unsplash y pinterest (https://ar.pinterest.com/pin/579345939554969637/)

https://towardsdatascience.com/the-top-5-data-trends-for-cdos-to-watch-out-for-in-2021-e230817bcb16

gaming supera en ganancia$ al cine y los deportes – datlas investigación

Durante 2020 a nivel global se vivió una situación que afectó a las empresas y negocios en general de una manera que no se había visto antes gracias al COVID – 19, sin embargo, hubo una industria que se benefició del confinamiento y que, a lo largo de los años, ha venido creciendo y adquiriendo más popularidad, logrando en el 2020 coronarse como el sector que más ganancias generó dentro de la industria de entretenimiento, superando al cine y los deportes. Este sector es precisamente el gaming.

¿Qué es el gaming?El gaming es la ejecución de aplicaciones especializadas conocidas como juegos electrónicos o videojuegos en consolas de videojuegos” Por lo tanto, la industria del gaming se dedica a la venta, distribución y desarrollo de software y hardware para juegos electrónicos, esto incluye:

  • Las consolas (Ej. Xbox, PlayStation, Nintendo y más)
  • Las PC (Ej. Steam, Epic Games Store, Amazon, entre otras)
  • Y también puede abarcar los dispositivos o teléfonos móviles (Ej. Smartphones y tablets) 

Durante 2020, derivado a la pandemia y al confinamiento por COVID- 19, gran parte del mundo se tuvo que abstener de salir de sus hogares, y con el cierre de cines y estadios, una alternativa de entretenimiento y convivencia social fue: los videojuegos. Inspirados por el artículo en Marketwatch, sobre el crecimiento de esta industria y su comparación a los dos grandes monstruos del entretenimiento y el ocio: el cine y los deportes, quisimos analizar más de cerca este fenómeno.

En 2020, la industria de los videojuegos recaudó $158 mil millones de dólares en ingresos digitales globales. Mientras tanto, en ventas físicas, la recaudación fue de solo $ 14.9 mil millones de dólares. Esto incluye juegos para dispositivos móviles, consolas, PC y tabletas, y también DLC de pago (es decir, expansiones) y compras dentro de la aplicación (micro transacciones). Las ventas digitales han aumentado en los últimos años y en 2020 hubo un crecimiento mayor debido al cierre de tiendas físicas para comprar de manera presencial. 

En comparación al 2019 el sector de gaming tuvo un aumento del 20% en ganancias durante el año pasado.  

Estas cifras se vuelven mucho más interesante cuando las comparamos para 2019. Durante se año la industria del cine que obtuvo ganancias de $100 mil millones de dólares y los deportes lograron solo $75mil millones de dólares. Incluso en conjunto ambos sectores no pueden superar las cifras de ingresos de videojuegos, a pesar de ser un año pre pandémico y en condiciones idóneas ya que ambos mercados estaban abiertos y funcionando en su totalidad.

¿Qué es lo que se espera a futuro?

Sabemos que el mundo se está transformando a un mundo más digital, lo que anteriormente conocíamos como un medio de entretenimiento o un mercado de nicho se ha vuelto algo masivo, su crecimiento es acelerado, desde su origen hasta el día de hoy. Incluso en México se estima que 6 de cada 10 mexicanos se consideran gamers. Y con los más recientes datos del INEGI dónde se agregó la información de qué consolas hay en casa, no cabe duda que estamos ante un sector que cada día está obteniendo más influencia y relevancia en la sociedad. 

Si bien el futuro no está escrito, los datos parecen indicar que la pandemia aceleró un poco más el crecimiento de este sector que ya venia acelerando desde antes de esta situación.

En 2021 podremos observar si este vertiginoso ritmo se mantiene, aunque todo parece indicar que seguirá creciendo de formas más aceleradas. La “prueba de fuego” será una vez que regresemos a la “normalidad” y su competencia, el cine y los deportes, estén de regreso en la arena competitiva. 

 Gracias por leernos, cuéntanos si tu te consideras gamer y ¿Qué consola? o ¿Qué juegos son tus favoritos? ¡Escríbenos en redes sociales! @DatlasMX

Bibliografía y ligas de consulta: 

https://www.marketwatch.com/story/videogames-are-a-bigger-industry-than-sports-and-movies-combined-thanks-to-the-pandemic-11608654990

https://www.gamesindustry.biz/articles/2020-12-21-gamesindustry-biz-presents-the-year-in-numbers-2020/

1 mes usando clubhouse desde latam y esta es la experiencia – datlas columna de opinión

Las redes sociales parecen uno de los territorios más dominados del internet. Hoy en día seguro pensarás en Facebook, Instagram, Whatsapp, Snapchat o Twitter. Haciendo esfuerzo por pensar en las de nicho tal vez mencionemos “Linked-in”, una de las redes profesionales con más usuarios y que hace un par de años fue comprada por Microsoft.

En esta columna hablaremos un poco sobre la nueva sensación de “Clubhouse” desde la perspectiva del equipo Datlas ya que tuvimos acceso hace ya casi 1 mes a este aplicativo en México.

Pero… lo que es una realidad, ahora más que nunca en pandemia donde estamos o deberíamos estar aislados en nuestros hogares la gente ha buscado nuevas formas de conectar. Una opción que ha tenido mucho crecimiento en atención es “Clubhouse” (CH), una app móvil (ahora sólo para IOS iphones). En esta red social los usuarios conectan con otras personas mediante foros de interés con tópicos específicos como ventas, liderazgo, startups , música, deportes, entre otros. Estos foros tienen locutores , moderadores y participantes que generan un diálogo abierto estilo entrevista de podcast. Recientemente ha aumentado su número de seguidores significativamente.

La “exclusividad” generada en Clubhouse

De acuerdo al sitio “https://www.businessofapps.com/” la app fue lanzada el 8 de abril del 2020 con sede en San Francisco, California, Estados Unidos de América. Los nombres de los fundadores son: Paul Davison y Rohan Seth.

A noviembre del 2020 la app tenía cerca de 200 mil usuarios. En diciembre sumaba 600 mil usuarios. Al día de hoy la app ronda los 2 millones de usuarios. Estas cifras se valoran con todo y que la app tiene “cierta exclusividad” ya que sólo puedes acceder por invitación. Cada nuevo usuario tiene 2 nuevas invitaciones. En el transcurso de este mes han liberado otras 4 a usuarios que entraron con anterioridad.

¿Su valuación? Ya rebasa el billón de dólares de acuerdo a algunos levantamientos de capital ($120 mdd en total) que les permitirán robustecer el desarrollo para soportar más usuarios y también lanzar para el sistema operativo ANDROID.

Los temas más comunes de salas de CH

Emprendimiento, deportes, inversión, fe, lugares de viaje, tecnologías disruptivas, viajes interplanetarios, salud, entre otros.

En realidad cada día nuevas comunidades se migran a CH. Mayormente son de habla inglesa, sin embargo hay espacio para todos los idiomas sólo hay que seguir a las comunidades adecuadas.

Personalmente, desde el ingreso, sólo hemos podido participar en un par de salas para hispanohablantes entrando al club de “Latin America Tech Club”. Aún falta que la comunidad de LATAM crezca, siguen protagonizando las charlas en inglés.

Generando “viralidad” en la red

Elon Musk, serial entrepreneur, at TED2013: The Young, The Wise, The Undiscovered. Wednesday, February 27, 2013, Long Beach, CA. Photo: James Duncan Davidson

La red se ha vuelto muy famosa porque hay algunos líderes globales que están buscando otras opciones adicional a sus redes actuales. Por ejemplo, Twitter, ha censurado y elevado las reglas de diálogo por lo que algunos están migrando algunas de sus conversaciones a redes como CH.

Por ejemplo, ELON MUSK, visitó la red hace un par de días y las salas se desbordaron. Se pretendía que iba a anunciar un nuevo lanzamiento, ajustes a su tecnología, hablar sobre su calendario de vida y/o lanzar la nueva crypto-moneda donde está participando.

En fin, muchos de estos temas fueron especulaciones, pero lo cierto es que en cosa de milisegundos la sala donde se presenció este evento llegó al limité de los 5,000 participantes.

Se especula que la red tiene iniciativas de atraer un programa de influencers así como atraer más famosos. Ashton Kutcher, por ejemplo, también ha participado. Muchísimos fundadores de startups en crecimiento también han sido moderadores en diálogos.

Futuro de Clubhouse

Los programas de CH se están haciendo más recurrente. Las comunidades están haciendo salas semanales donde convocan a grupos de personas para dialogar sobre un mismo tema. Hay verdadero valor agregado en el “conocimiento colectivo” que se obtiene en las conversaciones. Clubhouse llegó para darle más poder a la “voz” que nunca antes.

Actualmente la exclusividad ha hecho que el centro de gravedad en la red sea para quien tiene contactos pero en un par de meses se espera que haya formas de dar “propinas” o pagar un “ticket” de entrada a ciertos cuartos en específico.

De cualquier forma, CH, continuará creciendo su base de usuarios. Pero las otras redes no se quedan atrás. Los fundadores de Twitter y Mark Cuban (Shark y dueño de equipo de la NBA Dallas Maverick) han dado indicios de redes con aplicaciones de voz similares.

Recomendamos investigues esta red y si te gusta la propuesta busques añadirte a la lista de espera para involucrarte a conversaciones tan pronto sea posible ¿No te hubiera encantado ser de los o las primer@s en Linkedin o Twitter? Parece que esta es la oportunidad aqui en CH.

Hasta aqui la columna de hoy, te recomendamos conocer todo nuestro contenido gratuito dando click aqui. ¿Ya estás listo para usar CH? Búscame como @pedrovallejo

Equipo Datlas

– Keep it weird –

Fuentes:

arquitectura de proyectos de datos (Data warehouses, vs Data lake vs Data mart) – Datlas manuales

Cuando vemos una casa bonita, con buena arquitectura , jardinería bien cuidada e iluminación en su punto lo que menos nos preocupa es cómo está la casa en su plomería y en los cables que hacen que esa iluminación y jardín se vean de primera. Al final tenemos contacto con los interiores y la fachada de la casa ¿Por qué debería de importarme? Bueno si en lugar de una casa habláramos de una plataforma increíble de mapas o dashboard… seguramente tendríamos que entender cómo funciona para poder construir uno para nosotros igual de funcional.

En esta columna hablaremos de la arquitectura para proyectos de datos y cómo funciona la plomería que hace viajar los datos desde su fuente hasta los puntos de consumo por los usuarios.

¿El contexto para el “aprovechamiento de los datos” ?

Desde hace un par de años decidimos comenzar nuestros diálogos sobre data science en foros nacionales con un gráfico así. Nuestra urgencia era comunicar por qué les debería de importar aprovechar todos esos datos que las organizaciones generan.

Ahora, no es tan necesario hablar de esto, la transformación digital a vuelto a los datos los protagonistas del cambio. No hay organización respetable que quiera “dejar valor en la mesa” y no esté ocupando un porcentaje de su tiempo en capitalizar el valor de los datos.

Mencionamos esto como contexto de la columna, el aprovechamiento de los datos muchas veces es dialogado de la parte cultural… pero ¿Cómo perderle el miedo a tratar de entenderlo desde la perspectiva técnica? Esperemos esta columna te apoyo a eso

¿Cómo funciona la plomería detrás de un proyecto de aprovechamiento de datos?

Un proyecto de aprovechamiento de datos para medianas y grandes cantidades de datos se puede ilustrar de la siguiente manera.

  • Existen datos de negocio de distintas fuentes. Puede ser puntos de venta transaccionales, ventas, información adquirida vía terceros (por ejemplo de clima de IBM o negocios de Google Places), de redes sociales, entre otras
  • Estos datos tendrán entrada a nuestros sistemas de información mediante una copia que se dirige a un repositorio de datos denominado “Data Lake” o “Lagos de datos”. En este punto la información es de todo tipo y con estructuras diferenciadas
  • A partir de ahi es importante limpiar, estructurar e integrar las bases de datos de una manera en que puedan ser “consumibles” para nuestros proyectos de datos. Por ejemplo, si tenemos datos de clima y de negocio, podríamos generar una base de datos a nivel código postal o suburbio y cruzar estos 2 datos enlazados a una misma zona de la ciudad. Este proceso puede suceder via un ETL (Extract – Transform – Load ; Extraer – Transformar – Cargar) que son pasos programados para que los datos puedan ser casi listos para ser usados
  • Los datos procesados por el ETL serán ahora información. Esta información podrá ser almacenada en un repositorio llamado “Data Warehouse”. A diferencia del “Lago de datos”, en este “Warehouse” la información compartirá estructura y habrá una mayor homologación entre los sistemas numéricos en los que se registran las variables
  • Estos registros pueden pasar por pasos de “agregación” en donde se hacen sumatorias. Por ejemplo, en el “Warehouse” podríamos tener los registros de toda una semana de una tienda. Pero en la agregación, tendríamos la sumatoria de transacciones por día para poder realizar graficas de resultados diarios
  • Esa agregación la podemos llevar directo a plataformas como dashboards o si queremos manejar cierta discrecionalidad en la información podemos manejar “Data Marts”. Por ejemplo, si queremos que el área de Logística sólo vea información operativa y no financiera podremos generar un Data Mart para aislar los datos y habilitar la construcción de tableros sólo con los datos que les corresponde visualizar

Te podrá interesar nuestras otras columnas: Qué es un ingeniero de datos en el diseño de perfiles de equipos de datos o cómo construir iniciativas de datos

¿Cómo varía por tecnología?

Estas rutas pueden variar por cada tecnología. Pero es válido decir que la mayoría de estas etapas se podrían cumplir en cada tecnología.

A continuación te compartirnos una imagen muy interesante que encontramos sobre los “pipelines” y contrastes entre:

  • AWS (amazon web services). De Lambda y S3 hasta Quicksight
  • Microsoft. De AZURE a PowerBI
  • Google. De big query a Data studio
Elaborado por @scgupta

Cuéntanos en @DatlasMX ¿Qué arquitectura preferirías o prefieres para tus proyectos de aprovechamiento de datos?

Hasta aqui la columna de hoy, gracias por leerla y te recomendamos suscribirte a nuestro podcast para seguir aprendiendo de datos y analítica. Conoce más en https://linktr.ee/datlas

Equipo Datlas

– Keep it weird-

Otras fuentes

LAS TENDENCIAS POST-COVID DE LAS EMPRESAS DIGITALES EN EL SECTOR TURÍSTICO

Nos encontramos en un momento de nuestras vidas acorde a la situación actual de la pandemia en dónde nos ponemos a pensar acerca de cuáles son las tendencias que más consideran las empresas que ofrecen diferentes servicios de turismo en México. ¿Cómo es posible?, déjanos decirte que en el mundo digital y las diferentes variables de datos todo es posible.

A continuación, en el siguiente blog daremos a conocer diferentes tipos de tendencias a lo largo de la pandemia que han hecho las grandes empresas para adaptarse al sistema y ofrecer diferentes ofertas para el sector turístico.

Antecedentes en México y el mundo

Hemos estado dejado muchos viajes por posponer en familia, amigos, parejas, negocios y experiencias que no se pueden vivir al 100% presencialmente por la situación y la salud de quién nos rodea. Por otra parte, muchas empresas vinculadas a este sector como agencias de viajes, aerolíneas, hoteles, restaurantes, convenciones y entre otras pasaron uno de los meses más difíciles el año pasado en México (2020), según datos del Sistema Nacional de Información Estadística del Sector Turismo de México tan sólo se llegó al 26% de su ocupación total a comparación del año anterior(2019) con una diferencia de 34 puntos.

A continuación se muestra la ocupación hotelera en México a lo largo de los años, extraída de la página oficial del Sistema Nacional de Información Estadística del Sector Turismo de México.

Presentamos de igual manera información acerca de lo que pasa en el mundo en el año de 2018, México se posicionó en el lugar 16 por ingreso de divisas por turismo con 22.5 millones de dólares, mientras que por llegada de turistas se encuentra en el lugar 7 con la llegada de 41.4 millones de turistas.

Información tomada del Barómetro de la OMT por UNTWO, artículo de la página oficial del Sistema Nacional de Información Estadística del Sector Turismo de México.

Impacto de canales digitales a comparación de los tradicionales

Es de importancia el impacto que conllevan los canales digitales al consumidor pues se encuentran a un solo clic de reservar y pagar su viaje, actualmente dejan mucho que hablar los destinos turísticos en esta adaptación digital, te presentamos algunas ventajas y desventajas en el canal de distribución tradicional como en el actual.

Elaborado por investigación de DatlasMX

Cada día que pasa es un día más en beneficio para las grandes empresas digitales pues aprovechan esta tendencia que hace más visible su campo de persuasión hacia el consumidor haciéndolo desde su propia aplicación o página web.

Mientras que las pequeñas empresas y destinos no logran hacer este salto al momento de adaptarse al proceso digital para eficientizar diferentes áreas de operación, pago, atención o mercadotecnia.

Estrategias de las grandes empresas

Es evidente la adaptación que han tenido las grandes empresas en el sector turístico aprovechando al consumidor de una manera más estratégica y preponderante con el impacto que se tiene previsto.

¿Pero qué han hecho cada una de ellas?

Airbnb se ha involucrado en la selección del cliente filtrándolos como: ahorradores, hogareños, consumidores colaborativos, buscadores pragmáticos de lo novedoso y buscadores interactivos de lo novedoso. (Fuente: https://www.wearemarketing.com/es/blog/nuevas-apps-para-la-industria-del-turismo-el-caso-de-tripadvisor.html)

Trip Advisor: ha creado una comunicación de experiencia directa con el viajero y usuario para crear una “carpeta de viajes” en dónde almacene sus próximos destinos por medio de la aplicación o página web con accesibilidad inmediata.(Fuente: https://revistaempresarial.com/turismo/airbnb-y-su-impacto-en-el-turismo/)

Amazon ha lanzado al mercado un portal llamada “Destinations” en dónde presenta diferentes ofertas para reservar a hoteles u obtener información para restaurantes, excursiones y demás atractivos turísticos.(Fuente: https://www.channelbiz.es/2015/04/23/amazon-entra-en-el-negocio-del-turismo-con-su-portal-destinations/)

Google como sabemos es un gran potenciador de búsqueda para el turismo y referencias que queremos escuchar al momento de pensar en viajes, además ha planteado cinco etapas del ciclo de un viaje con el usuario:

1.Dreaming-Soñar

2.Researching-Buscar

3.Booking

4.Experiencing-Experimentar

5.Sharing-Compartir

(Fuente: https://www.puromarketing.com/38/15230/papel-google-turismo.html)

Estas empresas además de aprovechar su ¡boom! digital invierten en la cultura de la innovación y de la toma de decisiones a partir del análisis de datos dentro de sus plataformas creando modelos de negocios para otorgarle más y buenas opciones al cliente.

¿Por qué un Dashboard podría ayudar a la industrial del Turismo?

Un dashboard es un tablero de datos en dónde se exponen diferentes tipos de variables enlazados con filtros que se exponen mediante gráficos y ayudan a la toma de decisiones dentro de una empresa u organización para tener mayor efectividad.

Entrando en materia del sector turismo, por medio de un dashboard y las diferentes bases de datos de recopilación mediante una investigación por el Equipo Datlas, nos hemos percatado que las principales variables para el desarrollo de un dashboard para turismo son las siguientes:

  1. Ocupación Hotelera
  2. Hospitalidad (Restaurantes, Hoteles, bares,etc.)
  3. Llegada de Turistas
  4. Destinos de viajes
  5. Transportes (Uber, Taxis, Servicios Privados,etc.)
  6. Atractivos Turísticos más visitados

Al momento de reunir esta información en un dashboard como es en el ejemplo que tenemos a continuación, observaremos la capacidad y el alcance de las oportunidades que tenemos para mejorar e idear más estrategias para el sector, siendo así un pilar importante de análisis para la industria del turismo en una ubicación.

En el dashboard que se muestra a continuación se puede observar un análisis a nivel internacional de las diferentes variables como destinos de los viajes, actividades más realizadas en casa países, meses con mayor número de viajes, alojamientos, días mayor afluencia, entre otros datos que hacen visible la toma de decisiones.

¿Te gustaría saber más acerca de la industria del turismo con la analítica?

Escucha nuestro Podcast “Café de Datos” con nuestro invitado especial Mauricio Magdaleno Director del Cluster de Turismo de Nuevo León charlando acerca ¿Porqué es prioritario introducir analytics al turismo?, complementando el análisis de datos con el sector turismo.

Ahora que ya sabemos algunas de las tendencias que se toman en cuenta para las grandes empresas y de que manera aprovechan la información para la toma de decisiones, planea tu próximo viaje y cuéntanos si usas algún canal digital para hacerlo posible.

Hasta aqui la columna de hoy, cuéntanos y comparte en nuestras redes @DatlasMX cuáles crees que son otras tendencias que vienen para el #turismo este 2021.

Equipo Datlas

¿Cómo shazam y youtube saben qué canción está sonando? – datlas investigación

Los tiempos de trabajar en casa por COVID-19 han hecho que mejores nuestros espacios de trabajo. Entre lo más buscado: Sillas ergonómicas, aromatizantes, iluminación, termos para café, entre otros. Todo lo necesario para tener un buen ambiente que motive al trabajo… pero ¿Y lo qué escuchamos?

Algunas comunidades en spotify y en otras plataformas han generado “playlist” o listas musicales para escuchar mientras trabajamos. Estilos como lo-fi, jazz o música clásica es lo que más suena. Pero cuando nos encanta una canción que te gusta ¿Cómo identificarla para guardarla? Seguramente has escuchado de SHAZAM, esta app que compró Apple que tiene uno de los mejores algoritmos para detección de música.

En esta columna, motivados por el vídeo de Jaime Altozano, compartiremos un poco de cómo funciona este tipo de sistemas que te detectan música que hoy usa Apple, Android o Youtube para detectar canciones.

Sonido en imágenes, El espectrograma

Un espectrograma es una representación visual de una frecuencia de una señal que varía con el tiempo. Los ejes utilizados para plasmar estas señales en un plano cartesiano son el tiempo y la frecuencia. En concreto entre más alta sea la frecuencia más agudo será el sonido y entre más baja será más grave.

El encuentro en un punto dentro del gráfico entre el tiempo y la frecuencia genera una “coordenada”. Esto quiere decir que con este recurso podemos convertir sonido en datos. Cuando esto se trata de una canción pensemos que funciona como una “huella digital”. Cada canción tendrá una combinación única y distintiva que permitiera reconocerla entre el universo musical que existe

Detección de patrones en espectrograma

Considerando la publicación de Avery Wang, creador de Shazam y quién publicó un “paper” científico para explicar cómo funciona el sistema, la detección ocurre contrastando los datos de canciones recopiladas en espectrogramas con una base de datos previamente procesada.

Para que el procesamiento sea lo más ágil posible de cada registro musical se almacenan los máximos locales y son estos puntos los que se contrastan con la base de datos.

La detección sistemática por Avery Li-Chun Wang (Creador de Shazam)

La detección sistemática planteada en el método de Avery Wang finalmente sucede gracias a la conversión de estos registros a “hashes” únicos por canción. Esto vuelve más ágil las conexiones y búsquedas en bases de datos. Así mismo aproxima el parecido de una canción a otras ya que los hashes pueden ser construidos similares entre los primeros caracteres por la similitud de las canciones.

La clave del éxito, “la velocidad”

Para trabajar el problema de la velocidad, es decir, para que verdaderamente este sistema fuese de utilidad debería detectar e identificar la canción de una manera relativamente ágil. Tal vez en unos 20 ó 30 segundos .

Esto lo resolvió usando como punto de partida otros identificadores que permitirían una búsqueda más ágil. En este sentido realizó el cálculo de las distancias entre una frecuencia y otra. En ese sentido tendríamos 3 variables para cada segundo se sonido: El tiempo en el que suena determinada frecuencia y la brecha que hay entre esa frecuencia y la contigua.

Esto, sin duda, hace que el esfuerzo de detección de coincidencias entre la música sea menos dependiente en poder procesamiento y más dependiente en capacidad de almacenamiento. Pero ¿Sabes qué sí se logra? Que sea más ágil y rápido.

Documentación Completa

Te compartimos esta charla de una hora por Peter Sobot del equipo de Shazam donde explican más a detalle el sistema

Cierre

El desarrollo de Shazam fue un punto de partida para muchas investigaciones nuevas sobre detección de sonidos. Hoy en día plataformas como YOUTUBE identifian si usas o no una canción con licencia gracias a este tipo de sistemas. O por ejemplo, la NASA, tiene proyectos que almacenan sonidos geo-referenciados de cualquier parte del mundo. También hay aplicativos que almacenan y detectan sonidos de pájaros para decirte a qué especie estás escuchando.

Estas y otras aplicaciones son facilitadas gracias a lógicas como la desarrollada por Avery Wang ¿Se te ocurre otra aplicación? ¿En qué otra plataforma crees que hayas utilizado este tipo de tecnologías? Déjanos tus comentarios en @DatlasMX o redes sociales para poder complementar este diálogo

Equipo Datlas

– Keep it weird –

Fuentes:

ANÁLISIS NLP de discursos presidenciales en eua: biden vs trump – datlas investigación

La semana pasada el protagonismo para la audiencia en Estados Unidos de América y la mayoría de países del mundo fue el cambio en el liderazgo presidencial del país. Después de unas controversiales votaciones, Joe Biden del partido Democrático ganó y paso a ser el nuevo presidente de los Estado Unidos por un período de 4 años.

Dejando atrás la controversia electoral, en esta columna nos enfocamos a desarrollar un análisis de NLP (Natural Language procesing o procesamiento de lenguaje natural) de los discursos presidenciales. Por un lado el de salida desarrollado por Donald Trump y por otro lado el de entrada, ejecutado por Joe Biden.

Te pudiera interesar los análisis que hemos hecho para los discursos de AMLO, el presidente de México, en el 2018 y 2019.

¿Qué es el procesamiento de Lenguaje natural o NLP?

Es un campo de la inteligencia artificial que estudia las interacciones entre computadoras y el lenguaje humano. Son utilizados en el estudio de discursos escritos o hablados. En este caso, por ejemplo, de un discurso presidencial.

El discurso de salida de Donald TRUMP

El discurso de salida de la presidencia de Trump estuvo cargado de agradecimientos y mensajes que algunos consideran de “venganza” o dejando claro que “regresará” de alguna u otra manera al escenario político de Estados Unidos. Si quieres leer el discurso completo te recomendamos ver la siguiente liga.

Como primer paso, pre-procesamos el discurso y lo dividimos en distintos enunciados más pequeños para que pueda ser procesado correctamente. Usando la librería ” library(SentimentAnalysis) ” en R contamos la cantidad de palabras por cada uno de los enunciados.

Posteriormente, y tomando en cuenta un diccionario de palabras que asocia cada término con un puntaje que representa 3 niveles de connotación en cada palabra: negativa, neutral o positiva, se analiza el nivel de cada uno de los enunciados.

Es posible obtener el nivel generalizado de cada uno de los enunciados su nivel. En ese sentido encontramos que para el discurso de trump 20 de los 23 enunciados desarrollados fueron con una mayor carga positiva

Respecto a las palabras, podemos realizar un conteo de las más usadas y así construir una “nube de palabras” que nos ayudará a entender un poco más el tipo de lingüística preferido por el presidente en este discurso

En concreto, este discurso tiene una carga de agradecimiento como es de entender de alguien que deja su cargo. Muy enfocado a las personas y elaborando comentarios sobre los temas problemáticos con los que se despide su gobierno. Muy al estilo Trump, algunas palabras denotan extremos, pero generarán empatía con su seguidores y partido.

El discurso de entrada de JOE BIDEN

Corriendo un proceso similar, tan sencillo como replicar el código, pre-procesamos el discurso de BIDEN que puedes encontrarlo aqui.

Respecto a la carga de mensajes, 45 de los 53 mensajes tuvieron una carga positiva. En proporción, menos que los de TRUMP, y mayormente porque algunas emociones que provocaría BIDEN en su discurso serían para provocar preocupación de la situación “caótica” en la que le “entregan” al gobierno.

Cuando revisamos las palabras más frecuentes del discurso encontramos terminología clásica en discursos presidenciales. Tales como “América”, “Nación”, “Democracia”, “Presidente” y “personas”. Con estas palabras invoca mensajes a una audiencia específica, al pueblo de los Estados Unidos.

Aqui una imagen generada con esta información

¿Para qué nos puede servir el análisis de NLP?

  • Analizar tickets de clientes
  • Clasificar prioridad de dudas o mensajes
  • Entender el contexto y campos de texto en variables
  • Generar predicciones
  • Entre otros…

Los mejores usos a este tipo de métodos se les da en aplicativos usando datos de redes sociales. Como es el caso de Twitter. Por ejemplo, aqui se analizan los datos de los últimos 250 tweets al corte de @JoeBiden

Hasta aqui la columna de hoy, cuéntanos en nuestras redes sociales @DatlasMX qué otro tipo de aplicaciones existen para NLP. Comparte y suscríbete a nuestras cuentas.

Equipo Datlas

– Keep it weird-

MAPA DEL Crimen en méxico al 2020 – datlas manuales

En México y en LATAM cuando se trata de la agenda pública del 2021 hay que reconocer que la seguridad es uno de los temas que sigue pendiente por trabajar. Los niveles siguen incrementando año con año y el COVID-19 está dejando a muchas personas desempleadas, acelerando la movilidad entre regiones y generando una mayor crisis económica conforme los controles de aislamiento incrementan.

En esta columnas tomaremos de referencia la reciente publicación de @diegovalle, científico de datos que ha dedicado ya bastantes años a analizar datos de inseguridad y narcotráfico en México, para compartir un desarrollo sobre mapas de crímenes en la ciudad de México (CDMX o Mexico City).

¿Cómo funciona Hoyo de Crimen?

Es una ventanilla única hacia datos de seguridad para México. El sistema proyecta información de fuentes oficiales, las contraste y simplifica la navegación entre datos relevante mediante el uso de infografías, tableros y mapas. En esta ocasión, claro está, hablaremos del mapa. Si quieres conocer más te invitamos a revisar nuestro blog donde revisamos más datos de inseguridad .

Ejemplo de visualización sobre la CONDESA en CDMX

La herramienta integra información de:

– Homicidio doloso

– Robo de vehículos

– Robo a transeunte

– Robo en metro, microbus o taxi

– Robo a casa habitación

– Robo a repartidor o transportista

– Secuestro

– Violación

La información es proyecta en cuadrantes de acuerdo a la información documentada aqui.

¿Cuánto robo ha habido en la zona de la CONDESA?

Click para ver en grande

En la herramienta podemos contrastar año con tra año visualmente. También añadir filtros por horas para identificar qué horarios son los más seguros por cuadrante.

¿En qué cuadrantes se han incrementado los homicidios, violaciones y secuestro?

Click para ver en grande

Al menos en la región de análisis en la Condesa y alrededor de la misma se han reducido las ocurrencias de homicidios el 2020 en contraste al 2019

¿Cómo se registran los robos a repartidores? (De los que les veo más potencial para apoyar a RAPPI, UBEREATS, DIDI, ALSEA, entre otros)

Click para ver en grande

¿Tarifas dinámicas? Tradicionalmente varían con respecto a la distancia y el tiempo estimado de entrega, la cantidad demandada y la oferta. Imagínate que el riesgo de la zona sea un factor que calibre una tarifa apropiada para la exposición que tendrá un, por ejemplo, repartidor o chofer.

En el futuro, el monitoreo en ciudades inteligentes para delegaciones y municipalidades se parecerá mucho a sistemas como estos. Si quieres conocer más te invitamos a seguir a @diegovalle en sus redes y visitar https://hoyodecrimen.com/en/map para monitorear los incidentes en CDMX.

El potencial de la inteligencia de ubicación es enorme. Si quieres continuar aprendiendo te recomendamos leer el blog “Location intelligence, el santo grial de la analítica” y escuchar el podcast sobre datos de inseguridad que grabamos con la startup ALEPHRI.

Equipo Datlas

– Keep it weird-

algoritmos de censura – entendiendo POR QUÉ BLOQUEAN CUENTAS DE PRESIDENTES EN REDES SOCIALES (trump en twitter) – DATLAS COLUMNA DE OPINIÓN

Recientemente, una de las notas internacional fue cómo a uno de los líderes mundiales lo censuraban a través de un bloqueo en la red social de twitter. Esta red, al igual que facebook, instagram o similares, siempre ha tenido filtros de censura impidiendo contenido que incite a la violencia o promueva la pornografía. Debido a que no hay fuerza humana capaz de “auditar” todo el contenido de la red se programan algoritmos para levantar alertas y monitorear cuentas puntuales . Pero ¿Por qué la cuenta del presidente de Estados Unidos Donald Trump fue bloqueada? En esta columna explicaremos algunos de los motivos para que un algoritmo levante una bandera de “alerta” sobre este tipo de cuentas. Todo esto usando la narrativa del libro de Cathy O’neil “Weapons of math destruction” (Armas de destrucción matemática).

Recomendaciones de libros para empezar el 2021, en la esquina superior derecha “Weapons of math destruction”

La antesala ¿Qué algoritmos “protegen” el contenido en una red social?

Te recomendamos leer nuestra columna sobre “Algoritmos supervisados” para un mejor entendimiento de esta columna.

En un minuto de internet se genera el siguiente contenido

No hay poder humano ni empresa que pueda auditar o prever el mal uso de este tipo de redes. Pero la censura es importante, una red social, un medio de prensa y los intereses de sus inversionistas, se pueden ver fuertemente impactados si no se cuida su contenido. En el peor de los casos imaginense que nadie gobierne sobre las fotografías que se comparten en Facebook y haya muchas cuenta que promueven pornografía infantil. Esto seguramente molestará a millones de usuarios que sólo entraban para conectar con sus seres queridos a la red.

De manera análoga, en la red social de Twitter, que es una red menos visual donde se publican mensajes de texto de máximo 280 caracteres. Se puede incitar, sobre todo con cuentas con grandes base de seguidores, al odio, a la confusión o a cometer crímenes. Ha sido el caso durante el COVID-19 que la promoción de #fakenews o noticias falsas ha sido bastante distribuida. Te recomendamos revisar nuestra columna sobre “Fake News” aqui.

En ese sentido, al habilitar una red tan grande de personas donde se promueve el diálogo y la publicación de contenido, es una necesidad generar mecanismos adecuados de monitoreo. Sin embargo, es fácil entrar en debate, porque los grupos que controlan estas redes podrían tomar un “sesgo” o interés.

¿Cómo funciona un algoritmo de censura?

Un algoritmo de censura, en realidad es una aplicación de un algoritmo de aprendizaje automático. Se puede manejar de distintas formas, depende del analista o científico de datos, pero existen muchos estándares. Primero que nada recordemos que existen algoritmos supervisados y no supervisados. Los supervisados requieren una base , una historia o un catálogo para ser entrenados y asemejar los nuevos hallazgos con los que tienen en su base. Por otro lado, los no supervisados, no tienen un marco definido por el cuál “asociarse”. Los algoritmos van encontrando patrones y mapeando características que pueden ordenar o asignar a un grupo determinado.

En ambos casos, los algoritmos pueden encontrar con apoyo de “etiqueteo” para optimizar los resultados. Por ejemplo te ha pasado que tu celular detecta a tu mascota en todas las fotos que aparece en tu celular. Como usuarios podemos etiquetar en las fotos a objetos o mascotas, por ejemplo en este caso a tu perro que se llama “lobo”. Después aplicativos como Google Photos pueden darte resultados cada ves que en la barra de búsqueda de tu carpeta colocas la frase “lobo”. De esa manera tu etiquetaste para el algoritmo de detección de imágenes a lobo y con eso te puede dar una mejor experiencia de usuario.

Otro ejemplo de este tipo de etiquetas es cuando un “captcha” para identificar que no eres un robot te pide detectar objetos como el siguiente ejemplo.

En términos muy resumidos y prácticos asi funciona un algoritmo de censura. Pero en lugar de tener objetos, mascotas o un glosario que asociar está preparado para alertar a “power-users” y reaccionar sobre contenido catalogado como prohibido o peligroso. De acuerdo a su programación, accionan y censuran en automático, o en otros casos filtran para que los casos específicos sean monitoreados por humanos.

Como establece el libro “Weapon of math destruction” (parafraseando) , vivimos en la era del algoritmo, así como hay casos donde equipos de basquetbol, patrullajes de policías y/o exámenes de orientación académica se ven beneficiados de algoritmos es una realidad que es un arma de doble filo. Un algoritmo de censura mal ejecutado pudiera mostrar racismo, discriminación, preferencia a usuarios con más seguidores o similar.

¿Qué son algunas de las cosas que pasaron para bloquear las cuentas del presidente de Estados Unidos?

Al día de hoy Twitter ha bloqueado la cuenta de @realDonaldTrup. Una cuenta con casi 89 millones de seguidores con motivos de incitar al odio.

A continuación algunas situaciones que anticipaban esta situación

1) Bloqueo por actividades sospechosas

Se hacen publicaciones de manera constante que sólo te sacan de la red si justificar motivos

2) Reportes de usuario

Una cantidad significativa de usuarios ha bloqueado deliberadamente una cuenta

3) Etiqueta de usuarios como contenido dañino

Usuarios han “flageado” o “bandereado” tweets compartidos como sensibles

4) Faltas a los pronunciamientos de compañía por temporada electoral

5) Más sistemas de bloque sobre las reglas de comunidad de Twitter

Reflexión final

Hasta aqui la columna de hoy. Los algoritmos de censura continúan teniendo mayor relevancia en la medida que las redes sociales van tomando mayor relevancia comunitaria. Por otro lado las autoridades están más vigilantes que nunca de la política de privacidad

En el libro citado, mencionan que quien se quede atrás verdaderamente corre el riesgo de perder el juego de la “economía de los datos”. Lo que quiere decir que este tipo de tecnologías y algoritmos como las de twitter podrán ser comercializados a otras redes en el futuro. Y, por qué no, comenzar a auditar líderes mundiales o usuarios que rompan las reglas de la red social .

Cuéntanos qué opinion tienes sobre los algoritmos de censura y qué otros libros podrán soportar un mejor entendimiento de este tipo de bloques.

Equipo Datlas

– Keep it weird –

Temas: Inteligencia de Datos y Transformación digital