Archivo de la etiqueta: analitica avanzada

¿Cómo identificar A un impostor de datos? – datlas emprendedores

Ya conoces de nuestras otras columnas que hemos hablado que además de los científicos de datos hay muchos otros roles en el campo de la analítica avanzada de datos. Puedes leerlo en “Los 5 perfiles en una estrategias de datos”. Quienes no redujeron presupuestos en pandemia han creado nuevos departamentos de analítica avanzada. Esto aplica para compañías de todo tipo de tamaño. Por lo mismo, la demanda de capital intelectual de ciencia de datos se ha incrementado y la oferta es insuficiente. Por esta razón, existen situaciones en las que personas con poca o insuficiente formación en el campo atienden proyectos de analítica. La falta de respaldo en el campo se empieza a traducir en altas rotaciones, pérdida de fe en retornos de inversión para proyectos de ciencia de datos y/o reducción de presupuestos. En esta columna compartiremos algunos consejos de cómo detectar a “impostores de datos” con algunas revisiones puntuales al momento de entrevistar personas.

1) Los charlatanes de datos se esconden en todo tipo de equipos y áreas. Se rodean de gente capaz, pero se camuflajean entre la estadística y los análisis de negocio

Es útil entender que analítica y estadística son dos tipos de campos de dominio distintos. En estadística se aprende a entender el valor más allá de los datos, sintetizando un entendimiento global de variables a partir de tendencia central, identificando problemas en una serie de tiempo, excepciones en variables categóricas y más que nada encontrando significancias. Un analista, por otro lado, está preparado para entender y dimensionar una base de datos con mayor conocimiento del campo de dominio del negocio. Generar a partir de relaciones conclusiones y mensajes de oportunidad para una empresa.

En la práctica, los roles de de ciencia de datos requiere la función híbrida. Un analista se quedaría corto si no conoce suficiente de estadística para validar pruebas de hipótesis. Y un conocedor de estadística requiere una visión global al momento de enfrentarse a un problema de datos. Cuidado de caer en la falacia de que estas funciones “duermen” por separado.

Te puede interesar leer “Por qué fracasan los proyectos de datos”

2) El arte de manejar la incertidumbre, los “outliers” (anomalías) y faltantes

Un buen analista es similar a un doctor al momento de iniciar un nuevo paciente. Lo primero es generar un diagnóstico, no importa cuántas personas hayan diagnosticado antes las bases de datos a trabajar, hay que realizarse una serie de preguntas sobre el problema de datos que se va a enfrentar. Alejarse de este diagnóstico es quedar fuera de un verdadero proyecto de ciencia de datos.

De hecho, puedes leer “Cómo construir un checklist para proyectos de analítica de datos”. Los impostores de datos muchas veces se enfocan más en entregar los resultados al jefe y olvidan la parte artesanal de curar los datos para tener la estructura de datos óptima para resolver un problema en especifico.

3) Más seducidos por el p-value significancia estadística que la significancia de los resultados para la estrategia del negocio

La obsesión por la técnica estadística no necesariamente está asociada a un buen desempeño como científico de datos. Tener talento académico y seguir los principios de estadística en un ejercicio de análisis de datos es importante. Pero debe haber una obsesión con generar resultados objetivos para el negocio.

Una vez que prioricemos ese objetivo, los verdaderos científicos de datos no se detendrán con su entendimiento estadístico. Querrán conocer e identificar el ADN del negocio.

4) El arte de generar variables para llegar conclusiones que hagan sentido

Un analista serio no comenzará su análisis con las variables que le entregaste para trabajar. Buscará explorar y desarrollar nuevas variables. Por ejemplo, cuando trabajas con latitudes y longitudes y quieres trabajar algún modelo como una regresión. Los campos no deben ser ingresados como tal ya que los modelos lo pueden interpretar como variable numérica y en realidad ni representan una dimensión. Debemos de generar un punto de referencia y la distancia hacia el mismo, como el los kilómetros del punto al centro de la ciudad, una escuela cercana, un hospital o algo similar. Para que nuestra conclusión de regresión pueda ser interpretada como “por cada cambio en X variable, existe un cambio en Y”. Por “cada kilómetro que más me alejo del centro de la ciudad, cae X nivel de ventas”. Es común en las pruebas aplicadas para científicos de datos poco preparados este tipo de carencias salgan a relucir.

Si quisieras saber algunos consejos de cómo deberías reclutar a tu equipo de analítica no te olvides leer “Diseño de perfiles y áreas de analítica en organizaciones”. o escuchar nuestro podcast “Café de Datos”.

5) Un charlatan de datos llega a conclusiones demasiado rápidas… a conveniencia

Un experimento de datos no se puede declarar exitoso si sólo se pone a prueba con una serie de datos. Un buen “Testing” es aquel que se experimenta en distintas condiciones, con datos que estuvieran vigentes en temporalidades distintas y , si es posible, estresado bajo modelos contrastantes.

Un charlatán de datos usará más de su tiempo en convencerte que el primer resultado fue el correcto o que su método es el único en lugar de buscar formas de contradecir el ejercicio inicial iterando con otros datos el modelo en cuestión.

6) La culpa es del modelo que fue tonto, no mía

La última, tiene más que ver con una actitud, pero un impostor de datos hará responsable “al modelo”. Hará referencia a que es de “caja negra” y que no es posible explicar el impacto de cada variable al resultado. Mucho cuidado con estos colaboradores de “falta de accountability”, porque además de mostrar poca capacidad de ajustar un modelo a una nueva realidad, muestran limitantes para poder explicar lo que hicieron y eso puede ser un peligro para la organización.

Comentarios finales

Recuerda que, como lo establecimos antes, “No necesitas un doctorado para aprender de data science, pero tampoco se aprende en una clase de 2 horas”. Los impostores de datos y análisis requieren precauciones y es importante continuar elevando el rigor de la materia. Te recomendamos buscar elevar los estándares en tu organización siguiendo estos consejos y leyendo alguna de las columnas que citamos

Equipo Datlas

– Keep it weird-

Fuentes y referencias originales

– Science of Fake. Fuente: https://www.lazerlab.net/publication/%E2%80%9C-science-fake-news%E2%80%9D

– How to spot a charlatan. Fuente: https://towardsdatascience.com/how-to-spot-a-data-charlatan-85785c991433

Inteligencia Artificial y Big Data en los negocios, ¿Qué efectos tuvo el COVID-19 en estas tendencias? – DATLAS Investigación

A inicios de año se nos presentó un reto sin precedentes que afectó completamente la forma en la que hacemos negocios. En respuesta a este gran cambio muchas empresas hicieron un replanteamiento de estrategias y objetivos al final del primer semestre del año. Nosotros no fuimos la excepción, como proveedores nos tocó presenciar de primera mano como muchos negocios lidiaban en distintas maneras con este reto de la pandemia. Fue ahí, justo unos meses después del gran shock inicial que comenzamos a notar una revaloración que las empresas estaban haciendo respecto a sus datos, como un activo clave, y por ende acerca de tecnologías como la Inteligencia Artificial (I.A.) y el Big Data.

Datlas_Blog_Promo_SuscriberFree

Comprometidos con seguir aportando a nuestro ecosistema, y conscientes de lo que estábamos presenciando, organizamos un Programa de 6 Sesiones para este segundo semestre del año (una vez al mes) en donde exponemos con casos de negocios reales los beneficios que empresas de todos los tamaños han podido capitalizar el uso de datos y aprovechar estas tecnologías. Justo este viernes tendremos nuestra segunda sesión titulada “El impacto del Big Data y la Inteligencia Artificial en los negocios” y es por ello que, en esta columna, hablaremos de como estas tendencias han impactado el mundo de los negocios y que tanto la pandemia a “afectado” su adopción.

La relación del Big Data & la I.A.

Antes de profundizar es necesario dejar en claro la razón de hablar en conjunto acerca del Big Data y la Inteligencia Artificial. En un sentido general el Big Data se refiere a esta manipulación de grandes cantidades de datos o información en diversos formatos, mientras que la Inteligencia Artificial (I.A.) se refiere a programas computacionales que son capaces de emular actividades del cerebro humano como el aprendizaje con base a experiencia (eventos pasados). Siendo así, no podemos hablar de Inteligencia Artificial sin hablar de Big Data dado que para construir modelos o algoritmos de I.A. se necesitan datos, que precisamente son obtenidos y manipulados por el Big Data.

¿Qué impacto esperábamos hace algunos años?

Apenas hace un par de años (2018), según información de Deloitte, 9 de cada 10 ejecutivos afirmaban que los sistemas de I.A. transformarían sus modelos de negocio.

datlas_mx_blog_deloitte_encuesta

Además, se esperaba que la Inteligencia Artificial diera lugar a la aparición de nuevos perfiles profesionales que debían convivir con los ya existentes. Estos perfiles especializados abren un nuevo abanico de posibilidades innovadoras que afectan directamente a procesos y herramientas, que ven mejorado su rendimiento.

Impacto actual

Actualmente, lejos de verse mermado el acelerado crecimiento y adopción de soluciones de I.A., por ejemplo, se ha visto una expansión interesante a nivel mundial y también en Latinoamérica. En el caso de asistentes virtuales inteligentes (tipo Siri y Alexa) en Latinoamérica se manejan más de 850 millones de conversaciones en negocios B2B y B2C para atraer, generar, crecer y retener clientes. Y este es solo un tipo de aplicación y una de las múltiples formas de derivar beneficios.

Por otro lado, el Big Data se utiliza para promover productos, desarrollar mejores estrategias comerciales, llegar a los clientes, explorar nuevos mercados y audiencias objetivo, optimizar el flujo de trabajo, reducir los costos y obtener otras ventajas competitivas en el mercado.

Natural Language Processing: A Short Introduction To Get You Started |

Ahora bien, sabemos que no todos los negocios han sufrido esta pandemia de la misma forma. Existen sectores o industrias que han sido impactados de forma más crítica, mientras otros han podido lidiar con esto de una manera menos acelerada. De la misma forma el impacto que estas tendencias del Big Data y la I.A. han tenido en las distintas verticales de negocio ha sido variado, en términos de sus aplicaciones, pero igualmente relevante y trascendente. Por mencionar algunos ejemplos puntuales profundizaremos en industrias como: retail, marketing y publicidad, así como el transporte y logística.

Retail, Marketing y publicidad

La tarea más frecuente de las soluciones de Big Data está relacionada con la búsqueda de patrones de comportamiento que se puedan emplear para muchos propósitos. Comprender los hábitos y deseos de los clientes es la principal preocupación de cualquier negocio, y el análisis de Big Data es la única forma válida de lograr resultados precisos basados en un gran muestreo y cálculos extensos en lugar de intuiciones y experiencias personales.

Otra aplicación común de Big Data en las empresas de retail, marketing y publicidad es el análisis predictivo sobre la base de grandes conjuntos de datos. La mayor cantidad y volumen de datos permite obtener resultados más precisos, configurar más parámetros antes del análisis e incluso ampliar los temas y las posibilidades generales de pronóstico.

Qué es el Big Data Marketing y qué ventajas ofrece?

Transporte y logística

Las empresas de transporte también manejan grandes volúmenes de información sobre vehículos, pasajeros, equipaje y carga. La necesidad de administrar flujos de datos extensos con restricciones de tiempo estrictas impuestas por los horarios de transporte requiere soluciones de software de alto rendimiento diseñadas específicamente para Big Data.

El propósito práctico de tales soluciones radica en rastrear la entrega de carga, monitorear el uso y suministro de combustible, el estado técnico del estacionamiento de vehículos de la empresa, los controles de salud de los conductores y el horario de trabajo, así como muchos otros factores relevantes. De esta forma, las empresas pueden utilizar el software Big Data para priorizar la seguridad además de la optimización habitual del consumo de recursos y la mejora de la eficacia.

How does Big Data save logistics? - How does Big Data save logistics? -  Régens

¿Cómo pinta el futuro?

Los analistas empresariales predicen que los ingresos del mercado global de Big Data alcanzarán los 103 mil millones de dólares en 2027. No importa si tu empresa es grande o pequeña, siempre hay una forma de beneficiarse de las soluciones de Big Data. La ventaja más importante que ofrece esta tecnología es el conocimiento de las necesidades y los patrones de comportamiento de los clientes. Esta información, junto con los pronósticos de alta precisión permite a los empresarios diseñar estrategias comerciales efectivas en lugar de perder tiempo y dinero en el método de prueba y error. La capacidad de manejar grandes volúmenes de información utilizando soluciones de software automatizadas también simplifica enormemente la gestión empresarial, incluidos aspectos como mantenimiento, inventario, envío, carga de trabajo y otros.

Si quieres conocer un caso real aplicado de Big Data e Inteligencia Artificial y enterarte de como puedes tu mismo comenzar a aplicar estas tecnologías en tu negocio el próximo lunes, no te pierdas nuestra sesión este viernes. Inscríbete gratis aquí.

datlas_mx_6_sesiones_2S2020_bigdata_analytics_ia_sesion2_promo