Archivo de la etiqueta: Datlas

UNA REFLEXIÓN BALANCEADA DEL DOCUMENTAL DE NETFLIX: CODED BIAS ¿ INTELIGENCIA ARTIFICIAL RACISTA? – COLUMNA DE OPINION DATLAS

Desde el equipo de Datlas y los autores de las columnas de este blog nos encanta la generación de contenido y difusión sobre temas de analítica, inteligencia artificial y transformación digital. Hemos hecho columnas de documentales como el dilema de las redes sociales: “3 REFLEXIONES SOBRE “SOCIAL DILEMMA” y publicado opiniones sobre nada es privado: “3 reflexiones de Great Hack”. En esta ocasión hablaremos del documental recientemente lanzado llamado “CODED BIAS” que hace referencia a situaciones donde la inteligencia artificial ha mostrado ser racista.

***SPOILER ALERT*** : Si aún no has visto el documental, tal vez quieras detenerte un poco y regresar a esta lectura para no arruinarte o sesgar tus pensamientos.

Los antecedentes ¿De qué trata?

Un estudiante del MIT identifica un problema evidente en la tecnología de la detección facial. Este desarrollo, desde su nacimiento y entrenamiento (Te recomendamos leer “Algoritmos supervisados y no supervisados” para mejorar tu comprensión de este tema), no está preparado para ser usado con la misma eficiencia por personas de color. Este es el preámbulo de toda una controversia de poderes y autocrítica a los desarrollos de inteligencia artificial de la actualidad y la problemática de la toma de decisiones habilitadas por computadora con modelos de “cajas negras” (Esto quiere decir, en pocas palabras, que son modelos donde no podemos identificar con claridad el efecto de cada variable tomada en el resultado o la justificación exacta de un resultado matemático. Solamente un % de ajuste que nos hace sentir matemáticamente certeros de que es el mejor modelo).

¿En cuál problema se centra el documental?

En un problema social. La temática de racismo y discriminación no es nueva en el contexto de la inteligencia artificial. Muchas de las empresas e investigadores que son pioneros en generar sistemas de identificación utilizan condiciones de “entrenamiento de sistemas” con un sesgo demográfico y socioeconómico.

Al no haber la diversidad suficiente en un equipo de desarrollo de algoritmos las predicciones de, por ejemplo, una cámara de seguridad que alerta cuando una persona “parece terrorista en una aeropuerto” , pueden estar vinculadas a una carga cultural y/o sistemática incorrecta.

Ejemplo citado en la película de cómo la policía local de una región del Reino Unido que utilizan cámaras y algoritmos de “profiling” para detener y entrevistar ciudadanos que, a criterio de su sistema, parecen sospechosos han fallado el 91% de las veces

¿Cuál es el problema de continuar con aplicaciones de inteligencia artificial como “facial recognition” o la “identificación facial” sin reconocer y cuidar los sesgos inherentes?

Si el futuro del mundo está alrededor de la inteligencia artificial (IA) y esta es un reflejo de la sociedad entonces tendremos sistemas sesgados.

Ejemplo de asertividad para identificar personas considerando distintas tecnologías: Azure, IBM y FACE (Empresa China)

Esta es una conversación que no es nueva. Constantemente se hacen estas “auditorias” a empresas de tecnología. Bastantes líderes den el sector tecnológico han empoderado un mensaje claro de que no debemos de dejar que la IA gobierne las decisiones humanas sin entender verdaderamente cómo funciona

Recordemos el caso de Steve Wozniak, uno de los fundadores de Apple, que tan pronto la empresa de tecnología lanzó su tarjeta de crédito obtuvo un crédito 10 veces del tamaño del de su esposa. Siendo que comparten cuentas bancarias, antecedentes crediticios y propiedades.

“La aparición estelar: Cathy O’neil”

En el documental “Coded Bias” hay un personaje que hace su aparición y honra decirlo. A opinión personal, el documental debió tratarse de ella. Nos referimos a Cathy Oneal, la autora de “Weapon of Math Destruction”

Cathy es una especialista en el tema de algoritmos, matemática de formación y con mucha experiencia en el diagnóstico de modelos de inteligencia artificial. Comenzó su carrera en la academia y después paso al mundo financiero donde algunas “formas” y consecuencia sde todos los modelos que se trabajaban le empezaron a “sonar raro”

Ha identificado y denunciado algoritmos que han tenido interpretaciones incorrectas en sectores bancarios hasta el mismo sistema legal norte-americano.

Aunque su intervención en la película es pequeña, si has leído alguno de sus libros podrás entender el valor que le aporta al movimiento impulsado por la película.

La reflexión final (opinión del autor de la columna, no a nombre de Datlas)

Mientras por un lado resulta “taquillero” hablar negativamente de la inteligencia artificial, sus impactos en el mundo y los problemas sociales que esta podría causar es justo decir que la conversación debe continuarse ampliando. Muy probablemente veamos nuevas series y documentales hablando del tema.

La temática de este documental no es nueva. Sin embargo había espacios para ser más técnicos y revisar los impactos de un mal uso de la IA en la sociedad. En ese sentido, en el casting debió de haber tenido más protagonismo una especialista en la materia como Cathy Oneil, con espacio para poder aprender mucho más de ella.

Por otro lado, si bien la IA ha generado potenciales problemas también hay muchos escenarios de impacto positivo. Un buen uso de IA y desarrollos con conciencia social auditados por un consejo especializado para reducir sesgos en los modelos pudiera dar brillantes resultados. Creo que esa parte de la historia faltó contarse en este documental que termina siendo algo dramático.

Documentales como estos tienen la oportunidad de hacer resonar propuestas de intervención escalables y transparentes para resolver las problemáticas que presentan. Faltó profundizar en más propuestas en este documental. Sin embargo podemos alegar que la directora Shalini Kantayya nos dejó esa tarea. Ahora tocará a la sociedad investigar más recursos para poder cuestionarnos la aplicación del IA.

Y ¿Cuáles son tus opiniones? Compártenos en @DatlasMX qué fue lo que te gustó y no te gustó del documental ¿Cuál fue tu mayor aprendizaje?

– Equipo Datlas –

Keep it weird

Herramientas tecnológicas de apoyo en monitoreo de incendios 🔥🚒 (Caso NUEVO LEÓN Y COAHUILA MARZO 2021) – investigación datlas

Los incendios forestales han sido tema de conversación para la segunda quincena de marzo 2021 particularmente en el Estado de Nuevo León y Coahuila. Estas dos regiones comparten cadenas montañosas, bellos bosques y sierras imponentes. Sin embargo, en días recientes se han desatado severos incendios. Estos no han podido ser controlados. Al contrario se han expandido en una buena parte de la zona. El equivalente a 100 parques Fundidoras (aproximadamente 126 hectáreas * 100) ha sufrido de incendios.

En esta columna compartiremos algunas tecnologías que pueden ser de apoyo al momento de monitorear estos incendios y sus impactos. Con esto buscamos habilitar y hacer conscientes a más personas sobre el cuidado de la naturaleza. De antemano, nuestra admiración total a todos los cuerpos de rescate y organizaciones que han apoyado para resolver este problema.

1) Google Timelapse para evaluar la evolución de una zona en particular con imágenes satelitales

Así como lo comentamos en “Evolución de mancha urbana” recomendamos usar para una aplicación como monitoreo de zonas afectadas de incendio esta gran herramienta de Google

Con esto podremos ver la evolución de una zona y si las sierras que antes eran de color verde han sufrido algunos impactos después de los incendios.

2) Landsat para obtener imágenes satelitales oportunas del proyecto COPERNICUS y LANDSAT (NASA y equipos satelitales)

Esta sofisticada herramienta permite investigar, recolectar y obtener imágenes satelitales oportunas. Casi diarias, de diferentes zonas del planeta. En este caso hicimos algunos ejercicios para revisar la sierra de Santiago y zonas de impacto del incendio.

En la herramienta podemos seleccionar una zona de interés y solicitar imágenes

Podemos también revisar un mapa por su orografía. particularmente colocar la profundidad de cada zona en diferentes tonos. Esto nos puede ayudar a detectar dónde hay valles. Zonas en donde el incendio puede ser más catastrófico y dónde más controlado.

Otras de las herramientas es la del contraste. Por ejemplo en este video usamos imágenes del 25 de marzo , donde se ven los accidentes que el incendio ha provocado. Y , por otro lado, cargamos información de hace un par de semanas cuando la sierra estuvo nevada por las bajas temperaturas

Finalmente y lo más interesante de la plataforma es la aplicación de filtros de contraste. Por ejemplo, el filtro vegetativo nos ayuda a identificar los residuos de zonas verdes que aún quedan. Por otro lado hay algunos filtros que son de apoyo para detectar incendios.

3) Purple Air para vigilar la calidad del Aire

Estos incendios han provocado impactos en la calidad del aire en las zonas urbanas aledañas. Tal es el caso de Monterey y la zona metropolitana donde toda la semana se ha tenido calidad de aire pésima y mala. Aunado a la COVID-19, las personas tienen que tener cuidado con el daño que esto puede generar en pulmones y/o ojos.

4) Storm Radar para responder ¿Cuándo va a llover?

Una herramienta adicional de apoyo para monitorear ráfagas de viento y lluvia es Storm Radar. La utilidad es que distintos equipos de rescate lo pueden tener en su teléfono inteligente y tomar decisiones de posicionamiento con respecto a los pronósticos esperados.

¿La oportunidad y cómo se está solucionando?

Actualmente se está monitoreando y trabajando en resolver estos incendios desde la Gubernatura del Estado de Nuevo León. También se entró en colaboración con el gobierno de Coahuila para actuar en sinergia.

Gobernador del Estado revisando las zonas afectadas

Foto tomada de: @JaimeRdzNL

La más reciente intervención también tiene usos de tecnología, pero de otro tipo. Se trata de un avión lanzador de agua para poder apoyar con los incendios. Además hemos notado que no han dejado de volar helicópteros de rescate toda la semana tratando de apoyar también.

Tweet tomado de @JaimeRdzNL

Hasta aqui el blog de hoy. Cuéntanos qué otras herramientas de utilidad consideras que apoyarían en el monitoreo de incendios forestales. Estaremos atentos en nuestras redes sociales @DatlasMX

Revisa nuestro podcast y los capítulos de nuestra 3er temporada. Te invitamos a suscribirte dando click en esta imagen

Equipo Datlas

– Keep it weird –

1 mes usando clubhouse desde latam y esta es la experiencia – datlas columna de opinión

Las redes sociales parecen uno de los territorios más dominados del internet. Hoy en día seguro pensarás en Facebook, Instagram, Whatsapp, Snapchat o Twitter. Haciendo esfuerzo por pensar en las de nicho tal vez mencionemos “Linked-in”, una de las redes profesionales con más usuarios y que hace un par de años fue comprada por Microsoft.

En esta columna hablaremos un poco sobre la nueva sensación de “Clubhouse” desde la perspectiva del equipo Datlas ya que tuvimos acceso hace ya casi 1 mes a este aplicativo en México.

Pero… lo que es una realidad, ahora más que nunca en pandemia donde estamos o deberíamos estar aislados en nuestros hogares la gente ha buscado nuevas formas de conectar. Una opción que ha tenido mucho crecimiento en atención es “Clubhouse” (CH), una app móvil (ahora sólo para IOS iphones). En esta red social los usuarios conectan con otras personas mediante foros de interés con tópicos específicos como ventas, liderazgo, startups , música, deportes, entre otros. Estos foros tienen locutores , moderadores y participantes que generan un diálogo abierto estilo entrevista de podcast. Recientemente ha aumentado su número de seguidores significativamente.

La “exclusividad” generada en Clubhouse

De acuerdo al sitio “https://www.businessofapps.com/” la app fue lanzada el 8 de abril del 2020 con sede en San Francisco, California, Estados Unidos de América. Los nombres de los fundadores son: Paul Davison y Rohan Seth.

A noviembre del 2020 la app tenía cerca de 200 mil usuarios. En diciembre sumaba 600 mil usuarios. Al día de hoy la app ronda los 2 millones de usuarios. Estas cifras se valoran con todo y que la app tiene “cierta exclusividad” ya que sólo puedes acceder por invitación. Cada nuevo usuario tiene 2 nuevas invitaciones. En el transcurso de este mes han liberado otras 4 a usuarios que entraron con anterioridad.

¿Su valuación? Ya rebasa el billón de dólares de acuerdo a algunos levantamientos de capital ($120 mdd en total) que les permitirán robustecer el desarrollo para soportar más usuarios y también lanzar para el sistema operativo ANDROID.

Los temas más comunes de salas de CH

Emprendimiento, deportes, inversión, fe, lugares de viaje, tecnologías disruptivas, viajes interplanetarios, salud, entre otros.

En realidad cada día nuevas comunidades se migran a CH. Mayormente son de habla inglesa, sin embargo hay espacio para todos los idiomas sólo hay que seguir a las comunidades adecuadas.

Personalmente, desde el ingreso, sólo hemos podido participar en un par de salas para hispanohablantes entrando al club de “Latin America Tech Club”. Aún falta que la comunidad de LATAM crezca, siguen protagonizando las charlas en inglés.

Generando “viralidad” en la red

Elon Musk, serial entrepreneur, at TED2013: The Young, The Wise, The Undiscovered. Wednesday, February 27, 2013, Long Beach, CA. Photo: James Duncan Davidson

La red se ha vuelto muy famosa porque hay algunos líderes globales que están buscando otras opciones adicional a sus redes actuales. Por ejemplo, Twitter, ha censurado y elevado las reglas de diálogo por lo que algunos están migrando algunas de sus conversaciones a redes como CH.

Por ejemplo, ELON MUSK, visitó la red hace un par de días y las salas se desbordaron. Se pretendía que iba a anunciar un nuevo lanzamiento, ajustes a su tecnología, hablar sobre su calendario de vida y/o lanzar la nueva crypto-moneda donde está participando.

En fin, muchos de estos temas fueron especulaciones, pero lo cierto es que en cosa de milisegundos la sala donde se presenció este evento llegó al limité de los 5,000 participantes.

Se especula que la red tiene iniciativas de atraer un programa de influencers así como atraer más famosos. Ashton Kutcher, por ejemplo, también ha participado. Muchísimos fundadores de startups en crecimiento también han sido moderadores en diálogos.

Futuro de Clubhouse

Los programas de CH se están haciendo más recurrente. Las comunidades están haciendo salas semanales donde convocan a grupos de personas para dialogar sobre un mismo tema. Hay verdadero valor agregado en el “conocimiento colectivo” que se obtiene en las conversaciones. Clubhouse llegó para darle más poder a la “voz” que nunca antes.

Actualmente la exclusividad ha hecho que el centro de gravedad en la red sea para quien tiene contactos pero en un par de meses se espera que haya formas de dar “propinas” o pagar un “ticket” de entrada a ciertos cuartos en específico.

De cualquier forma, CH, continuará creciendo su base de usuarios. Pero las otras redes no se quedan atrás. Los fundadores de Twitter y Mark Cuban (Shark y dueño de equipo de la NBA Dallas Maverick) han dado indicios de redes con aplicaciones de voz similares.

Recomendamos investigues esta red y si te gusta la propuesta busques añadirte a la lista de espera para involucrarte a conversaciones tan pronto sea posible ¿No te hubiera encantado ser de los o las primer@s en Linkedin o Twitter? Parece que esta es la oportunidad aqui en CH.

Hasta aqui la columna de hoy, te recomendamos conocer todo nuestro contenido gratuito dando click aqui. ¿Ya estás listo para usar CH? Búscame como @pedrovallejo

Equipo Datlas

– Keep it weird –

Fuentes:

ANÁLISIS NLP de discursos presidenciales en eua: biden vs trump – datlas investigación

La semana pasada el protagonismo para la audiencia en Estados Unidos de América y la mayoría de países del mundo fue el cambio en el liderazgo presidencial del país. Después de unas controversiales votaciones, Joe Biden del partido Democrático ganó y paso a ser el nuevo presidente de los Estado Unidos por un período de 4 años.

Dejando atrás la controversia electoral, en esta columna nos enfocamos a desarrollar un análisis de NLP (Natural Language procesing o procesamiento de lenguaje natural) de los discursos presidenciales. Por un lado el de salida desarrollado por Donald Trump y por otro lado el de entrada, ejecutado por Joe Biden.

Te pudiera interesar los análisis que hemos hecho para los discursos de AMLO, el presidente de México, en el 2018 y 2019.

¿Qué es el procesamiento de Lenguaje natural o NLP?

Es un campo de la inteligencia artificial que estudia las interacciones entre computadoras y el lenguaje humano. Son utilizados en el estudio de discursos escritos o hablados. En este caso, por ejemplo, de un discurso presidencial.

El discurso de salida de Donald TRUMP

El discurso de salida de la presidencia de Trump estuvo cargado de agradecimientos y mensajes que algunos consideran de “venganza” o dejando claro que “regresará” de alguna u otra manera al escenario político de Estados Unidos. Si quieres leer el discurso completo te recomendamos ver la siguiente liga.

Como primer paso, pre-procesamos el discurso y lo dividimos en distintos enunciados más pequeños para que pueda ser procesado correctamente. Usando la librería ” library(SentimentAnalysis) ” en R contamos la cantidad de palabras por cada uno de los enunciados.

Posteriormente, y tomando en cuenta un diccionario de palabras que asocia cada término con un puntaje que representa 3 niveles de connotación en cada palabra: negativa, neutral o positiva, se analiza el nivel de cada uno de los enunciados.

Es posible obtener el nivel generalizado de cada uno de los enunciados su nivel. En ese sentido encontramos que para el discurso de trump 20 de los 23 enunciados desarrollados fueron con una mayor carga positiva

Respecto a las palabras, podemos realizar un conteo de las más usadas y así construir una “nube de palabras” que nos ayudará a entender un poco más el tipo de lingüística preferido por el presidente en este discurso

En concreto, este discurso tiene una carga de agradecimiento como es de entender de alguien que deja su cargo. Muy enfocado a las personas y elaborando comentarios sobre los temas problemáticos con los que se despide su gobierno. Muy al estilo Trump, algunas palabras denotan extremos, pero generarán empatía con su seguidores y partido.

El discurso de entrada de JOE BIDEN

Corriendo un proceso similar, tan sencillo como replicar el código, pre-procesamos el discurso de BIDEN que puedes encontrarlo aqui.

Respecto a la carga de mensajes, 45 de los 53 mensajes tuvieron una carga positiva. En proporción, menos que los de TRUMP, y mayormente porque algunas emociones que provocaría BIDEN en su discurso serían para provocar preocupación de la situación “caótica” en la que le “entregan” al gobierno.

Cuando revisamos las palabras más frecuentes del discurso encontramos terminología clásica en discursos presidenciales. Tales como “América”, “Nación”, “Democracia”, “Presidente” y “personas”. Con estas palabras invoca mensajes a una audiencia específica, al pueblo de los Estados Unidos.

Aqui una imagen generada con esta información

¿Para qué nos puede servir el análisis de NLP?

  • Analizar tickets de clientes
  • Clasificar prioridad de dudas o mensajes
  • Entender el contexto y campos de texto en variables
  • Generar predicciones
  • Entre otros…

Los mejores usos a este tipo de métodos se les da en aplicativos usando datos de redes sociales. Como es el caso de Twitter. Por ejemplo, aqui se analizan los datos de los últimos 250 tweets al corte de @JoeBiden

Hasta aqui la columna de hoy, cuéntanos en nuestras redes sociales @DatlasMX qué otro tipo de aplicaciones existen para NLP. Comparte y suscríbete a nuestras cuentas.

Equipo Datlas

– Keep it weird-

Dashboards de negocios, guía para principiantes – Datlas

Un avión donde viajan 300 personas que puede ser conducido por 2 personas, una megaciudad de más de 5 millones de habitantes conducida desde un “war-room” (C4 ó C5) con 20 personas, o la gestión de un mundial de fútbol en más de 20 ciudades a la vez controlado por un equipo de 40 profesionales ¿Qué herramienta tienen en común?  Todos en algún momento usaron dashboards.

Datlas_barra_suscribir

En los negocios ocurre igual. Un tablero de control o dashboard es un lugar donde se pueden monitorear los aspectos más importantes del quehacer de una organización. Sinedo así,en el campo de “inteligencia de negocios” o “business intelligence”, este tipo de herramientas le ayuda a los tomadores de decisiones y operativos a reaccionar de forma efectiva a cambios en el negocio.

1) ¿Qué es un dashboards de negocios?

Es un gráfica que refleja el estatus operativo de datos recolectados en tiempo real (o casi tiempo real) visualizados en una plataforma. Un ejemplo de lo que podría ver un empresa que se dedica a envíos de comida a domicilio en un dashboard.

El pase de diapositivas requiere JavaScript.

Así como los pilotos en un avión monitorean la altura, velocidad, ruta y otros aspectos del vuelo. En un negocio podríamos vigilar las órdenes , las ventas, tiempos de entregan las entregas exitosas, los artículos más vendidos, entre otros.

Te puede interesar nuestra columna titulada: Ranking de Dashboards de COVID-19.

2) Características de un dashboard

Para ser considerado un buen panel de control tendría que integrar:

  • Un sistema valioso de indicadores
  • Visualización e interacción intuitiva
  • Buena calidad de datos como insumo y amplitud en cortes temporales
  • Un sistema completo de arquitectura que permita actualización automática

Recomendamos que leas nuestro ejemplo en: Analítica en Dashboards para Turismo.

3) ¿Cuáles son los tipos de dashboards?

Datlas_niveles

  • Dashboard estratégico: Resume y sintetiza los indicadores más importantes de la compañía para tomar decisiones de manera rápida basadas en datos
  • Dashboards analíticos: Puede ser estratégico y operativo, destinado a que los equipos de mandos altos y medios puedan tomar decisiones de manera más ágil
  • Dashboards operativos: Enfatiza el reporteo de información constante y continua
4) ¿Qué acciones debería habilitar un dashboard?
A) Seguimiento a KPIs
Datlas_saludkpis

Una vez que se realizó el trabajo de planificación estratégica donde se delimitaron los KPIs que los equipos de trabajo deberán de cuidar para que los proyectos tengan buena salud es importante poder visualizarlo en el dashboard. Por lo mismo es útil generar un “semáforo” donde rojo sea señal de gran oportunidad para mejorar y verde sea buena salud.

B) Alertar de comportamientos fuera de rango o prevenciones
Datlas_alertas

Las mejores implementaciones de inteligencia de negocios generan tableros que están listos para alertar sobre comportamientos críticos o situaciones que necesitan inmediata atención. Idealmente estas notificaciones tienen que ser desarrolladas por las personas con más experiencia en la organización y con base a atender las oportunidades que de no atenderse podrían representar un costo no reemplazable a la compañía.

C) Monitoreo en tiempo real
Datlas_gif_Realtime_Dashboard

En una etapa más avanzada habrá que procurar que el monitoreo de los datos sea en tiempo real. Esto requiere necesidades más sofisticadas de infraestructura y que se cuenten con iniciativas de ciberseguridad para asegurar que no haya fugas de información. Esto permitiría una toma de decisiones más oportunas sobre datos que sean reales.

Cierre

Los dashboards permiten ser más eficientes y eficaces en la toma de decisiones operativas y en el cumplimiento de la estrategia de una organización. Hay que trabajar de la mano con el área o la función de planeación en nuestra compañía para generar buena calidad de KPIs, alertas y sobre todo garantizar que los datos más dinámicos sean actualizados en tiempo real.

Datlas_barra_suscribir

Si te interesa seguir conociendo más de este tema (KPIs y herramientas de medición te invitamos a nuestra próxima charla. Puedes registrarte aquí GRATIS: https://bit.ly/dfuturos4 

WhatsApp Image 2020-07-06 at 9.05.32 AM

También solicitar en nuestro marketplace una llamada para platicar sobre este tema y evaluar cómo con alguno de nuestros casos aplicados podemos ayudar a tu organización.

Fuentes:

Algoritmos Supervisados: Clasificación vs. Regresión – Datlas Research

Existen 2 métodos populares para Machine Learning cuando de métodos supervisados hablamos.  Nos referimos a los algoritmos de clasificación y regresión. Fundamentalmente, es importante que los lectores conozcan que los de clasificación predicen una “etiqueta” y los de regresión predicen una cantidad. En esta columna explicaremos de qué tratan, sus diferencias y compartiremos algunos casos de uso frecuentes.

Datlas_ML_Supervised_NotSupervised

¿Qué es aprendizaje de máquina (Machine Learning)?

Es una disciplina científica del ámbito de la Inteligencia Artificial que crea sistemas que aprenden automáticamente. Aprender en este contexto quiere decir identificar patrones complejos en millones de datos. La máquina que realmente aprende es un algoritmo que revisa los datos y es capaz de predecir comportamientos futuros. Automáticamente, también en este contexto, implica que estos sistemas se mejoran de forma autónoma con el tiempo, sin intervención humana. Veamos cómo funciona. (Leer en bibliografía en fuentes).

¿Qué significa algoritmo?

Conjunto ordenado de operaciones sistemáticas que permite hacer un cálculo y hallar la solución de un tipo de problemas. O una serie de instrucciones sencillas que se llevan a cabo en cierto orden para resolver una pregunta.

Datlas_Blog_Promo_SuscriberFree

Recordemos que estamos hablando en esta columna de algoritmos de la familia de de ML supervisada (Necesita datos “etiquetados” para ser entrenada, en contraste con la no supervisada que a partir de una serie de datos genera clústers o asociaciones).

Algoritmos de Clasificación

Predicen etiquetas o clases que se conocen a priori. El resultado deseado es una etiqueta discreta o específica. En el caso del modelo entrenado sea entre 2 clases, se determina como binaria. Si tenemos que predecir más de 2 clases se le conoce como clasificación multicategórica.

Técnicas:

Ejemplos de casos de uso:

  • Segmentación para estrategias de marketing. Cómo poder diferenciar estrategias de promoción y precio para mis usuarios. Te puede interesar nuestro blog “Segmentar Clientes usando mapas”
  • Categorización de siniestros. Podríamos categorizar las zonas más siniestradas de una ciudad entrenando un modelo con la historia de datos. De esta manera se podrían generar mejores rutas de patrullaje por los policías. Te puede interesar: “Categorizando choques y siniestros en Nuevo León”.
  • Predecir el éxito. Para hoteles u hospedajes de AIRBNB podríamos predecir si van a tener éxito o no considerando las variables que comunican en sus anuncios. Revisa: “AIRBNB amenaza o bondad en CDMX”.

Datlas_Promo_Facebook_Suscribe

Datlas_regression-vs-classification-in-machine-learning

Algoritmos de Regresión

Es útil para predecir productos continuos. La respuesta se presenta como cantidad. El valor predicho puede usarse para identificar la relación lineal entre atributos.

Técnicas:

Ejemplos:

  • Precios de vivienda. Estimar precios de inmuebles considerando variables como dimensión de propiedad, tamaño de construcción, pisos, recámaras y otras características. Te puede interesar nuestro blog “Desarrollando un valuador inmobiliario”
  • Predecir camas hospitalarias necesarias. Una oficina o secretaría de salud podría predecir con base a su histórico la cantidad de camas y doctores que serán necesarios el próximo año para atender a la demanda de la población. Un avance que pudieramos llevar allá es con la cantidad de mujeres embarazadas. Podrías leer nuestro blog sobre el tema.
  • Identificar las cervezas que necesitarás en tu inventario. Predecir la cantidad de inventarios es una de las aplicaciones más usadas en el sector retail. Podrías revisar nuestro blog ¿Cómo detectar cheves con Tensorflow?

Datlas_Promo_Podcast_Suscribe

Escenario para reforzar: NETFLIX

Un problema tomando en cuenta Netflix, proveedor de entretenimiento al que muchos de los lectores están suscritos. A cambio de una mensualidad pueden ver series y películas. Pero muy probablemente en su experiencia hayan recibido recomendaciones de los algoritmos de esta empresa que utiliza todos los “clicks” que damos en la interacción con su plataforma para mejorar la experiencia del usuario.

¿Cómo aplicaría un algoritmo de clasificación y regresión en este caso?

Si Netflix te recomienda una película. El problema de clasificación será si te gusta o no te gusta. Tratará de generar una lista de películas que tengan atributos que anteriormente ya te gustaron de otras películas. Pueden ser géneros, actores, tiempo que tarda o idioma, por decir algunos.

Ahora si un algoritmo tratara de predecir cuántas veces verías esa película. Se vuelve un problema de regresión. Netflix necesita estimar si sus recomendaciones le generarían una mayor carga en sus servidores por consumo de una misma película. En ese sentido usan técnicas de regresión para estimar cuántas veces y en qué momento consumirás ese contenido que te han recomendado.

Conclusión

Ahora que ya conoces esta diferencia te recomendamos ir a experimentar y continuar investigando un poco más por tu parte. Como la escena de la serie “Silicon Valley” donde generaron un modelo para predecir si un platillo era o no era “hot dog”… te recomendamos empezar tu modelo. A lo mejor con algo más serio.

Datlas_Clasificacion

Puedes usar IBM Watson, Microsoft Azure o los servicios de Google Tensorflow para hacer tus experimentos. Si necesitas nuestro apoyo o te gustaría conocer más sobre el proceso para generar un algoritmo exitoso que se pueda consumir de distintas formas no dudes en contactarnos en dirección@datlas.mx . También visita nuestro marketplace donde podrás encontrar este y otros servicios en nuestra sección de consultoría: https://www.datlas.mx/marketplace/

Datlas_Blog_Promo_SuscriberFree

Hasta luego

-Equipo Datlas-

Keep it weird

Fuentes:

Diseño de perfiles y áreas de analítica para organizaciones – Datlas Research

Con el equipo Datlas al año tenemos la oportunidad e participar en algunos foros donde se repite mucho preguntas sobre qué perfiles y cómo preparase para generar una estrategia de datos. En realidad, tal y como lo pudiste leer en ¿Por qué fracasan los proyectos de ciencia de datos? las personas y la forma en que diseñamos el quehacer de sus funciones en una organización son principal factor de éxito para una estrategia de analítica de datos.

En esta columna resolveremos dudas y compartiremos mejores prácticas sobre procesos de diseño, entrevista y reclutamiento de profesionales de analítica de datos e inteligencia artificial en una organización. Todo esto siguiente la guía de puestos presentada en 5 perfiles para una estrategia de datos en tu organización .Que te recomendamos leer antes para que puedas tener un mejor contexto.

Datlas_barra_suscribir

ESTRUCTURA ORGANIZACIONAL

El pase de diapositivas requiere JavaScript.

Una estructura de reportes, de jerarquía o de organización para proyectos es muy variante ya que responde a los retos estratégicos de la organización. Específicamente para los datos no hay que olvidar que buscamos que en un mismo equipo se encuentren ingenieros, arquitectos, científicos y analistas al mismo nivel. Esto último debido a que la colaboración y la comunicación debe ser colaborativa. Uno de los métodos que con más frecuencia se usa en la industria son las células de trabajo. Estos son grupos pequeños, pero eficientes, de trabajo que cuentan con todos los recursos para resolver un problema de analítica avanzada.

DISEÑO DE PERFILES

El pase de diapositivas requiere JavaScript.

Las personas que trabajen en el área de analítica necesitan tener ciertas características:

  • Aprendizaje constante. La actualización de modelos de análisis y algoritmos es casi semanal. De la misma manera las nuevas paqueterías sobre machine learning en software como R o Python. Los perfiles tendrán que ser personas que puedan descifrar textos académicos y documentación en guías de programación sobre los modelos más recientes.
  • Curiosidad técnica. Frente a nuevos retos habrá que mostrar curiosidad y no miedo ante nuevas herramientas. Se buscan perfiles “políglotas” que puedan trabajar en distintos lenguajes de programación, estadística de todo tipo y comunicar sus resultados desde un “Power Point” hasta un tablero dashboard en “Power BI”. No tenerle miedo a experimentar e investigar nuevas plataformas.
  • Didáctica para explicar hallazgos.  Quien es analista de datos puede ser un experto/a en matemáticas, pero mientras no sepa explicar lo que hace no podrá influir en las decisiones y orientaciones de la organización. Es importante que el arte de explicar las variables relevantes en un modelo esté presente.
  • Interlocutor con el área de negocios. “Data Translator” o similar, es una capacidad que permite llevar los retos de negocios a problemas estadísticos que puedan ser respondidos con las técnicas correctas de analítica avanzada.
  • Gestión de proyectos. Aunque probablemente una posición gerencial o de dirección será quien gestione proyectos. Es importante que el perfil se pueda alinear a las dinámicas de registro, seguimiento y coordinación de trabajo para desarrollar proyectos. Ser un profesional con noción de urgencia así como mostrar compromisos con fechas de entrega.

PROCESO DE RECLUTAMIENTO

El pase de diapositivas requiere JavaScript.

A los científicos de datos les gusta responder a retos y en el mercado laboral de ciencia de datos la entrada a un puesto suele venir acompañada de un buen reto de programación. Un buen postulante deberá poder resolver un reto en materia, ofrecer una visualización y poder comunicar de manera eficiente los resultados de un caso de negocio.

1) Definir estrategia de analítica avanzada y dimensionar las áreas funcionales que ejecutarán la estrategia

2) Recopilar retos actuales y retos futuros para diseñar puestos que respondan a estas necesidades

3) Generar dinámicas para atraer talento: hackathones, retos en línea, revisión de github o portafolio, acertijos o casos de negocio que puedan poner a prueba a los postulantes

4) Considerar entrevistas de “match cultural” así como habilidades de comunicación y liderazgo

5) Período de entrada y “química” con el equipo existente. Retroalimentar y readaptar el proceso a la experiencia de la empresa en particular.

Datlas_barra_suscribir

LA ENTREVISTA

El pase de diapositivas requiere JavaScript.

Aquí es donde en realidad sucede la magia y se filtra a la mayor calidad de los candidatos. Es muy importante que alguien con conocimiento de industria y que entienda las necesidades de la empresa sea quién realice las entrevistas para obtener el puesto.

Primeramente una recomendación importante es enviar una prueba o reto de la que pueda enviar resultados preliminares por correo y explicar a fondo en la entrevista. En una ocasión, a manera personal, me tocó en NYC recibir desde el app de UBER algunas preguntas de código mientras hacía un viaje. Las contesté correctamente y me invitaban a enviar mi CV para su empresa. Ese tipo de dinámicas se ven “cool” , son modernas y además.

Durante la entrevista es relevante validar con casos o situaciones que se le pueden presentar en el trabajo y conocer muy bien cómo pudiera reaccionar esa persona a las situaciones. Estas simulaciones, sobre todo en problemas que involucran estadística, ayudarán a validar su nivel de conocimiento teórico. Finalmente el práctico es mayormente dominado durante el desempeño del rol

Finalmente asegurarse, como en cualquier puesto, que la persona cumpla con el perfil y que pueda generar proyectos internos para motivar a otras personas a usar las herramientas que sean desarrolladas por el área de analítica es muy importante.

CIERRE

Hasta aquí la columna de hoy. Pensamos que esta y otras guías podrán ser de utilidad a los reclutamientos de uno de los roles con más atención de los últimos 5 años. Probablemente los siguientes 5 años se especialicen aún  más. Esperamos que le sirva de orientación y que puedas compartir con más personas para que haya una mejor guía de qué observar para incrementar la calidad del área de analítica de datos.

Saludos

Equipo Datlas

– Keep it weird –

 

¿Cómo analizar a la competencia usando mapas? – Datlas Casos de Uso

Una de las claves del éxito de los negocios es la ubicación, como ya hemos hablado, pero para ubicar un negocio hay ciertos aspectos que la mayoría de las empresas, sin importar su giro o sector, toman en cuenta para realizar un análisis y seleccionar el mejor punto. Algunas de estas variables son:

  1. El producto/servicio que a vender (giro/sector)
  2. Competencia (directa, indirecta, sustitutos etc.)
  3. Mercado meta ideal (perfil del consumidor)
  4. Características de la ubicación y el entorno (historia, estructura, demografía, tráfico, accesibilidad, estacionamiento, etc.)
  5. Negocios en la zona (complementadores, etc.)
  6. Aspectos legales (uso de suelo, reglamentación, lineamientos, etc.)
  7. Aspectos financieros (costos, gastos, mantenimientos, etc.)

free_Suscriber

Sin duda algunos de estos puntos, en un inicio, los define el emprendedor/empresario como, por ejemplo: el mercado meta ideal o perfil del consumidor. Mientras que otros provienen de un análisis de mercado y entorno respecto a la ubicación analizada. En esta entrada nos vamos a enfocar en el análisis de competencia a través de nuestras plataformas de Mapas.

Para ello vamos a utilizar el caso de Andrea, una joven emprendedora con un concepto de gimnasio que mezclaba la parte tradicional de las maquinas y las pesas con toda esta tendencia del baile y las nuevas metodologías fitness. Andrea estaba por abrir su segunda sucursal en Nuevo León. Reconociendo que este mercado estaba teniendo un auge y que los competidores nacían de forma rápida y con facilidad, decidió enfocarse en analizar a la competencia alrededor de esta nueva oportunidad de ubicación. Así que ¿Cómo lo hizo?

En primer lugar Andrea entró al Marketplace de Datlas y adquirió su Mapa Premium para Nuevo León.

Quédate hasta el final y descubre el código de descuento para adquirir hoy mismo tu Mapa Premium para cualquiera de las geografías disponibles

datlas_mx_marketplace_mapa_premium

Una vez adquirido su mapa, entró directamente en la página web de Datlas (www.datlas.mx) y se autentificó como usuaria.

El pase de diapositivas requiere JavaScript.

Una vez dentro de su panel personalizado, se fue a la sección de Mapas y selecciono su Mapa Premium para Nuevo León.

datlas_mx_panel_personalizado

Una vez dentro del mapa, utilizo la barra de búsqueda por dirección para localizar la ubicación que estaba evaluando.

El pase de diapositivas requiere JavaScript.

En cuanto localizó la ubicación, Andrea hizo uso de una herramienta llamada “Consulta Establecimiento” que se encuentra justo en la cuarta posición de la barra lateral derecha, debajo de la herramienta de búsqueda específica y justo arriba de la herramienta de medición de distancia.

free_Suscriber

Haciendo uso de esta herramienta Andrea, y todos nuestros usuarios, pueden escribir una palabra clave, en este caso, por ejemplo: gimnasio y el sistema realiza una búsqueda de esa palabra clave en las bases de datos de negocios para obtener como resultado todos aquellos establecimientos que tengan esta palabra dentro de su nombre comercial y/o de su razón social.

En este caso, Andrea al poner gimnasio, obtuvo estos resultados:

El pase de diapositivas requiere JavaScript.

De igual forma, se pueden hacer consultas con palabras claves parecidas como, en este caso, “gym” y obtener también resultados:

datlas_mx_mapa_premium_nl_consulta_gym

De esta forma, Andrea pudo observar rápidamente el nivel de competencia que existía en el entorno y combinar las distintas herramientas de las que hemos estado hablando en entradas anteriores para complementar su análisis con una segmentación y prospección de cliente.

Finalmente, no olvides que tu también puedes empezar a analizar a tu competencia hoy mismo adquiriendo tu Mapa Premium para cualquiera de nuestras geografías disponibles, aprovecha el cupón BLOG50 para obtener un 50% de descuento (válido por tiempo limitado).

¡Visita nuestro Martketplace y aprovecha esta gran promoción!

 

También te invitamos a contarnos ¿qué reto enfrenta tu negocio actualmente? para poder sugerirte y escribir algunas formas de solución con nuestras plataformas. Escríbenos a ventas@datlas.mx o en nuestras redes sociales.

@DatlasMX

 

 

¿Cómo convertirte en analista estrella? Usando mapas – Datlas Casos de Uso

Hemos estado relatando los distintos casos de uso de nuestros clientes emprendedores y empresarios, pero hay una clase de clientes de los que no hemos platicado aún y es momento de hacerlo ya que ellos son la razón principal de que Datlas haya podido llegar a los grandes corporativos. En esta ocasión les contaremos la historia de Paulina, una analista junior dentro de un gran corporativo de bienes raíces con presencia nacional y oficinas centrales en Ciudad de México. Pau se dedica a realizar análisis y presentar reportes al equipo de desarrollo, con información relevante para evaluar la posibilidad de construir sobre un terreno u otro, comparando entre varias opciones. Antes de que Pau conociera Datlas su dinámica de trabajo consistía en consultar información de alrededor de 5 fuentes distintas, extraer dichos datos, sacar pantallazos de distintos sitios web, concentrar todo en una presentación y enviarla al equipo. Este proceso le tomaba alrededor de 4 horas para poder completar un solo análisis. Su entregable consistía en una sola lamina de presentación, con una imagen de la ubicación y una tabla resumen con datos como: población total, cantidad de hogares e ingreso promedio de la zona. Un buen día Paulina conoció a Datlas en una conferencia, entró a la página, probó el DEMO GRATIS de la plataforma de mapas y, a partir de ahí, todo cambio.

free_Suscriber

Su experiencia con el DEMO GRATIS le ayudó a darse cuenta de que el mapa Premium de Datlas integraba ya en una sola plataforma la información que ella capturaba de las 5 distintas fuentes. Asimismo, el hecho de partir desde una visualización de mapa le permitía a Pau mostrar una narrativa más homologada desde la imagen hasta el resumen de datos. Para una mejor explicación hagamos el caso rápidamente.

El paso #1 es entrar a tu panel personalizado y acceder al mapa Premium de CDMX. Para esto debiste haber adquirido tu licencia directamente en nuestro Marketplace. Quédate hasta el final y aprovecha el cupón de descuento que tenemos para ti.

datlas_panel_mapa_premium_cdmx

El paso #2 es localizar la ubicación que quieres analizar. En esta ocasión Paulina estaba analizando una zona a las afueras de la ciudad por lo que tuvo que hacer un ajuste antes de realizar su análisis. Entendiendo que su ubicación estaba del lado izquierdo a la carretera y que la carretera es una restricción u obstáculo de acceso, decidió medir la distancia paralela a la carretera para establecer un área rectangular para realizar su análisis.

El pase de diapositivas requiere JavaScript.

Una vez establecido el límite, procedemos al paso #3 que es realizar un análisis de la zona, en este caso mediante un área rectangular.

El pase de diapositivas requiere JavaScript.

Para este punto, Paulina ya tiene mucha más información que tan solo su par de variables iniciales. Es por ello que el paso #4 ella lo bautizó como: extraer hallazgos. De manera ilustrativa esta etapa se pudiera resumir de la siguiente manera:

datlas_mapa_premium_cdmx_hallazgos

Ahora bien, es importante denotar aquí que Paulina comenzó utilizando el mapa Premium dado que ella fue quien invirtió ($$$) de forma personal en la plataforma para poder probarla en su trabajo. Tras los primeros meses de uso Pau les mostró la plataforma a sus superiores y logró que el corporativo le aprobara contratar nuestra modalidad Socios, de la cual les hablamos en este blog anterior. Llegado este punto Pau fue capaz no solo de obtener los datos mostrados anteriormente sino nutrirlo con una capa de información especializada que, para su caso, fue la de nivel socioeconómico.

datlas_mapa_premium_cdmx_hallazgos_nse

Finalmente, el paso #5 para Pau es integrar estos hallazgos en una presentación ejecutiva para su equipo de desarrollo. De esta forma Paulina logró realizar durante las mismas 4 horas de trabajo, hasta 8 presentaciones completas que incluían más de 6 láminas cada una.

datlas_mapa_premium_cdmx_presentacion

De esta forma Pau logró convertirse no solo en la analista estrella dentro de su equipo y su compañía, sino que actualmente ha logrado obtener el cargo de gerencia de inteligencia de mercados capitalizando aún más los mapas, el sistema de reportes y hasta la consultoría en análisis de datos para seguir generando valor a su negocio, desde ahorro en tiempos, eficiencia en proceso, mejores tomas de decisiones, identificación de oportunidades y mucho más.

free_Suscriber

Tú también puedes convertirte en el analista estrella de tu organización. Entra ahora mismo a nuestro Marketplace y aprovecha el cupón BLOG20 para obtener un 20% de descuento en nuestros mapas Premium y Socios de CDMX o de cualquiera de nuestras geografías activas.

Mantente atento a nuestras redes porque pronto anunciaremos sorpresas alrededor de nuestros mapas.

@DatlasMX

4 Metodologías para proyectos de Data Science – INVESTIGACIÓN DATLAS

Datlas_quote1_Method

Métodos, métodos y  más métodos. Aunque parecer que en el largo plazo limitan nuestra imaginación son herramientas que facilitan la entrada, práctica y control en un campo de dominio que queremos alcanzar. Desde Datlas, nuestra startup de analytics, hemos trabajado con “métodos de data science” en nuestros proyectos internos, aún sin tener usuarios. Ahora que los tenemos les puedo confirmar que el método es uno de los recursos más importante para establecer claridad en la comunicación y avances de los proyectos. En esta columna expondremos 3 de los métodos más usados en proyectos de ciencia de datos. Al final también integraremos nuestra propia versión de método de trabajo.

Datlas_Blog_Promo_SuscriberFree

1) KDD (Knowledge Discovery in Databases)

Datlas_KDD

Metodología de 5 pasos. Inicia con la selección donde de un data set principal hay que selecciónar un subconjunto de variables que nos pueden apoyar en la exploración del fenómeno que estamos estudianto. En el pre-procesamiento realizamos la limpieza y balanceo de datos. En la transformación, el método sugiere que reduzcamos dimensiones con técnicas estadísticas para manejar la menor cantidad de variables necesarias. En minería de datos buscamos patrones de interés o representativos en relación al objetivo de la minería de datos. Finalmente para colarnos al conocimiento pasamos por el proceso de intepretación y evaluación de modelo.  Al final de la iteración se le otorga una calificación al modelo y si no se cumplieron satisfactoriamente los objetivos se repite hasta que sean logrados.

Datlas_Promo_Facebook_Suscribe

2) SEMMA (Sample, Explore, Modify, Model and Access)

Datlas_SEMMA

En esta metodología iniciamos con “sample” o un muestro de la base de datos principal (que asumimos que es muy pesada y lenta de procesar) para poder hacer manipulaciones sobre este pequeño set de una manera ágil. Después exploramos los datos para ganar entendimiento e ideas, así como refinir nuestro proceso de búsqueda de anomalías, patrones y tendencias. Llegamos entonces al paso de modificar donde nos enfocamos en crear, seleccionar y transformar variables para enfocarnos en un proceso de selección. En esta etapa también se buscan anomalías y reducir el número de variables. Luego sigue la etapa de modelaje en donde debemos aplicar distintos métodos estadísticos evaluando sus fortalezas y cumplimiento de objetivos. Finalmente la etapa de “access” que significa evaluar la confiabilidad y utilidad de los hallazgos. Se evalúa particularmente el “performance”.

De la misma manera del modelo anterior, si no se logran los objetivos en una primera iteración tendremos que repetir el proceso.

3) CRIPS-DM (Cross-Industry Standard Process for Data Mining)

Datlas_CRISPDM

Seguimos con el “famosisimo” CRIPS-DM, el método más usado en la industria y es que IBM, la compañía dueña de Watson que antes desarrollaba poderosas computadoras, es quien desarrolló este modelo. La diferencia clave es que cualquier etapa del modele puede tener retorno o iniciar una reversa al método. Si durante la etapa en particular el especialista encontró que los datos no son suficientes para resolver su objetivo, puede regresar a cualquiera de la otras etapas.

En la etapa de “Entendimiento de negocio” primero se determinan los objetivos de negocio: Antecedentes, objetivos estratégicos de impacto y criterios de éxito. Después revisamos la situación, inventariamos recursos, realizamos un análisis de costo-beneficio, determinamos objetivos y producimos un plan de proyecto.

En “Data Understanding” es donde recolectamos los datos iniciales, describimos cada uno de estos datos, exploramos y verificamos la calidad de la información.

En “Data preparation” seleccionamos la información más razonable, la limpiamos, construimos variables de ser necesario, integramos datos y finalmente formateamos. El entregable de esta etapa sería un dataset listo para trabajar.

Para la etapa de “Modeling”, similar a los otros modelos, experimentamos con distintas técnicas, consideramos supuestos, hacemos pruebas, definimos parámetros y revisamos funcionalidad general de los modelos.

En “Evaluación” es donde considerando los criterios de éxito definidos consideramos como positiva y/o negativa la evaluación. Aqui mismo definimos los siguientes pasos y tomamos las decisiones necesarias.

Finalmente en “Deployment”, esta etapa sólo se activa si el proyecto tuvo evaluación positiva. Se genera entonces un plan de desarrollo, un plan de mantenimiento, se genera un reporte final y presentación para socializar el caso de estudio.

Comparando métodos

Datlas_comparando_metodos_DS_

A manera personal pienso que el CRIPS-DM se lleva de calle los métodos de antes. Por algo es más usado el CRIPS-DM y principalmente porque mezcló la necesidad de entendimiento del negocio con la parte científica del desarrollo de análisis de datos.

*Si quieres aprender más de arquitectura y proyectos de datos revisa este blog (Data Lake Vs. Data Warehouse Vs. Data Mart) 

4 ¿Cómo lo trabajamos en Datlas?

Datlas_metodo_laboratoriodedatos

Nuestro método, titulado “Laboratorio de Datos”, es similar a los modelos revisados con anterioridad. Tras un entendimiento central de negocio (En donde se ubica la imagen de nuestro mapa en el diagrama superior) entendemos las necesidades del negocio, dimensionamos el proyecto y seleccionamos los métodos experimentales. Ese entendimiento no necesariamente te tiene que llevar a la extracción de datos, ya que puede haber un avance previo. Sobre todo nosotros que trabajamos con datos de clientes, en muchas de las ocasiones llegamos a integrar o clasificar.

Datlas_Promo_Youtube_Suscribe

Asumiendo que sea un proyecto tradicional, iniciamos en la etapa de extracción donde dimensionamos y entendemos el tipo de variables con las que vamos a trabajar. En nuestro caso generamos un glosario de variables- Para la integración y clasificación buscamos ir preparando un ambiente de trabajo que nos permita geo-referenciar y mapear variables. Si estos 3 pasos iniciales cuentan con una evaluación positiva podemos pasar a la etapa de visualizar o reportar.  Cuyo objetivo principal es generar los principales recursos para socializar y pedir retroalimentación a los usuarios potenciales. Tras realizar los ajustes necesarios podremos llegar a entrenar un modelo con técnicas de inteligencia artificial.  Los pasos en el método son iterativos y se puede regresar a cualquier paso una vez que el entendimiento central del negocio se va enriqueciendo con cada etapa del proceso.

Para más detalle de este método puedes solicitar una conferencia o sesión de capacitación en direccion@datlas.mx

**También te puede interesar: ¿Cómo aprender ciencia de datos? 6 pasos

Datlas_quote2_Method

Hasta aqui la columna de hoy.  ¿Cuál es tu método y como darle libertad a la creatividad en el proceso? ¿Cuál seleccionarás para tu siguiente proyecto?  Comparte con tus colegas y comenta qué crees que podría mejorar los métodos de ciencia de datos.

Datlas_Promo_Podcast_Suscribe

Equipo Datlas MX

-Keep it weird-