Archivo de la etiqueta: analitica

4 Metodologías para proyectos de Data Science – Datlas Research

Datlas_quote1_Method

Métodos, métodos y  más métodos. Aunque parecer que en el largo plazo limitan nuestra imaginación son herramientas que facilitan la entrada, práctica y control en un campo de dominio que queremos alcanzar. Desde Datlas, nuestra startup de analytics, hemos trabajado con “métodos de data science” en nuestros proyectos internos, aún sin tener usuarios. Ahora que los tenemos les puedo confirmar que el método es uno de los recursos más importante para establecer claridad en la comunicación y avances de los proyectos. En esta columna expondremos 3 de los métodos más usados en proyectos de ciencia de datos. Al final también integraremos nuestra propia versión de método de trabajo.

Datlas_barra_suscribir

1) KDD (Knowledge Discovery in Databases)

Datlas_KDD

Metodología de 5 pasos. Inicia con la selección donde de un data set principal hay que selecciónar un subconjunto de variables que nos pueden apoyar en la exploración del fenómeno que estamos estudianto. En el pre-procesamiento realizamos la limpieza y balanceo de datos. En la transformación, el método sugiere que reduzcamos dimensiones con técnicas estadísticas para manejar la menor cantidad de variables necesarias. En minería de datos buscamos patrones de interés o representativos en relación al objetivo de la minería de datos. Finalmente para colarnos al conocimiento pasamos por el proceso de intepretación y evaluación de modelo.  Al final de la iteración se le otorga una calificación al modelo y si no se cumplieron satisfactoriamente los objetivos se repite hasta que sean logrados.

2) SEMMA (Sample, Explore, Modify, Model and Access)

Datlas_SEMMA

En esta metodología iniciamos con “sample” o un muestro de la base de datos principal (que asumimos que es muy pesada y lenta de procesar) para poder hacer manipulaciones sobre este pequeño set de una manera ágil. Después exploramos los datos para ganar entendimiento e ideas, así como refinir nuestro proceso de búsqueda de anomalías, patrones y tendencias. Llegamos entonces al paso de modificar donde nos enfocamos en crear, seleccionar y transformar variables para enfocarnos en un proceso de selección. En esta etapa también se buscan anomalías y reducir el número de variables. Luego sigue la etapa de modelaje en donde debemos aplicar distintos métodos estadísticos evaluando sus fortalezas y cumplimiento de objetivos. Finalmente la etapa de “access” que significa evaluar la confiabilidad y utilidad de los hallazgos. Se evalúa particularmente el “performance”.

De la misma manera del modelo anterior, si no se logran los objetivos en una primera iteración tendremos que repetir el proceso.

 

3) CRIPS-DM (Cross-Industry Standard Process for Data Mining)

Datlas_CRISPDM

Seguimos con el “famosisimo” CRIPS-DM, el método más usado en la industria y es que IBM, la compañía dueña de Watson que antes desarrollaba poderosas computadoras, es quien desarrolló este modelo. La diferencia clave es que cualquier etapa del modele puede tener retorno o iniciar una reversa al método. Si durante la etapa en particular el especialista encontró que los datos no son suficientes para resolver su objetivo, puede regresar a cualquiera de la otras etapas.

En la etapa de “Entendimiento de negocio” primero se determinan los objetivos de negocio: Antecedentes, objetivos estratégicos de impacto y criterios de éxito. Después revisamos la situación, inventariamos recursos, realizamos un análisis de costo-beneficio, determinamos objetivos y producimos un plan de proyecto.

En “Data Understanding” es donde recolectamos los datos iniciales, describimos cada uno de estos datos, exploramos y verificamos la calidad de la información.

En “Data preparation” seleccionamos la información más razonable, la limpiamos, construimos variables de ser necesario, integramos datos y finalmente formateamos. El entregable de esta etapa sería un dataset listo para trabajar.

Para la etapa de “Modeling”, similar a los otros modelos, experimentamos con distintas técnicas, consideramos supuestos, hacemos pruebas, definimos parámetros y revisamos funcionalidad general de los modelos.

En “Evaluación” es donde considerando los criterios de éxito definidos consideramos como positiva y/o negativa la evaluación. Aqui mismo definimos los siguientes pasos y tomamos las decisiones necesarias.

Finalmente en “Deployment”, esta etapa sólo se activa si el proyecto tuvo evaluación positiva. Se genera entonces un plan de desarrollo, un plan de mantenimiento, se genera un reporte final y presentación para socializar el caso de estudio.

Comparando métodos

Datlas_comparando_metodos_DS_

A manera personal pienso que el CRIPS-DM se lleva de calle los métodos de antes. Por algo es más usado el CRIPS-DM y principalmente porque mezcló la necesidad de entendimiento del negocio con la parte científica del desarrollo de análisis de datos.

Datlas_barra_suscribir

4 ¿Cómo lo trabajamos en Datlas?

Datlas_metodo_laboratoriodedatos

Nuestro método, titulado “Laboratorio de Datos”, es similar a los modelos revisados con anterioridad. Tras un entendimiento central de negocio (En donde se ubica la imagen de nuestro mapa en el diagrama superior) entendemos las necesidades del negocio, dimensionamos el proyecto y seleccionamos los métodos experimentales. Ese entendimiento no necesariamente te tiene que llevar a la extracción de datos, ya que puede haber un avance previo. Sobre todo nosotros que trabajamos con datos de clientes, en muchas de las ocasiones llegamos a integrar o clasificar.

Asumiendo que sea un proyecto tradicional, iniciamos en la etapa de extracción donde dimensionamos y entendemos el tipo de variables con las que vamos a trabajar. En nuestro caso generamos un glosario de variables- Para la integración y clasificación buscamos ir preparando un ambiente de trabajo que nos permita geo-referenciar y mapear variables. Si estos 3 pasos iniciales cuentan con una evaluación positiva podemos pasar a la etapa de visualizar o reportar.  Cuyo objetivo principal es generar los principales recursos para socializar y pedir retroalimentación a los usuarios potenciales. Tras realizar los ajustes necesarios podremos llegar a entrenar un modelo con técnicas de inteligencia artificial.  Los pasos en el método son iterativos y se puede regresar a cualquier paso una vez que el entendimiento central del negocio se va enriqueciendo con cada etapa del proceso.

Para más detalle de este método puedes solicitar una conferencia o sesión de capacitación en direccion@datlas.mx

**También te puede interesar: ¿Cómo aprender ciencia de datos? 6 pasos

Datlas_quote2_Method

Hasta aqui la columna de hoy.  ¿Cuál es tu método y como darle libertad a la creatividad en el proceso? ¿Cuál seleccionarás para tu siguiente proyecto?  Comparte con tus colegas y comenta qué crees que podría mejorar los métodos de ciencia de datos.

Equipo Datlas MX

-Keep it weird-

 

 

 

¿Cómo encontrar clientes potenciales usando mapas? – Datlas Caso de Uso

Hace un par de años cuando le contábamos a la gente que hacíamos análisis de datos con mapas se nos quedaban viendo extrañados. Y es que la historia nos enseñó que el uso común de los mapas era para navegación, establecer rutas, indicar direcciones. Pero hoy en día la disponibilidad de datos geo referenciados (asociados a un punto geográfico, un punto en el mapa) nos ha permitido utilizar los mapas para realizar análisis más complejos, incluso de variables ajenas a temas de tráfico y navegación. En esta columna te vamos a explicar cómo puedes utilizar el mapa Premium de Datlas para encontrar nuevos prospectos, justo como lo han hecho nuestros clientes. Quédate hasta el final y obtén una sorpresa que te ayudará a adquirir tu licencia premium de inmediato e iniciar hoy mismo a prospectar nuevos clientes potenciales.

free_Suscriber

El proceso es muy sencillo, no importa si vendes productos o prestas servicios, el paso #1 es: la delimitación geográfica. Estamos seguros de que tu producto es único y tu servicio es inigualable, que pronto todo el mundo se va a pelear por adquirirlo, pero analizar todo un continente o un país te puede provocar dolores de cabeza. Es por ello que en DATLAS hemos dividido nuestros mapas por estados. Por lo tanto, debes elegir el estado en el que se encuentra la zona donde te quieres enfocar para encontrar a tus prospectos. Para ejemplificarlo de forma sencilla usaremos el caso de Carolina, una joven que vende repostería a través de redes sociales, principalmente en Monterrey. Ella estaba buscando expandir su mercado y comenzar a vender en San Pedro Garza García. Por lo tanto, la plataforma que vamos a utilizar para este ejercicio será el Mapa Premium del estado de Nuevo León, disponible en nuestro Marketplace.

datlas_marketplace_mapa_premium_NL

Una vez definida la geografía que vas a analizar, el paso #2 es: definir el perfil de tu cliente objetivo (o mercado meta). Si eres dueño o parte de una organización que tiene años operando, será mucho más sencillo ya que conoces las características generales de tus clientes actuales y con ello puedes establecer un perfil con ciertos atributos a buscar. Por otro lado, si eres un emprendedor que está iniciando su negocio definir el perfil del cliente objetivo será un ejercicio distinto, basado en el problema que resuelves y el tipo de solución que has diseñado. Para el caso de Carolina ella definió a su cliente objetivo como: mujeres entre los 24 y 31 años de edad, con estudios universitarios o superiores, que tuvieran una capacidad de pago de $1,000 MXN o más.

datlas_mkdo_meta_perfil

Una vez definida la geografía de enfoque y el perfil de cliente que buscas es momento de entrar en la plataforma. Si has tenido la oportunidad de probar nuestro DEMO seguro sabrás como navegar y que atributos están disponibles, si no es así te invitamos a suscribirte para tener conocimiento de algunas de las variables y herramientas que estaremos comentando.

Una vez dentro de la plataforma fácilmente podrás reconocer que los polígonos que aparecen al inicio son interactivos y que al dar click en ellos se revela un pop-up del lado izquierdo con alguna información relevante. Y es justo ahí en donde podrás encontrar la información demográfica y socioeconómica que en este caso Carolina estaba buscando.

datlas_mapa_premium_nl_popup_poligono

Ahora bien, ya identificaste donde está la información ¿qué sigue? ¿checar uno por uno todos los polígonos? ¡Por supuesto que no! para eso hemos habilitado la herramienta llamada búsqueda específica que se encuentra justo en la barra lateral derecha. Esta herramienta te permite establecer un área dentro del mapa y buscar aquellos polígonos que cuenten con características específicas, como por ejemplo mujeres de 24 a 31 años.

datlas_mapa_premium_nl_busqueda_especifica

Una vez identificada la herramienta el siguiente paso es establecer los criterios de búsqueda. En este caso podrás observar que los rangos de búsqueda para variables como “Mujeres” (cantidad de mujeres) desde 0 hasta un máximo (ej: 1547). En el caso de Carolina, podemos hacer un cálculo simple para establecer la cantidad de mujeres que necesitaría encontrar: si Caro quisiera atender 3 bodas cada fin de semana del mes estaría buscando generar 12 clientas. Si su porcentaje de conversión es del 10% eso quiere decir que debe estar buscando una zona con 120 clientas potenciales (prospectos). Siendo así el criterio de búsqueda para el tema de mujeres debería tener como mínimo 120.

Ahora bien, Caro no solo busca mujeres, sino mujeres de cierta edad, así que el segundo paso sería establecer un rango para las edades de 25 a 31. Es importante notar que los datos de edades son agregados, es decir, contemplan tanto a hombres como mujeres por lo que un cálculo simple pudiera ser el siguiente: navegando en la plataforma notamos que la mayoría de las veces la proporcionalidad de hombres y mujeres es de alrededor de 50-50% por lo tanto, usando esta simple regla de dedo, si queremos encontrar 120 mujeres y el rango de edades contempla hombres y mujeres, pudiéramos establecer un mínimo de 240 para la variable de edad de 25 a 31.

Finalmente, Caro buscaba que tuvieran una capacidad de pago de $5,000 MXN o más. Aquí es importante contextualizar. El dato socioeconómico que manejamos es el de ingreso promedio, por lo tanto, si buscamos que sean personas dispuestas a gastar $5,000 MXN en su organización de bodas habría que buscar que su ingreso promedio sea superior a esta cantidad. Para simplificar el ejercicio, en este caso, lo haremos buscando ingresos de $10,000 MXN o más.

El pase de diapositivas requiere JavaScript.

Finalmente, el resultado es muy simple: en color rojo verás todos aquellos polígonos dentro del área que has establecido, pero que no cumplen con los criterios de búsqueda. Por otro lado, los polígonos en color amarillo serán aquellos que cumplen con las características establecidas. De esta forma puedes identificar rápidamente las zonas en donde se encuentran tus prospectos. Con esto, Caro, tú y todos nuestros clientes pueden accionar campañas enfocadas, realizar trabajo en campo de una manera focalizada o muchas otras estrategias para capitalizar a ese mercado meta que ya has podido encontrar.

datlas_mapa_premium_nl_busqueda_especifica_resultado

Recuerda que esta es solo una de las multiples herramientas de análisis que integran nuestros mapas. Puedes combinar el uso de distintas herramientas para realizar análisis más complejos, comparar los resultados en distintas zonas y mucho más.

Puedes probar este ejercicio y todos los demás detalles suscribiéndote en nuestra pagina y probando la versión DEMO.

Si crees que ya estas listo para ponerte manos a la obra y captar más prospectos puedes ir directamente a nuestro Marketplace y aprovechar el código de descuento BLOG100 para obtener $100 MXN de regalo en tu primera compra de cualquiera de nuestros mapas Premium.

De esta manera concluimos el blog de hoy, mantente atento a todos los nuevos casos de uso, videos y nuevos lanzamientos que tendremos para ti.

Siguenos @DatlasMX

Los 5 perfiles para una estrategia de Datos en la EMPRESA – Datlas research

En los últimos años fuera del ambiente corporativo se ha hablado de innovar de manera ágil y de cómo hay que adaptarse a las modernidades tecnológicas por miedo a no quedarse atrás. Dentro de estas tendencias, entre las más asociadas a una buena toma de decisiones, se  ha hablado de Analytics, Big Data e Inteligencia Artificial.

Y no es que las empresas nunca hayan visto con utilidad un buen análisis de sus negocios o una investigación de mercados. Antiguamente, hace 30 o 50 años, los numéricos se concentraban en los equipos de finanzas y contabilidad. Y con la información a su alcance, recordemos que no había Google ni internet, calculaban oportunidades de mercado y tomaban decisiones de negocio.

OrganigramID 32377103 © Shawn Hempel | Dreamstime.com Business
Organigram ID 32377103 © Shawn Hempel |

Ahora con el internet y la información al alcance de cualquier corporativo este ejercicio se ha hecho mucho más fácil y replicable. Lo que demanda un nuevo tipo de organización para responder a las necesidades de información de una empresa. No podemos manejar la misma estructura de hace 40 años. En un entorno tan cambiante hay que adaptarse lo más rápido posible ¿Cómo lograrlo? La respuesta es reinventando parte de la organización, con nuevos perfiles y equipos.

Datlas_barra_suscribir

 

Estos son los 5 perfiles para echar a andar una estrategia de datos en tu compañía:

1) Jefe Analista de negocio: Es responsable de atender a las áreas de negocio en sus necesidades de información y de la creación de nuevos proyectos de aprovechamiento de datos en la compañía. Es versátil en sus capacidades de análisis y comunicación hacia la empresa. También tiene una parte didáctica para entrenar y capacitar equipos sobre cómo aprovechar de mejor manera las bases de datos del negocio.

Datlas_analistadedatos

2) Arquitecto de datos: Es un experto conocedor de las estructuras de bases de datos del negocio y de cómo es la mejor manera de que se relacionen y se consulten. Es el principal contacto cuando de contratar capacidades externas se trata.

Datlas_Arquitectodedatos

3) Ingeniero de datos: Encargado de dimensionar y anticiparse a las necesidades de almacenamiento y seguridad para los datos de la compañía. Prepara e integra los datos relevantes para que estén listos para ser consultados. Está en contacto constante con ciberseguridad de la compañía y con los equipos financieros encargados de presupuestar la capacidad a futuro de almacenamiento para las iniciativas de información de los siguientes años.

Datlas_IngenierodeDatos

 

4) Director / Gerente de analítica: Es un conocedor de las necesidades del negocio, tiene exhibición a foros especializados donde se hablan de problemas y oportunidades del modelo de negocio actual y es el principal punto de contacto con otras gerencias y áreas para proponer mejoras. Gestiona a su vez con áreas de legal y monitorea los procesos ágiles de desarrollo en sus equipos. Finalmente cesiona la gobernanza y acceso a la información.

Datlas_ChiefDataofficer

5) Chief Data Officer: justo debajo del CEO y al nivel de las otras direcciones. Un error común es comenzar a verlo dentro de las estructuras de Marketing o de Tecnología. Lo que sesga su accionar y evita que esté en los foros de mayor relevancia para la empresa. Guía a nivel estratégico y mediático las intenciones futuras de aplicar inteligencia artificial y big data a los modelos actuales de la compañía.

Datlas_DJPATIL_maxresdefault.jpg

 

Datlas_barra_suscribir

Para una correcta ejecución de la estrategia de datos, además de contar con estos perfiles, hay que habilitar una estructura organizacional en donde convivan los procesos de innovación y transformación digital a nivel interno en la compañía. Un ejemplo que propone Harvard (HBR) es el siguiente:

Datlas_R1510G_PORTER_ANEWORGANIZATIONAL.png

Hasta aqui la columna de hoy ¿ Tu empresa ya está lista para una estrategia de datos? ¿Será tu proyecto de 2018?

Dejanos cualquier duda o comentario. ¿Cómo funciona actualmente en tu empresa?

 

Keep it weird

Equipo Datlas