¿cómo detectar fake news manualmente? – investigación datlas

Hemos hablado antes de “Fake News” en este blog y con motivo a una serie de noticias falsas que se dispersaron en “Whatsapp” este fin de semana que pretendían dar un mensaje del “Secretario de Economía de Nuevo León” quisimos compartir y reforzar este tema.

En este episodio haremos hincapie de algunas técnicas para detectar “fake news” y repasar los puntos más importantes en este ejercicio. (Usaremos como fuente esta columna: https://www.visualcapitalist.com/how-to-spot-fake-news/)

¿Qué tipo de contenido falso existe?

  • Parodia o engañosa
  • Conexión Falsa entre el encabezado y el contenido
  • Contenido confuso
  • Contexto falso en tiempo o lugar
  • Contenido con fuentes anónimas o no identificables
  • Contenido manipulado
  • Contenido 100% fabricado

***Te puede interesar “Radiografía de Fake News en México”. Liga: https://blogdatlas.wordpress.com/2021/06/20/fake-news-radiografia-en-mexico-columnas-de-opinion-datlas/

¿Cómo se puede detectar ?

  • La fuente – Cuál es la historia, quién la investiga y/o comparte
  • El URL (liga de website) – Es conocido el sitio web o tiene algún respaldo. Si, por ejemplo habla sobre una nota mexicana sería más confiable que termine en “.com.mx”
  • El texto – La ortografía y puntuación tendrá que ir de acuerdo a la seriedad de la nota
  • La información – Revisa las citas de otros autores y valida la información en otras fuentes
  • El autor – Si lo buscas encontrarías otra nota de la misma o el mismo autor
  • Fuentes de respaldo – Revisa la información vinculada en links que te lleven a otros sitios
  • La fecha – La publicación es oportuna, actual o es una re-publicación de otro momento en el tiempo
  • El sesgo – Considera si tus creencias afectan el proceso de validación de la nota
  • Experta – Tiene alguna referencia estilo académica y está hecha de manera correcta

*** Te puede interesar “Fake News en tiempos de COVID-19”. Liga: https://blogdatlas.wordpress.com/2020/04/20/fake-news-en-covid-19-la-2da-pandemia-conferencia-talend-land-tv-2020/

También te dejamos el video de la charla completa que se impartió en “LAB NL de CONARTE” en Nuevo León, México.

Hasta aqui la columna de hoy. Te invitamos a continuar aprendiendo con nuestro contenido y a no perder la oportunidad de suscribirte a Datlas Academy. Esta nueva iniciativa que lanzamos para incrementar el aprendizaje de analítica y transformación digital en la comunidad de LATAM.

Equipo Datlas

-Keep it weird-

DESARROLLO DE DASHBOARD DE INTELIGENCIA PARA EL MONITOREO TURÍSTICO – MANUALES DATLAS

Dentro de nuestro portafolio Datlas nos encontramos con una propuesta de valor en dónde desarrollamos tableros de inteligencia llamados dashboards en dónde reunimos información para monitorear cualquier tipo de sector, industria o negocios a partir de datos públicos o privados, datos que de cierta manera nos dan un potencial para la toma de decisiones o creación de iniciativas. (TURISMO)

En este te blog te mostraremos uno de los dashboard que estamos desarrollando para la industria Turística en el estado de Nuevo León en alianza con el Clúster de Turismo de Monterrey y Observatorio Turístico NL. Continua leyendo si quieres aprender sobre qué es un dashboard, cómo funciona esta alianza de industria y actualmente cómo se ve la navegación de nuestra plataforma.

Datlas_Blog_Promo_SuscriberFree

Estructura de un Dashboard

Un dashboard es un sistema de información con tableros, filtros y visualizaciones (gráficos o tablas) que permite monitorear datos, tendencias y predicciones de una manera ordenada. Es por ello que te enlistamos las características y conceptos preponderantes:

  • Tableros: Son elementos esenciales de un dashboard en donde concentramos información de un solo tipo o categoría.
  • Filtros: Son botones que permiten visualizar la información de manera segmentada. Ejemplo: años, meses, municipios y a nivel estado.
  • KPI´s: “Key Performance Indicators” o indicadores clave de desempeño, utilizados para medir el rendimiento de las actividades y aplicaciones de nuestro proyecto.

Antecedentes

¿Qué es el Clúster de Turismo de Monterrey?

Es la concentración de empresas interconectadas que cooperan para el desarrollo de la innovación, la competitividad y la inteligencia de mercado. Son fenómenos, no políticos, existentes por la naturaleza económica de un país, como resultado de un proceso de mercado.

Bajo el régimen de triple hélice: Gobierno, Academia e Industria convergen para realizar actividades de innovación que contribuyan al desarrollo económico y la competitividad global de las empresas de Nuevo León.

Image

Como objetivo estratégico y acuerdo de colaboración con el Clúster de Turismo de Monterrey se estableció un plan para generar un tablero de información (“Dashboard”) para monitorear la industria de Turismo en el Estado.

Datlas_Promo_Facebook_Suscribe

Introducción a “DASHA” MTY Travel Intelligence Dashboard

Te presentamos a DASHA (Así le nombramos a esta nueva plataforma en co-creación) …

El MTY Travel Intelligence Dashboard reúne datos públicos y privados de la industria Turística al momento de manera actualizable para monitorear cada una de las áreas que en su mayoría a base de investigación han sido fundamentales para este proyecto, consta de la siguientes secciones:

  • Economía
  • Ocupación Hotelera
  • Llegadas y Transportes
  • Negocios y Parajes Turísticos
  • Socioeconómicos
  • Eventos y Convenciones
  • Noticias y Reportes
  • Tecnología en Turismo
  • Otros
  • Resumen Nuevo León
  • Repositorio Clúster Turismo de Monterrey
Animated GIF

A continuación de mostraremos cada uno de los pasos para ingresar, navegar y consultar a “DASHA” MTY Travel Intelligence Dashboard:

Ingresando a “DASHA” MTY Travel Intelligence Dashboard

Por medio de este video te mostraremos los pasos a seguir para registrarte por medio de nuestra página web www.datlas.mx, iniciar sesión como usuario y tener acceso al MTY Travel Intelligence Dashboard.

Primera navegación en “DASHA” MTY Travel Intelligence Dashboard

Por medio de este video te mostraremos las 11 diferentes secciones que nos ofrece el MTY Travel Intelligence Dashboard, así como algunos botones de interés para desplazarte por el Dashboard o ponerte al contacto con nosotros.
Datlas_Promo_Podcast_Suscribe

Futuro del Proyecto

La escalabilidad de nuestro proyecto trasciende en la innovación de nuestro potencial en el análisis de datos de una manera ágil, esto para ser utilizado por una mayor cantidad de usuarios.

Las mejores implementaciones del business intelligence por medio de DASHA generan tableros que nos hagan más eficientes a la hora de tomar decisiones para las organizaciones que componen las industria del Turismo en la región.

Detectando cada uno de los perfiles e intereses de las personas, para monitorear comportamientos críticos o situaciones que necesiten inmediatez con datos duros, al momento y de manera automatizada.

Back To The Future Film GIF

Si te interesa generar un Dashboard para monitorear tu industria y/o organización revisa nuestra sección especial en la website de Datlas o bien contáctanos a ventas@datlas.mx

– Equipo Datlas –

Keep it weird

SISTEMA ILUO para matriz de habilidades de departamentos de datos en organizaciónes – investigación datlas

Generar proyectos y áreas de datos exitosos está directamente relacionado al capital humano. Es decir, para poder avanzar con proyectos de analítica que abonen a la transformación digital de nuestras organizaciones es necesario mapear y desarrollar talento. Pero ¿Cómo lograrlo de manera ágil y sencilla? En esta columna hablaremos del sistema ILUO que nos permitirá monitorear las habilidades dentro de nuestro equipo de datos.

** Te podrá interesar ¿Cómo detectar un impostor de datos?

Como ejemplo, estas habilidades para un departamento de datos en una organización de mediano tamaño

El objetivo del sistema ILUO es desarrollar y administrar habilidades dentro del equipo a nivel departamento (No a nivel individual).

Dentro de una matriz se coloca los miembros del equipo del lado izquierdo, las habilidades en la parte superior y dentro de la matriz se categoriza con respecto al dominio de cada habilidad por miembro del equipo.

Las siglas ILUO tienen un significado gráfico y representan el avance que se va teniendo en el desarrollo de los empleados de la organización. La cantidad de líneas que forman cada letra indica el nivel de madurez de cada empleado. Los cuatro niveles de habilidad ILUO indican:

Nivel I: Aquellas personas que se encuentran en capacitación para conocer y cumplir con su tarea, sin intervenir en los procesos.

Nivel L: Aquellas personas que ya intervienen en los procesos, pero no están calificadas para operar sin supervisión.

Nivel U: Aquellas personas que ya están acreditadas para cumplir con su tarea bajo los estándares y el tiempo requerido.

Nivel O: Aquellas personas que ya han acreditado todos los niveles de habilidad y recibieron una certificación para poder formar a otras personas.

**Te podrá interesar “Los 5 perfiles para un equipo de Datos”

¿Qué pasos hay que seguir para desarrollar una matriz de habilidades en un equipo de Datos?

  1. Identifica y enlista las habilidades de tu departamento de datos
  2. Enlista el “staff” en los renglones de la matriz
  3. Identifica del 1 al 5 el mayor nivel en que cada miembro del equipo se desarrolla en esa habilidad
  4. Una vez que tenemos calificadas estas habilidades, hay que presentárselo al líder de equipo y desarrollar un plan de acción (Capacitación, nivelación, apoyos, entre otros.)
  5. Finalmente comprometer fechas y dar monitoreo constante

** Te podrá interesar “¿Por qué pueden fracasar los proyectos de datos?”

¿Cuáles son las ventajas de implementar el sistema ILUO?

·Incrementar la calidad de sus productos y/o servicios

·Reducción de desperdicios

·Mejorar la satisfacción de sus clientes internos y externos

·Lograr la continuidad operativa

·Se elimina o reducen ausentismo y rotaciones

·Aumenta la motivación de los empleados

·Desarrolla el sentido de pertenencia hacia la organización

** Te puede interesar nuestra columna sobre “Diseño de perfiles para áreas de analítica”

Hasta aqui la columna de hoy, te invitamos a continuar aprendiendo en nuestro podcast y a suscribirte a nuestra nueva iniciativa en Datlas Academy donde obsequiaremos algunos cursos para mantenernos a la vanguardia en temas de transformación digital.

Fuentes

https://www.leanconstructionmexico.com.mx/post/sistema-iluo-qu%C3%A9-es-y-como-implementarlo-ejemplo-de-matriz-iluo

¿PODRÍAS SER más propenso a chocar que otra persona SÓLO POR TU MODELO DE AUTO? La respuesta puede ser “sí” – DATLAS INVESTIGACIONES

El análisis de datos ha ido adquiriendo mucha importancia últimamente, sabemos que es una ciencia que se encarga de analizar un respectivo conjunto o conjuntos de datos para obtener conclusiones de los mismos y así tomar decisiones o simplemente obtener nuevos conocimientos. En esta columna presentamos un ejercicio complementario de análisis de datos. Esto sobre una base de datos de choques y siniestros para Nuevo León. Te presentamos nuestros hallazgos.

** También te podría interesar nuestras otras columnas sobre choques y siniestros

Big Data y Data Science: los profesionales especializados en ciencias de  datos tienen el futuro asegurado

En esta ocasión se usará una base de datos que recopila los choques de la zona metropolitana de Monterrey, Nuevo León desde el año 2016 hasta la mitad del 2018. Gracias al análisis podremos observar los diferentes fenómenos que se presentan.

La base de datos contiene los registros ya mencionados, cada registro contiene diferentes columnas, podemos dividir estas columnas en tres secciones que definen cada aspecto del choque:

1) La primera sería el lugar del suceso,

2) La segunda sería la descripción del mismo y

3) La tercera es la fecha/hora cuando ocurrió.

Ahora bien, con estos datos vamos a contestar algunas preguntas.

¿En qué códigos postales de la ciudad de Monterrey, Nuevo León y Zona metropolitana (ZMM) se generan más choques?

Para fines prácticos, se tomaron de la tabla los diez códigos postales donde hubo más choques, esto considerando su respectiva frecuencia de ocurrencias con respecto al total. Los resultados se mostrarán a continuación.

Top 10 códigos postales con más choques:

  1. 64000
  2. 64620
  3. 64590
  4. 64330
  5. 64619
  6. 64200
  7. 64988
  8. 64460
  9. 64710
  10. 64700

Para un mejor entendimiento se relacionó cada código postal con el nombre de la colonia. Estas son las colonias donde hay más percances del área metropolitana.

Top 10 colonias con más choques:

  1. Col. Centro
  2. Col. Vista Hermosa
  3. Col. Agrícola
  4. Col. Gral. Naranjo
  5. Col. Residencial Cumbres
  6. Col. Croc
  7. Col. El Milagro
  8. Col. Mitras Centro
  9. Col. Nuevas Colonias
  10. Col. Nuevo Repueblo
Mapa Monterrey, N.L. Colonias con más choques.

Si andas por estas colonias te recomiendo que vayas con mucha precaución detrás del volante.

¿A qué hora ocurren más choques en Monterrey (ZMM) ?

Pienso que esta es una de las preguntas más importantes a considerar ya que si vives en Monterrey sabrás de la cantidad de tráfico que se genera a las horas pico, veremos si existe una relación entre los choques y las horas de más tráfico.

Formato 24hrs.

Las horas que destacan son: 14:00, 13:00, 16:00, 18:00, 15:00. Podemos notar que los choques están relacionados con el tráfico, y el tráfico a su vez se genera principalmente debido a las “horas de trabajo”, claramente podemos observar la “hora de entrada”, la de “hora de comida” y la “hora de salida” que son los tiempos en donde hay más personas manejando.

¿Qué días de la semana suceden más choques en Monterrey(ZMM) ?

Formato 24hrs. Empezando por día domingo y terminando el sábado.

Empezando por el domingo en este caso, se puede notar cómo es que los choques varían dependiendo del día, siendo el “viernes” cuando ocurren más siniestros y el “domingo” el día que menos. Otro fenómeno curioso que podemos observar es que durante los sábados en la noche la cifra de choques aumenta considerablemente en comparación a los demás días, es entendible, la gente se va de fiesta, toma alcohol u otras sustancias, acto siguiente escoge manejar y lamentablemente choca. 

¿Algún color de auto es más propenso a chocar?

La respuesta corta es “sí”, existen autos que son más propensos a chocar que otros por su color, esto quizá se deba a que durante el día o la noche son más difíciles de observar para los conductores, otro factor puede ser que la mayoría de los autos que circulan son de ciertos colores “populares” y por ende tienen esas estadísticas.

Puede parecer broma, pero tomando en cuenta todo esto, en dado caso de que te encuentres manejando un carro gris o blanco un viernes por la tarde en el centro de Monterrey, estadísticamente tienes una gran probabilidad de chocar.

– Equipo Datlas –

¿Qué se puede decir de todo esto?

“Nuevo León, la entidad con mayor registro de choques en el país” – El financiero

“Falta cultura vial…y abundan choques” –El Norte

Estos solo son dos ejemplos de los miles que se pueden encontrar en cuanto a notas periodísticas donde mencionan nada más que la verdad. Nuevo León es en efecto la entidad del país con el mayor número de choques, esto se puede comprobar observando las bases de datos del INEGI o simplemente visualizando las gráficas que ya tienen disponibles en su página. No hace falta ser muy meticuloso con los datos para darnos cuenta de esto, solo basta con salir a manejar en horas pico para que uno se dé cuenta de lo pésima que es esta situación, no es de sorprenderse que seamos la zona metropolitana con mayor número de choques.

Finalmente, si multiplicamos las probabilidades de cada dato podemos llegar a una conclusión un poco chistosa pero cierta, si tú decides salir a manejar un automóvil de color blanco, un viernes por la tarde en el centro de la ciudad de Monterrey, estadísticamente tienes mayor probabilidad de chocar que cualquier otro conductor.

Ándate con cuidado si tienes un auto blanco y te gusta salir los viernes.

Lectores recuerden suscribirse en www.datlasacademy.com para obtener cursos gratuitos sobre métodos y conceptos de transformación digital. Para las y los primeros suscriptores habrá un curso de “Storytelling de Datos” de obsequio. No se lo pierdan.

Equipo Datlas –

Qué podemos aprender los equipos de datos del “Sistema Nervioso Toyota” – Datlas emprendedores

Hace unos meses en las últimas clases de la maestría de analítica hemos aprendido de “Lean Manufacturing” que, en pocas palabras, es un sistema de producción que impulsa la reducción de desperdicios y prioriza la mejora continua. Estos métodos están motivados por el sistema de producción TOYOTA.

En esta columna abordaremos uno de los rubros , particularmente el relacionado con el término “Sistema Nervioso Toyota”. Este tema es inspirado porque en temas de pandemia y donde equipos trabajan de forma híbrida (oficina, en casa, virtual y otras modalidades) podemos aprender de estas técnicas para mantener una cultura de mejora continua en un equipo de analítica de datos. Esta es una columna que le servirá a quienes buscan crecer en habilidades “suaves” a su equipo, más que habilidades “duras”.

Crear “autonomía”. La autonomía (“automation”) es la palabra de Taiichi Ohno para describir un sistema de producción que imita la autonomía humana sistema nervioso . Es decir, se ajusta automáticamente a las condiciones externas e internas. Por ejemplo, cuando tenemos demasiado calor, nuestro cuerpo automáticamente reacciona para enfriarnos; no tenemos que pensar en eso.

Similar, los sistemas de producción y equipos de análisis de datos deben reaccionar a las demandas de los clientes, variando la producción cuando la demanda aumenta o disminuye.

SISTEMA NERVIOSO TOYOTA

•Esta operación JIT (Just-In-Time o justo a tiempo) está diseñada como el sistema nervioso automático que reacciona a la información llamada “Kanban” emitida desde procesos anteriores a procesos posteriores cada minuto

•Como las reacciones del sistema nervioso automático se transmiten a los músculos y los músculos crean movimientos, sin dar información al cerebro, la suspensión y reanudación de las operaciones se realizan por dependencia mutua a través del intercambio de información entre los diversos miembros

•A medida que este sistema de producción evoluciona, el sistema pasa de “producción uno por uno” a “producción en flujo”

•El vicepresidente ejecutivo, Yoshimi Inaba, llama al “sistema nervioso”. ” Como el sistema nervioso central del cuerpo humano, Toyota transmite información rápidamente en toda la organización.…

•Incluso en una planta de Toyota, los ejecutivos entregan y reciben información de muchas personas. Por ejemplo, Jefe de planta con subordinados en una cena o copas. Del mismo modo, ventas senior la gente comparte información con los distribuidores y aprende sobre los gustos de los clientes visitándolos. Algunos equipos de datos y tecnologías lo hacen con pizza y cerveza en la actualidad

•Toyota usa este sistema para evitar los problemas de mala comunicación típica de las grandes organizaciones.


También te puede interesar la columna “Por qué pueden fracasar los proyectos de datos y analítica”

5 elementos claves para el SNT (Sistema nervioso Toyota)

1.Difundir el saber (“know-how”) hacer de forma lateral

2.Dar a las personas la libertad de expresar opiniones contrarias

3.Tener interacciones frecuentes cara a cara

4.Hacer explícito el conocimiento tácito (por experiencia)

5.Crea mecanismos de apoyo

Hasta aquí la columna de hoy. Te invitamos a preguntarte ¿Cuál de estas prácticas ya realizas en tu equipo? ¿Qué herramientas utilizas para amplificar la enseñanza y cultura a lo largo de la organización? ¿Cómo lo convertirías en una solución sostenible? Déjanos tus comentarios en @DatlasMX (Redes sociales).

Equipo Datlas

– Keep it weird-

Fuentes:

a) https://pyzdek.mrooms.net/file.php/1/reading/bb-reading/implement_05-reading.pdf

b) http://www.lean-manufacturing-japan.com/scm-terminology/jit-just-in-time.html

c) https://hbr.org/2008/06/the-contradictions-that-drive-toyotas-success

No te sientes al frente si vas en un carro blanco por gonzalitos (Caso de ANÁLISIS DE CHOQUES PARA NUEVO LEÓN, MÉXICO) – DATLAS INVESTIGACIONES

Aún con varios blogs escritos al respecto, los datos de los siniestros reportados de inicios del 2016 a mediados del 2018 en Mty NL, aún tienen mucho que decirnos. Y aunque pareciera un título alarmante, la realidad es que no lo es, ¿o sí? Como diría cualquier científico social: Depende. Quédate en este blog para descubrir la respuesta.

** Te puede interesar “Categorizando zonas con más choques en Nuevo León”

Si cualquier persona con suficiente equipo de cómputo para utilizar Microsoft Excel filtrara y contara las observaciones de la antes mencionada base de datos, se daría cuenta de los siguientes resultados:

  1. El color de los vehículos más chocado en ese periodo es el color blanco.

Seguido del gris, rojo, plata, y negro. Al quitar duplicados, sumar colores prácticamtente iguales, y ordenando de mayor a menor por cantidad de observaciones, obtenemos el TOP 10 se se ve en la imagen.

2. La parte del auto donde sucedió el choque más frecuente fue el frente

Seguido de la parte trasera, el cofre, el costado derecho delantero, y el costado izquierdo delantero. El procedimiento fue prácticamente el mismo que en el caso del color del vehículo, y gracias a ello tenemos el TOP 10 en esta segunda imagen.

3. Los choques de auto se concentran en su mayoría en la avenida Gonzalitos.

Por último, si proyectaramos un mapa 3D de las latitudes y longitudes, las cordenadas de los diferentes siniestros filtrados por tipo de vehículo, podríamos llegar a la conclusión de que en el mapa de autos, estos se concentran más en la avenida de Gonzalitos, mientras que en el camión se concentran por Ruiz Cortinez, y en los camiones ligeros por Madero.

Ahora bien, ¿debería de alarmarme por el título de este blog? Nuestra respuesta sería: no lo suficiente, y la manera más fácil de explicarlo es con el color del vehículo.

El hecho de que el color con más choques reportados sea el blanco, no quiere decir que dicho color sea el más propenso a chocar, porque no sabemos si es el color más comprado. Si por ejemplo casi toda la ciudad compró autos blancos y solo chocó 1 tercio, mientras que los autos rojos solo compraron 10 personas y todos chocaron porque es el color más propenso a chocar, el número de reportes entonces no nos ayuda mucho.

Algo similar sucede con la avenida Gonzalitos. Si solo nos basamos en los datos de los siniestros reportados, no podríamos comparar esta avenida con otras, al no estar seguros de cuantos automóviles la transitan, y por ende, no podemos asumir que es la avenida más peligrosa o propensa a sufrir un accidente. No es coincidencia que la hora con más choques es la 1:47pm, la cual cabe en lo que conocemos coloquialmente como la hora pico.

Como de costumbre, la intención de este blog no es asustar al usuario, si no compartir resultados interesantes de un análisis básico de datos, y generar conciencia de como un evento tan normal como un choque en esta ciudad, puede arrojarnos información interesante a compartir.

Hasta aquí la columna de hoy, no duden en visitar los otros escritos de esta base de datos o de la basta variedad de temas de analítica que hemos realizado. Pueden encontrarnos en nuestras redes sociales como @DATLASMX.

Adjuntamos el video echo por un aplicante para una de nuestras últimas convocatorias de ingreso a la startup, donde tenía que explicar esta y otras conclusiones interesantes de la base de datos en 6 minutos como máximo.

Equipo Datlas

-Keep it weird-

1 mes usando la mac mini apple (2020) para data science y edición de multimedia – datlas

Comenzó el nuevo año y la demanda de procesamiento para una startup de analítica como Datlas incrementó. Es usual que en las conversaciones del área de tecnologías y analítica escuchemos: Máquinas virtuales, bases de datos en la nube, arquitectura de información, data warehouse, data lake, data marts, cron jobs, entre otros .Así como nombres de sistemas y herramientas: Power Bi, Tableau, Azure, IBM Watson, R, Python, Matlab, entre otros.

En este blog te compartimos nuestra evaluación y decisión sobre adquirir una de las nuevas MAC MINI con procesador m1. Por primera vez dejamos atrás INTEL y nos atrevimos a intentarlo. Te contaremos nuestro proceso de evaluación así como nuestra recomendación final.

Antecedentes ¿Qué buscábamos en un equipo?

Principalmente potencia, una máquina que pudiera ser utilidad de 5 a 7 años y además que nos familiarizará con un nuevo sistema operativo (Estábamos muy “casados” con Windows y Linux, pero Apple está haciendo cosas muy interesantes que hay que voltear a ver para no quedarnos obsoletos).

Dentro de las opciones y los motivos, entre computadoras potentes de windows no podíamos justificar el precio-beneficio. En todos los “benchmarks” terminaba apareciendo la Mac Mini m1 en una muy buena posición. En muchos planos, era la ganadora y parece que finalmente APPLE ofrecía algo al mercado que teníamos que voltear a ver.

Un punto importante es que la compañía de la manzana hizo un gran trabajo en la eficiencia de uso energético. Nosotros pensábamos dejar este equipo encendido al menos 5 días de la semana para correr algunos “jobs” automatizados y su ahorro energético la hacía buen opción.

Así como un procesador rápido, que vaya a la vanguardia con el mercado y nos permitiera mejorar nuestro trabajo de contenido para academy, podcast y blog

¿Mac sobre Windows para edición? OK … pero para ¿Data Science?

Considerando estos antecedentes, alguna de las opciones de MAC M1 (Laptop, desktops, etc) parecía ser una opción a evaluar para la startup. Aunado a esto, nuestro podcast con casi 60 capítulos ha sido trabajado hasta el día de hoy para edición de audio dede una MACBOOK PRO 2015 con algunas alteraciones como aumento de memoria SSD. Aún así era díficil continuar escalando la producción con un equipo como este.

Para la parte de las ediciones multimedia, el equipo (MAC MINI M1) se justificaba sólo, pero ¿Para Data Science? Aún y cuando buscamos e investigamos en videos de youtube, testimonios, preguntamos en foros, había muy poca documentación sobre como funcionaría para Data Science. Solamente nos podíamos entender con las guías de qué puntuaje tendría el procesador con casos de uso de “single-core” y “multi-core”. En Single core para procesos en batch parece que es bastante competitiva en contraste con su homologa que tiene el procesador de INTEL. Pero, en multi thread, hay ciertos escenarios específicos donde INTEL sigue siendo mejor.

¿Mac Mini M1 2021?

Es la computadora desktop de la clase MINI más nueva que ha sido lanzada con una variante de procesador: M1 sobre INTEL.

Las entradas de cables no son su fuerte, sin embargo encontramos thunderbolt, USB, conexiones a luz, cable ethernet y también entrada HDM1.

Importante decir que esta computadora, por la manera en que se desarrolló internamente, y parecida a modelos recientes de la mac, no puede ser “Updateada”. Es decir, no se le puede ampliar el RAM o alterar el procesador. Por eso mismo seleccionar una versión que sea útil durante el tiempo es importante.

Selección de la mejor versión de Mac Mini M1 2020

La MAC MINI m1 se puede adquirir en su versión básica (8gb de RAM y 256 SSD de memoria de disco) desde $650 dllrs . Las versiones más sofisticadas llegan a valer el doble.

Particularmente, en nuestro caso calculando el costo-beneficio, nos decidimos por la versión de 16 de RAM. Esto porque después de ver bastantes “reviews” hacían énfasis en que el RAM era algo que nos podíamos quedar cortos con 8. Además , particularmente, para tareas de análisis estamos acostumbrados a trabajar con 16 de RAM desde hace 5 años entonces ¿Para qué ir para atrás en este aspecto?

Por otro lado, la opción de memoria SSD no parecía razonable subirla. Esto porque llegar a 1TB subía más de $200 dllrs el valor final de compra. Pero preferimos irnos por lo básico: 256 GB y comprar por fuera una memoria HDD marca LA CLIE de 5 TB por menos de $150 dllrs.

Beneficios

Una configuración como la mencionada, es ideal para disminuir tiempos de renderizado en edición multimedia al menos un 70%. Episodios en calidad 4K que tardaban medio día en la MACBOOK PRO antigua, ahora toman menos de media hora.

Por otro lado, en procesos de analítica de datos. A pesar de unos problemas por no correr los programas de manera “nativa”, debo decir que los procesos se corren más rápido que mi equipo actual (Windows 10 Intel corte i7 8va generación con SSD).

Problemas

El m1 es potente con aplicaciones nativas, pero sí hay algunas diferencias cuando corremos programas que no pueden avanzar con la clase “Apple”. En esta situación el sistema operativo nos sugiere utilizar “ROSETTA” que es un adaptador para poder abrir programas que no tengan una versión nativa de M1.

Si abrimos el monitor de actividades podemos ver en la columna “CLASE” bajo qué esquema corre cada uno de los programas. Si es en APPLE significa que correrá con M1 , de lo contrario será usando ROSETTA.

Recomendaciones finales

Si en tu equipo de trabajo están buscando actualizarse en hardware, la mac mini m1 es una buena opción. Sin ser una computadora con “specs” galácticos o cuánticos, verdaderamente es una buena opción precio-beneficio. Es un equipo multi-usos que además de aprovechar sus capacidades avanzadas de edición te permitirá correr sin problema mucho de tus códigos que hoy corres en tu equipo INTEL

Principales drivers de compra:

  • Precio – beneficio
  • Versatilidad de uso
  • Tamaño y convenencias

Contras de compra

  • No se podrá actualizar su hardware durante el tiempo
  • No todos los programas corren nativos, habrá que usar ROSETTA durante un tiempo
  • La memoria SSD integrada puede duplicar el precio del equipo

Hasta aqui nuestra columna de hoy ¿Qué opiniones tienes de la evaluación? ¿Haz considerado usar un procesador M1? O si ya lo usaste ¿Cuál es tu experiencia? Continua la conversación con nosotros en redes sociales etiquetando a @DATLASMX

Saludos

Equipo Datlas

– Keep it weird –

Fake News (Radiografía en México) – Columnas de opinión Datlas

En otros blogs hemos comentado de distintas controversias sobre análisis de datos. Hablamos de algoritmos de censura en redes sociales como twitter, casos que atentan con la privacidad como el de cambridge analytica y dimos nuestra opinión sobre las FAKE NEWS en eventos como Talent Land.

En esta ocasión motivados por el evento del próximo 22 de Junio en LABNL complementamos la opinión de las FAKE NEWS difundiendo una investigación de la UNAM y narrando cómo funcionan las granjas de bots según investigaciones de las BBC.

El homo sapiens digital

Es importante seguir amplificando la conversación de FAKE NEWS debido a la creciente cantidad de dispositivos conectados a la red y la información de insumo para las notas periodísticas en el mundo

  • 7.6 Bn de Habitantes
  • 50 Bn de dispositivos conectados
  • 7 dispositivos por persona
  • 5,020 gigabytes por persona
  • +80,000 ciberataques al día

Hoy en día se escriben más bases de datos que nunca antes en la historia. Nuestra actividad en redes sociales, transacciones electrónicas y las interacciones en el mundo tecnológico deja una huella digital que alimenta sistemas de información robustos. Estas bases de datos, antes estaban sólo al acceso de profesionales calificados o instituciones certificadas. Sin embargo, con el avance en el área de “analítica de datos” y el internet, más personas  pueden acceder a estos datos e interpretarlos a su criterio para después hacerlos de dominio publicó en redes como Facebook, Whatsapp, Instagram y Twitter.

En las noticias falsas (Fake news), debemos de navegar en nustras redes cuestionando los roles de los consumidores y generadores de información en la conversación social que habilitan las redes sociales.

Durante el COVID-19 fuimos testigos de la desalineación entre la alta velocidad de difusión de noticias falsas habilitadas por redes como Facebook y Whatsapp y la validación de las mismas. Tanto así que esto impulso el movimiento de masas con repercusiones como el agotamiento de ciertos bienes de consumo en tiendas de autoservicio (Cerveza, papel higiénico, entre otros).Adicional, estudios como el de  “Radiografía sobre la difusión de fake news en México” de la UANL en el 2020 indican que el 90% de los usuarios de Whatsapp en México había obtenido una nota falsa. En este sentido resulta oportuno ampliar el diálogo sobre ética de datos y “fake news”.

Importancia de hablar de FAKE NEWS

La velocidad a la que fluye la información en INTERNET gracias a las redes sociales eleva la necesidad de hablar de redes sociales. Según estudios el 90% de los mexicanos recibió una FAKE NEW durante la pandemia COVID-19

Fake News y las granjas de bots en México

La limitante de que en México podemos obtener tarjetas SIMS sin la necesidad de registrar nuestra identidad abre la puerta para que muchas cuentas falsas en redes sociales como twitter y facebook se den de alta (Esto porque dependen de un número telefónico).

Estudio de Radiografía en redes sociales México

En un estudio de la UNAM realizado a más e 1600 internautas de los 32 Estados del país se generaron distintos hallazgos sobre FAKE NEWS.

  • 88% recibió una noticia falsa
  • 90% recibió una nota falsa sobre COVID-19

DeepFake

Ahora, gracias a la tecnología DEEP FAKE, no podremos confiar en lo que veamos y escuchamos en internet. Hay que validar. Aquí este ejemplo que la empresa mexicana SORIANA hace sobre CANTINFLAS (Un actor legendario en México de la época de oro)

Cierre (5 pasos para evitar la propagación de FAKE NEWS)

1.No creer al 100% lo que circula en las redes sociales

2.Darse unos minutos para corroborar antes de compartir

3.Guardar la calma y no dejarse llevar por los impulsos ni hacer comentarios deliberados si no tenemos la seguridad

4.Mantenernos informados a través de autoridades de salud, nacionales e internacionales

5.Seguir las normas de sanidad establecidas para evitar el contagio

Hasta aqui la columna de hoy. Si te quieres sumar a la conversación de FAKE NEWS no dudes en contactarnos via redes sociales en @DATLASMX

Equipo DATLAS

– Keep it weird –

Fuentes:

Cisco IBSG, EMC Digital Universe with Research & Analysis by IDC y PURPLE Resources. Via: https://purplesec.us/resources/cyber-security-statistics/

https://www.dgcs.unam.mx/boletin/bdboletin/2020_318.html

fiNALMENTE SABEMOS CÓMO FUNCIONA EL ALGORITMO DE INSTAGRAM – INVESTIGACIÓN DATLAS

Una de las columnas que más atención ha recibido en este blog es el de “Social Dilemma” . Este documental de “Netflix” socializó el uso de los algoritmos en páginas como: Facebook, Instagram, Twitter, entre otros.

**Te podria interesar aprender sobre algoritmos en nuestra columna: “Algoritmos supervisados y no supervisados”

En esta columna particularmente compartiremos algunos apuntes de uno de los líderes de Instagram: Adam Mosseri. Recientemente publicó una columna donde da más luz de cómo funciona el ALGORITMO DE INSTAGRAM que prioriza el feed y que seguramente impulsa a muchos “influencers” a crecer sus audiencias.

Anatomía de los sistemas de publicaciones en Instagram

  • Feed – Es lo que cualquier perfil tiene entrando en su app. Se compone de todas las publicaciones de las cuentas que seguimos
  • Stories – Publicaciones temporales desde cualquier perfil
  • Explore – Una sección de la aplicación donde puedes consumir contenido sugerido de acuerdo a tus preferencias. Estas preferencias son registradas y priorizadas por algoritmos
  • Reels – Son pequeñas cápsulas de video que permiten a usuarios ser encontrados por nuevas audiencias a la exploración de esta sección en el app. Suele ser más sencillo tener más views en este tipo de contenido que en otras secciones del app.

¿Quiénes dominan en instagram?

Es importante entender las redes sociales. En instagram hay un top10 que se ha mantenido a lo largo del tiempo que va desde los 319 millones de usuarios hasta los 517. Este tipo de perfiles tienen agencias de representación y contenido que les asesoran sobre cómo aprovechar el algoritmo de instagram para generar una mayor masa de seguidores.

  1. Cristiano Ronaldo
  2. Justin Bieber
  3. Ariana Grande
  4. Selena Gomez
  5. Taylor Swift
  6. Dwayne Johnson
  7. Katy Perry
  8. Kylie Jenner
  9. Rihanna
  10. Kim Kardashian

Revisar lista completa en: https://www.visualcapitalist.com/worlds-top-50-influencers-across-social-media-platforms/

¿Cómo funciona el algoritmo?

Hay que precisar que en realidad no hay un sólo algoritmo, existen varios dependiendo la sección del app de instagram que estemos utilizando. Según Adam, en su columna sobre cómo funciona el algoritmo, menciona que en el 2010 el feed era “cronológico” , pero con el incremento de usuarios identificaron la necesidad de mostrar contenido más “relevante” a cada una de las cuentas.

A) Feed e Historias

Todo comienza buscando que debería de aparecer primero en el feed de cada quien ¿Tus amigos cercanos? ¿Contenido de tus deportes afines? ¿Las ciudades que visitan tus colegas? En esta sección la prioridad es ver contenido de las personas que sigues.

Después de esto los sistemas de instagram traducen este “follow” en señales que le permiten al algoritmo priorizar. Algunas de las más importantes son: Información sobre el post (Duración, relevancia, equipo con el que publicó el contenido , entre otros), Información sobre la persona que publicó el post (En este sentido el sistema detecta qué tan interesante podría ser para ti el contenido), Tu actividad en likes (En algoritmo se entrena dinámicamente identificando qué tipo de contenido suele gustarte y consumes durante más tiempo) y TU HISTORIA INTERACTUANDO CON ALGUIEN (Interpreta qué tan interesado estás en una persona por ejemplo leyendo si comentas o no en sus posts así como si tienes algún mensaje directo)

B) Explore

Distinto a Historias y Feed en Explore es donde quieres descubrir nuevo contenido. Instagram monitorea las señales que categorizan el contenido con el que interactuas con mayor frecuencia. En ese sentido, por ejemplo, si eres una persona que le gustan las fotografías de “montañas” , el sistema priorizará cuantas imágenes y contenidos de “hiking” exista en tu comunidad de alcance en “explore” para mostrártela.

Las señales más importantes que buscan son: Información del post, Tu historia de interacción con la cuenta que publicó, Tu actividad ( Cómo has interactuado con otro contenido de Explore en el pasado) e Información acerca de la persona que publicó

C) Reels

Muy parecido a Explore, en Reels visualizas principalmente contenido de cuentas que no sigues. Reels está basado principalmente en entretenimiento, aprendizaje y diversión ¿Te suena familiar?

Las señales a las que se ponen atención son: Tu actividad, Tu historia interactuando con la persona que publica, Información acerca del Reel (La canción de fondo, sonidos de fondo, video definido en tamaños de pixeles y resolución así como la popularidad del mismo) e Información de la persona que publica.

D) Otros: ¿Cómo puedes “alterar” el algoritmo?

Sistemáticamente hay algunas reglas de excepción que evitarán que te satures del contenido de una persona o cancelara a una cuenta si publica con demasiada frecuencia. Puedes leer las normas comunitarias de Instagram para saber más detalles de estas reglas (Por ejemplo si hablas de COVID-19 y otros temas controversiales será dificil ser popular)

Por otro lado como usuarios estamos empoderados a modificar el algoritmo con 3 prácticas: Selecciona una lista de tus amigos más cercanos (Close Friends) en la red para ver de forma más frecuentemente su contenido, Cancela o silencia cuentas que no te interesan y cuando en secciones como Reels y Explora veas contenido que no te interese señálalo como tal para que el algoritmo penalice ese contenido a la hora de priorizar.

Cierre

¿Entonces ya somos los magos del Instagram? Lo cierto es que es más fácil entenderlo que ejecutarlo. Pero conociendo un poco las entrañas del cómo funciona podemos saber que no es “una caja negra”.

Cuéntanos cuáles son los mejores trucos para intagram y continuemos la conversación en nuestras redes @DatlasMX

Equipo Datlas

– Keep it weird –

Fuentes:

Liga 1: https://9to5mac.com/2021/06/08/instagram-algorithm-works/?fbclid=IwAR0Wzp4cAao_-vIO2mPsRjJdqUUwofeG5h0mnfWCEjbdDrCHU7FFQaEe8TE

Liga 2: https://about.instagram.com/blog/announcements/shedding-more-light-on-how-instagram-works

¿refrigeradores conectados a internet? industria 4.0: iot -investigación datlas

Anteriormente hemos platicado de ciudades inteligentes en donde tocamos brevemente el tema de sensores e internet de las cosas. En esta ocasión queremos contarte un poco acerca de que trata este gran elemento dentro de la transformación digital y la industria 4.0.

Antes de iniciar hay que tener claro que el término “industria 4.0” se utiliza para referirse a la llamada “cuarta revolución industrial”. El término se originó en Alemania en el 2011, y hace referencia a un modelo de manufactura avanzado que incluye tecnologías integradas una con otra de manera física o digital.

Existen varios tipos de tecnologías que pueden ser integradas a estos modelos, como por ejemplo: inteligencia artificial (IA), robots, cloud computing y efectivamente, el Internet de las Cosas (IoT por sus siglas en inglés).

Universidad y 4ª revolución industrial | Aprenentatge Servei

¿Qué es el Internet de las Cosas?

A grandes rasgos, el internet de las cosas encasilla todo lo que está conectado a internet, permitiendo que los objetos se “comuniquen” entre ellos. De manera más específica, el IoT es una herramienta tecnológica que permite integrar sistemas de procesamiento, almacenamiento y comunicación entre diversos procesos conectados entre si.

¿Dónde está presente el Internet de las Cosas?

El objetivo principal del IoT, es automatizar procesos. Por ello, está presente en muchos objetos cotidianos; desde los celulares que usamos, relojes inteligentes, aparatos electrónicos (TVs, consolas), un amplio abanico de electrodomésticos (como refrigeradores) y hasta cámaras.

También está presente dentro de las grandes industrias, por ejemplo en las industrias manufactureras, se encuentra en forma de sensores que mandan alertas si algo está pasando; en los grandes campos de cultivo donde gracias a algunos sensores, se puede conocer a detalle la calidad de la tierra.

Internet de las Cosas: Definición, funcionamiento, 6 beneficios y ejemplos

En el giro de transporte y logística, gracias al IoT, se pueden administrar las flotas de automóviles, barcos y aviones, tomando en cuenta factores como el cambio climático, disponibilidad de la vía, tránsito, entre otros. Además, el IoT se puede usar para mejorar la seguridad de los trabajadores. Por ejemplo, empleados en entornos peligrosos como minas, campos de petróleo y plantas químicas, necesitan tener conocimiento de los posibles eventos peligrosos que podrían suceder. Al estar inmersos en la tecnología IoT, pueden recibir alertas o notificaciones que les permitan tomar las acciones pertinentes.

Los retos actuales del IoT

Ahora bien, conociendo un poco del IoT, sus aplicaciones y beneficios, es importante conocer los retos a los que se enfrenta esta tecnología en el mundo moderno.

En primera, ¿cómo migrar a un ecosistema IoT? Se puede decir que tratar de migrar a la industria 4.0 es complicado. No solamente se limita a grandes inversiones económicas, implementación de tecnologías, equipamiento o softwares. Se trata de realmente lograr un cambio de visión y perspectivas dentro de la compañía, algo que no es para nada sencillo.

Volviendo al tema financiero, los costos de inversión para un ecosistema IoT pueden variar mucho, dependiendo del tamaño de la compañía y los alcances que se buscan, pero podemos asegurar que no es para nada barato. Aunado a esto, se estima que a las compañías, ver el retorno de inversión (ROI) les puede tomar entre 7 y 12 años.

La seguridad y privacidad digital también es un reto que afronta la transformación IoT. Las compañías pueden ser víctimas de amenazas, ataques por parte de hackers y hasta filtración información sensible. Se requiere que se desarrolle confianza en los ecosistemas IoT, sin embargo, las frecuentes amenazas a la seguridad y privacidad, lo hacen un camino difícil de recorrer.

Hasta aquí la columna de hoy. ¿Qué opinas del IoT? ¿En el futuro realmente puede ser más accesible y realizable? ¿Conoces algunos casos de IoT aplicados en la industria? Compártenos tu opinión a través de nuestras redes sociales @DatlasMX

Equipo Datlas

-Keep it weird-

Temas: Inteligencia de Datos y Transformación digital