Archivo de la etiqueta: python

Facebook abre Datos para México (De los legales) – Datlas Research

Recientemente en algunos medios,principalmente científicos y prensa especializada de tecnología, se habló de que los datos que facebook hizo públicos. Esta vez siendo un tema que va más allá de un “hack” o el caso “Cambridge”. Más bien, una empresa que en pro del desarrollo de tecnología más humanitaria estaba generando iniciativas para mejorar la información con la que como humanidad tomamos decisiones.

datlas_barra_suscribir

El pase de diapositivas requiere JavaScript.

Esta es la visión del centro de Data for Good de Facebook, la famosa red social con más de 2 mil millones de usuarios activos. De acuerdo al referente de este centro, Molly Jackman (FB Public Policy)  “Al analizar imágenes satelitales existentes y usando Inteligencia artificial los equipos de Facebook lograron crear los mapas de densidad poblacional más granulares a la fecha”-

Liga de video: https://www.facebook.com/watch/?v=1143199219065401

¡Muéstrame los mapas!

Sin más preámbulo ¿Qué podemos encontrar para México y en dónde?

La fuente que recomendamos es la siguiente: https://data.humdata.org/dataset/mexico-high-resolution-population-density-maps-demographic-estimates

En el contenido encontrarás archivos en CSV que pueden ser leídos con excel, R o python (los últimos 2 open-source) y también geoTiff que inicialmente sugerimos explorar con QGIS (También open-source o GRATUITO). La verdad el geoTIFF es el bueno para visualizar. Pero, esto depende del gusto del analista de datos.

datlas_barra_suscribir

Iniciamos  buscando las imágenes de alta resolución y entrando al menú con una oferta de más de 14 archivos para México.  Para fines de este ejemplo usaremos los datos de “mujeres en etapa reproductiva” (la razón por la que Facebook decidió hacer este tipo de cortes con inteligencia artificial es porque busca detectar poblaciones donde los datos puedan generar impactos claves, para mayor explicación ver el vídeo)

El pase de diapositivas requiere JavaScript.

Excelente, ahora decidimos usar el geoTIFF de estos archivos y con un par de filtros en la paleta de colores de los puntos mapeados tendremos resultados como los siguientes:

Este tipo de información podría servirle a un gobierno, organizaciones sociales y operativos de rescate a mapear poblaciones elementales para iniciativas de salud. Por ejemplo hay casos documentados para algunos paises de África donde, a falta de censo oportunos, este tipo de información ha logrado segmentar las iniciativas de desarrollo económico en zonas de mayor impacto. Por otro lado con un ángulo más comercial, como el que tenemos por vocación en Datlas, empresas de higiénicos y medicamentos enfocados a este “clúster” de población pueden ser mejor ubicados con el aprovechamiento de estos datos.

Otro ejemplo es el de la base de datos de niños menores de 5 años.  Donde con datos de facebook podemos mapear a las poblaciones más vulnerables del del país. Aunque a simple vista se ven como puntos sin sentido en un mapa, si en un sistema GIS das zoom, cada punto está muy bien detallado a qué manzana o AGEB pertenece.

Datlas_Mexico_DatosFB10

Esto en caso de una catástrofe natural nos ayudaría a leer dónde está un grupo vulnerable qué atender con prioridad. Y bueno además del ojo social, desde un ángulo de observatorio comercial, una empresa de pañales podría capitalizar estos datos para generar estrategias de expansión o elasticidad de precios.

A opinión personal, nos gustaría ver en el futuro mapas de migrantes o distintas nacionalidades que residen en el país. Esto podría sensibilizar y ser propulsor de nuevas políticas públicas enfocadas en el contexto de fragilidad que actualmente hay en el mundo por estos temas de migración.

datlas_barra_suscribir

En Datlas continuamos incrementando nuestro acervo de base de datos para aprovechar en nuestros sistemas de información.  Contamos con más de 10,000 bases de datos analizadas para entregar los mejores datos en nuestra plataforma web www.datlas.mx

Déjanos tu opinión de cómo piensas que estos datos podrían ser bien aprovechados y qué cuidado debemos tener al tratar con esta información. Si te gusto la columna te pedimos compartirla en tus redes sociales.

Saludos

-Keep it weird-

Equipo Datlas

Anuncios

¿Dónde se sabe programar más en México? (y otros datos…)

Las formas en la que usamos y nos conectamos al internet están cambiando constantemente, tanto en México como en el resto del mundo. Para cualquier empresa es importante estar al tanto de estos cambios ya que muestran nuevas perspectivas de cómo alcanzar e interactuar con los usuarios. No es gran sorpresa por ejemplo que Netflix reportó en el 2016 que la mitad de sus usuarios usan el servicio en Smartphones durante cualquier mes dado.

Datlas_barra_suscribir

Aquí en México, justo esta semana fue hecha pública la Encuesta Nacional sobre Disponibilidad y Uso de Tecnologías de la Información en los Hogares 2017 (ENDUTIH). Los creadores de la encuesta describen su diseño como “probabilístico”; en otras palabras, los resultados se generalizan a toda la población. A continuación se mostrarán algunos hallazgos que fueron hechos usando esta encuesta (incluyendo el título de este post obviamente):

Uso de Internet:

El porcentaje de la población de más de seis años que se caracteriza como usuario de Internet fue de un 63.9% en el 2017 a nivel nacional (un aumento de 4.4 puntos porcentuales al 2016). Otro dato de alta importancia es que la gran parte de los usuarios de Internet usan un Smartphone (sin embargo no exclusivamente) para conectarse a la red. Otro dato de los más característicos de los resultados de la encuesta fue (sin sorpresa alguna) que el uso y disponibilidad de Internet es significativamente más alto en zonas urbanas y más desarrolladas.

dispositivo de conexion
Fuente: INEGI

Disponibilidad de conexión a Internet:

En cuanto a lo urbano, de las 49 ciudades encuestadas las ciudades con mayor porcentaje de viviendas que tienen disponibilidad de conexión a Internet fueron: Hermosillo, Cancún y La Paz. Mientras las ciudades con menos disponibilidad de conexión a internet en las viviendas fueron: Tehuacán, Tuxtla Gutiérrez y Tlaxcala.

ciudades_vivint
Entre más grande el circulo, más disponibilidad de Internet en los hogares.

Tipo de conexión a Internet en las viviendas:

De las viviendas encuestadas que disponen de conexión a la red, en la Ciudad de México el 57% tienen conexión a Internet de ambos tipos fija y móvil, mientras que el 10% tiene solamente conexión móvil y el 23% tienen solo conexión fija. En Guadalajara la gran mayoría reporta únicamente tener conexión fija a Internet (88%). Mientras tanto Monterrey parece estar en un punto medio de los extremos reportados en estas dos otras ciudades.

AccesoInternet.png

Uso de redes sociales:

Un 51% de los entrevistados reportan usar redes sociales, la más popular siendo Facebook y la menos siendo LinkedIn. Otro dato interesante es que las ciudades donde LinkedIn es más popular son Toluca y Querétaro, con más de un 3% de los entrevistados reportando que usan esta red. La encuesta también muestra que no existe mucha diferencia entre sexos con respecto al uso de redes sociales (ambos sexos reportan un uso de aproximadamente 51%), sin embargo los hombres usan más LinkedIn y Twitter mientras que las mujeres están más activas en Facebook, Snapchat y Instagram.

redes_sociales1
Presencia en distantes redes sociales de los usuarios que reportan usar redes sociales.

Habilidades de programación:

Según los datos de la encuesta, el 8.1% de la población encuestada a nivel nacional tiene habilidades de programación en un lenguaje especializado.
De los hombres encuestados, el 9.7% reporta tener este tipo de habilidades mientras que solamente el 6.7% de las mujeres reporta tener la habilidad.
De las ciudades encuestadas, la ciudad con mayor porcentaje de mujeres que programan es Zacatecas y en la que menos es Tapachula (para los hombres estas ciudades vienen siendo Pachuca y Acapulco respectivamente).
Si tomamos a toda la gente de ambos sexos, las ciudades con mayor porcentaje de programadores entre los encuestados son Pachuca, Toluca y Zacatecas. Claro que no resulto sorprendente que la ciudad con mayor número de encuestados programadores en total es primero la Ciudad de México, seguida por Guadalajara y Monterrey.

Datlas_barra_suscribir

*Es importante tener en cuenta que la encuesta únicamente pregunta: “¿usted sabe programar en lenguaje especializado?”, no se especifica el nivel de competencia y al final de todo es una encuesta.

programadaros_ciudades

programadores_estadosprogramadores_escolaridad

La encuesta abarca mucho territorio; se registraron respuestas de temas desde la compra y venta de productos en línea, la descarga de aplicaciones, a infecciones de virus y fraudes de información.  Para explorar más datos la encuesta se puede encontrar en la siguiente liga: http://www.beta.inegi.org.mx/proyectos/enchogares/regulares/dutih/2017/.

 

Equipo Datlas

BigData Meetup Monterrey – Los tips para ser un científico de datos con #Twitter

¿Qué tan complicado es volverse un data scientist? … bueno mientras sepas de matemáticas siempre será sencillo saber por dónde empezar.

Esta semana recibimos la invitación de la comunidad de Big Data Monterrey a exponer en un meetup algún ejercicio que hayamos trabajado con información. Como también iban a asistir miembros de la comunidad de Python decidimos compartir todo lo que sabemos sobre el análisis de redes sociales.

Hace unos meses comenzamos a explorar cómo podíamos usar Twitter para entender la dinámica de una ciudad. Esto es porque en la red de twitter muchísima gente (alrededor de 30 mil por mes) publica a dónde sale, cómo se la pasó y qué estaba haciendo.

Todo esta valiosisima información puede ser capturada con unas cuantas líneas de código y después analizadas para entender la dinámica de una ciudad. Aqui les dejamos una síntesis de la presentación que dimos en el Meetup para que puedan conocer todo.

En cuanto a nuestra experiencia el día de la presentación la verdad es que quedamos fascinados por la oportunidad que nos dieron. El “engagement” de los participantes salió a relucir. Nos hicieron muchas preguntas, pero al mismo tiempo nos compartieron algunas ideas que habían intentado trabajar antes.

Les queremos compartir que nuestro siguiente taller programado es en el INCMTY 2016 bajo el nombe de: Datlas, Tengo una idea ¿Dónde la pongo?

No se lo pierdan si quieren conocer más de lo que hacemos, de aprender más trucos de análisis de datos o tips de como usar grandes cantidades de información para mejores decisiones de negocio.

tallerincmty_datlas

Nos seguiremos dando a conocer en este año para que más gente quiera usar nuestra plataforma. Por favor deja tus comentarios sobre la presentación y comparte este blog con todos tus amigos interesados en los #datos.

 

Saludos y -Keep it weird –

Equipo Datlas

www.thedatlas.com