Archivo de la etiqueta: proptech

5 errores al analizar bases de datos inmobiliarias y cómo evitarlos – Datlas research

Desde hace un par de años, como lo contamos en la experiencia PROPTECH en México, hemos generado grandes aprendizajes en el sector inmobiliario, sobre todo analizando información de precios de propiedades y generando modelos matemáticos con esta información.

Datlas_barra_suscribir

Actualmente nos encontramos mejorando nuestro modelo de valuación de inmuebles, que documentamos en esta columna, y en esta columna queremos compartir nuestros aprendizajes modelando algunas bases de datos inmobiliarias. Sobre todo con enfoque a qué errores evitar en el análisis de este tipo de información. No seremos tan técnicos, pero si es necesario que para comprender la lectura tengas un conocimiento introductorio de estadística.

Para este ejercicio tomaremos de referencia una base de datos de casas y apartamentos con más de 16,000 ubicaciones para Guadalajara, Jalisco, México. La información que usaremos contiene variables como: Ubicación, Cantidad de recámaras, baños, tamaño de construcción, tamaño de superficie, Edad de inmueble y un listado de amenidades asociada al inmueble.

5 Errores a evitar

1) Usar datos sin limpiarlos previamente

También te puede interesar, metodologías para análisis de datos

  • Es importante generar un diagnóstico a la base de datos y entender muy bien cuales son los problemas que pudiera generar en el modelo que queremos trabajar
  • SI es necesario, hay que preparar las variables para poderlas manipular exitosa mente. Por ejemplo, si existe algún valor numérico, hay que asegurarnos de que esté correctamente declarado como numérico. Lo mismo cuando sean textos, como caracteres
  • Muchos analistas primerizos no consideran un proceso exhaustivo de limpieza de datos. Por ejemplo, si estamos generando un modelo que nos va a ayudar a predecir precios de bienes raíces es importante que el insumo tenga correctamente registrado los valores de precio. Para esto podemos quitar los campos vacíos y evaluar y la base sigue contando con buen poder explicativo. En este caso quitamos todos los valores en 0, menores de 0 y NAs
  • Repetimos el proceso para cada una de las variables que quisiéramos validar en el modelo

Datlas_Str(BD_1

2) Manejar información no homologada

  • Hay algunas variables que pueden ser estandarizadas o escaladas para trabajarlas en contexto de análisis. Para variables de inmuebles es importante entender que existe una relación positiva entre el tamaño de una propiedad y su precio. Entre más grande sea una casa o un departamento, su precio potencial será más alto
  • En ese sentido podemos generar una nueva variable dividiendo el precio entre los metros cuadrados de superficie de cada inmueble. Así podemos obtener el precio por metro cuadrado, que sería una medida más estándar para contemplar en el análisis
  • Repetimos este proceso generando variables dummies o dicotómicas (1 cuando aplique y 0 cuando no) para la presencia de amenidades como: Albercas, Seguridad, Terraza, Estacionamiento y/o Elevador

Datlas_Str(BD_2

Atención en las dummies que tienen valores entre 1 y 0

Datlas_Dummies

3) No diagnosticar y remover correctamente los outliers o anomalías

También te puede interesar ¿Cuánto cuesta una buena ubicación para tu negocio?

  • Este paso es uno de los más complejos, una anomalía puede ser interpretado como valores extremos en variables. Por ejemplo, una casa tradicional podría tener de 2 a 4 habitaciones. Un departamento entre 1 y 2. Si encontramos registros con valores por encima de 10 habitaciones seguramente pudo haber sido un error de registro.
  • En el mismo sentido variables como precio, edad de inmueble, baños y tamaños de superficie deben de ser revisados a detalle para remover los valores extremos a la alza y a la baja. Un buen método es graficando un boxplot donde podamos visualizar la distribución por clases, en este caso por tipo de residencia entre casas, departamentos y condominios. Los puntos extremos o fuera de la caja podrían ser considerados como “outliers”, por lo mismo hay que diagnosticarlos más a detalle
  • ¿Cómo se hace? Entre algunos métodos, de los más sencillos de explicar es utilizando el rango intercuantil. O prácticamente el equivalente a lo que está dentro de la “caja” en una gráfica de boxplot (entre el cuartil 3 y el cuartil 1). Esto, sin embargo, significaría quedarnos con el 50% de los valores. Eso sería funcional si se tratara de datos que provienen de ejercicios con más margen de error, como el de  un experimento humano, pero en esta caso los registros se hacen por sistema asi que el error de registro podría ser minimizado
  • Para estos valores, podemos generar deciles por niveles de precio. De esta manera priorizar los valores entre el decil 10% y 90%. Nos aseguramos que los valores extremos queden fuera graficando en un boxplot nuevamente y validando que haya un mejor ajuste en la distribución

El pase de diapositivas requiere JavaScript.

 

4) Ignorar la propiedad geoespacial de las bases de datos con direcciones

  • Como mencionamos al inicio, una base de datos inmobiliaria tiene atributos geográficos como direcciones o coordenadas. En este caso estamos trabajando con coordenadas y lo primero que recomendamos hacer es asegurarnos de quedarnos con los registros que solamente están en la región que queremos analizar en el modelo. Esta limpieza puede ser manual o usando técnicas más sofisticadas que implican el uso de shapefiles a nivel municipio o Estado
  • Mucha estadísticas inmobiliarias están hechas a nivel código postal. Por ejemplo te dicen cuál es el precio promedio por CP o el tamaño promedio de las casas. La realidad para México es que podemos encontrarnos con disparidades, una casa del más alto nivel socioeconómico y a dos cuadras casas de tipo popular. En este sentido para capitalizar correctamente estos estadísticos debemos de generar zonas o clústers dentro de una misma ciudad de casas que compartan ciertas características
  • A partir de esto se pueden generar valores como valor promedio por clúster
Ejemplo de mapeo de base de datos inmobiliaria sin limpiar los datos mal registrados
Ejemplo de visualización de base de datos inmobiliaria sin limpieza suficiente

Datlas_barra_suscribir

5) Dejarse llevar por el primer resultado que te haga sentido

  • Una vez con la información limpia, estructurada y homologada podemos explorar la bases datos de distintas maneras. Lo tradicional es generar histogramas, gráficos de dispersión y/o correlaciones para entender qué está pasando con las variables. Para esto, les recomendamos la paquetería de GGALLY en R para echarle un vistazo a las variables numéricas de manera general
  • Por ejemplo, encontramos entonces una correlación entre baños y precio ¿Vale la pena? Significa que la cantidad de baños está relacionado el precio. O realmente es un efecto estadístico porque todas las casas “caras o de precios altos” tienen más de 5 baños. No podemos sacar suficientes conclusiones y un mal analista sacaría conclusiones con estas líneas tan débiles de hallazgos. Se requiere profundizar

Datlas_Ggally2

  • Podemos estudiar otras opciones de métodos de relación entre variables como una regresión. Buscamos la causas que provocan variaciones en el precio revisando variables como: Recámaras, Baños, Tamaño de terreno, tamaño de construcción, edad del inmueble y amenidades.
  • Pondremos atención a los signos de los estimadores, tratando de entender que tiene efectos a favor y en contra del precio. Por ejemplo, en este caso que la casa tenga Terraza o Alberca incrementa su valor en un monto considerable. También revisaremos el valor de ajuste R2 y la significancia total del modelo.

El pase de diapositivas requiere JavaScript.

Finalmente una vez establecido el modelo podríamos generar algunos ejercicios de predicción. Poner a prueba un inmueble existente o uno hipotético y con estos ejercicios darnos cuenta si el modelo está listo o requiere seguir siendo modificado

Datlas_predicciones

Hasta aqui el ejemplo de la columna.  En la práctica nuestro modelo utiliza modelos más sofisticados que los “lineales” porque, como podrán haber observado en los gráficos previos, no todas las relaciones son lineales. Pero quisimos explicarlo con regresiones porque pensamos que es la manera más fácil de ejemplificar un caso de uso.

Si te gusto el blog y crees que les puede ser de utilidad a tus colegas que analizan datos no dudes en compartirlo. También si conoces algunos otros errores adicionales a evitar recuerda dejar aqui tus comentarios. Por último recuerda seguir nuestro podcast “Café de Datos” que el día de hoy lanza capítulo con ISAAC CARRADAex IBM  hablando de analítica para impulsar ecossitemas en México.

11. Invitado Isaac - Analítica de datos para impulsar ecosistemas de desarrollo ¿Cuál es la oportunidad en México

Saludos

Equipo Datlas

-Keep it weird-

 

PropTech Capítulo 2: Big data, geo-análisis y un par de trucos más…

Apenas hacer un par de meses escribimos por primera vez acerca de este concepto tan novedoso y desconocido: PropTech. Comentamos acerca de la forma en que nació, de que trata y la disrupción que busca hacer en el sector inmobiliario. Hoy, apenas 2 meses después, queremos platicarles un poco de lo mucho que hemos aprendido, en parte, gracias al programa View Accelerator.

Hace algunos años, cuando nació DATLAS, intentamos lanzar un modulo de bienes raíces que precisamente intentaba apalancar las ventajas del big data a favor del sector inmobiliario. La idea era geo-localizar cada propiedad en venta/renta dentro de un mapa y poder dar insights acerca del entorno como, por ejemplo: a que distancia está la escuela más cercana, cual es el índice de criminalidad de la zona, etc. Todo esto para mejorar la toma de decisiones de las personas que estaban en busca de adquirir su patrimonio. Hoy en día ya existen muchos sitios que lo hacen. Pero eso era solo el comienzo…

 

El pase de diapositivas requiere JavaScript.

Otro de los grandes catalizadores que ha accionado el big data dentro del sector inmobiliario son las PropTech financieras. Si bien es cierto que las FinTech habilitaron un gran disruptor llamado crowdfunding, lo que verdaderamente está exponenciando el valor financiero dentro del ecosistema inmobiliario son estas nuevas PropTech que realizan tus evaluaciones de solicitud de crédito casi de forma inmediata. ¿Cómo? A través de cruces de grandes cantidades de información, desde tus perfiles de redes sociales, cuenta de teléfono, etc. Logrando eliminar la necesidad de avales, chequeos en buró de crédito y hasta comprobaciones de ingresos. Incluso existen startups que, con estas ventajas, han llegado a ofrecer un “seguro de rentas”, es decir, a tomar el riesgo de asegurar las rentas a aquellos arrendatarios que realicen una transacción con un arrendador que haya pasado por sus procesos de pre-calificación. Esto realmente representa una disrupción total en la cadena de valor de una industria que durante años se ha distinguido por ser intensamente burocrática y con procesos muy laboriosos.

datlas_ion_financiera_proptech2.png

De igual forma existe otra técnica que ha revolucionado la industria y en la que muchas nuevas PropTech se están enfocando: el geo-análisis. Cuando hablamos de geo-análisis debemos entender precisamente que el análisis geográfico para la industria inmobiliaria conlleva una serie de tareas desde la localización hasta la verificación de uso de suelo de los terrenos etc. Y es precisamente aquí donde muchas startups estamos tomando ventaja y, combinando las técnicas anteriormente mencionadas, hemos logrado realizar estudios de evaluación de proyectos y comenzar a estructurar algoritmos de vocación de predios.

Uno de los ejemplos más sencillos es la identificación de tendencias de urbanización para localización de nuevos desarrollos:

 

El pase de diapositivas requiere JavaScript.

Finalmente, debemos reconocer que la PropTech en México, como muchas otras mega tendencias, ha llegado con algo de rezago, pero su futuro es tan prometedor como los hipnóticos avances que se tienen alrededor del mundo. Compañías, emprendedores, gobiernos y escuelas a lo largo y ancho del continente europeo y asiático están cada día más comprometidos con apalancarse de estos avances tecnológicos para crear startups PropTech que gestionen los accesos a casas, edificios y oficinas, sin llaves; para que diseñen departamentos que optimicen completamente el uso de espacios, en donde el dormitorio y el estudio puedan coexistir dentro del mismo cuarto y ¡los mismos metros cuadrados!; portales y procesos en donde ofertar y comprar una casa sea tan fácil y rápido como comprar un par de lentes de sol en Amazon; una moneda única, solida y segura, que habilite las inversiones y transacciones de toda una industria y asegure la confianza y la agilidad de todo un ecosistema. Al igual que el big data, el machine learning y la inteligencia artificial, las PropTech es una tendencia que hace apenas unos meses creíamos una moda, una novedad pasajera; sin embargo, en DATLAS, estamos convencidos que ha llegado para quedarse y nos enorgullece ser parte de su crecimiento en México.

¿Quieres ser parte de esta tendencia? ¡Te invitamos! Súmate en nuestras redes sociales:

 

@TheDatlas

PropTech: Disrupción en el sector inmobiliario

No es un secreto que en la última década la historia de la humanidad se ha distinguido por tener como principal exponente a la tecnología. La forma en la que nuestro trabajo y nuestra vida ha evolucionado, a partir de su fusión con la tecnología, ha sido un evento sin precedentes. Sin embargo, para el sector inmobiliario y de la construcción, la adopción generalizada de nuevas tecnologías se ha retrasado, afirma un estudio de la consultora BDO denominado “2017: The Year Things Change for the Property Industry”. Y México, no es la excepción, pero hoy en día este sector ha acelerado su adopción tecnológica y está evolucionando de una forma más ágil y efectiva que muchos otros.

datlas_proptech

La PropTech (conjunción de los términos de idioma inglés: property y technology) es una mega tendencia que se originó en Reino Unido y tomó popularidad internacional durante el año 2014. Esta tendencia básicamente trata de agregar valor, a través de la tecnología, a lo largo de la cadena de valor del sector inmobiliario y de construcción. El ejemplo más claro, y mundialmente conocido, es AirBnB, la plataforma de renta de propiedades más grande del mundo y que no es dueña de ninguna propiedad. Aunque PropTech involucra, no solo la comercialización en línea de propiedades sino, una variedad de áreas como, por ejemplo:

datlas_fintech_suscribe

  • Realidad virtual para visitar propiedades
  • Soluciones de Big Data adaptadas a este nuevo concepto y obtener así una buena visión estratégica y ventajas competitivas
  • Software de gestión específica que facilita la gestión de la propiedad
  • Domótica para el monitoreo y la gestión eficiente de las instalaciones
  • Crowdfunding y plataformas de inversión colectiva
  • Internet de las cosas
  • Entre muchas más…

En México el PropTech ha tomado un enfoque distinto al del resto del mundo. A diferencia del enfoque americano del “Real Estate Tech”, el PropTech se ha concentrado más en generar valor en procesos existentes en lugar de buscar nuevas tecnologías o materiales para la construcción. Hace menos de un año, en agosto del 2017, se presentó “InCon, Real Estate Convention”, el primer foro de tecnología para el sector inmobiliario, en el que se presentó un Hackathon, donde ingenieros compitieron para desarrollar aplicaciones tecnológicas para facilitar la realización de diversas tareas y ofrecer soluciones a problemáticas reales en el tema de bienes raíces.

datlas_proptech_incon

Pero, ¿por qué se ha vuelto tan interesante la PropTech? Pues porque el potencial de mercado es muy atractivo. Según datos de Goldman Sachs, el negocio de real estate virtual a nivel global superará los $2,600 millones de dólares para 2025. Tan solo en México, en 2016, el sector de bienes raíces en internet rebasó los 82 millones de transacciones. Tan sólo las búsquedas en internet crecieron más del 67% ese año, comparado con el anterior, lo que supone un tráfico promedio mensual de más de 2 millones de usuarios. En el país, la penetración de internet supera al 58% de la población, según el Instituto Nacional de Estadística y Geografía (INEGI), lo que equivale a 70 millones de internautas aproximadamente.

datlas_fintech_suscribe

Es por ello que hoy en día muchas startups y emprendedores nos hemos sumado a esta tendencia. Asimismo, hemos visto como la iniciativa privada propone plataformas adecuadas para incentivar y colaborar en el desarrollo de soluciones PropTech. Tal es el caso de View Accelerator, un programa de aceleración corporativa auspiciado por BlueBox. En su edición 2018, BlueBox View Accelerator hizo sinergia con Grupo Tierra y Armonía, Grupo Guía y Forzac, para ofrecer el programa. Se reclutó talento de todo Latinoamérica para participar y, afortunadamente, DATLAS® pudo formar parte de los participantes. El pasado lunes 28 de mayo fue el pitch day donde tuvimos la oportunidad de conocer y compartir escenario con grandes colegas, así como presentar nuestra propuesta de solución para mejorar ciertos procesos dentro de la cadena de valor del sector inmobiliario. Fue un gusto saber que existen empresas y plataformas que apoyan a emprendedores a integrarse a esta tendencia PropTech y ayudar a agilizar su adopción y evolución.

El pase de diapositivas requiere JavaScript.

Ustedes ¿que opinan acerca de la PropTech? ¿tienes alguna idea o emprendimiento que sea parte de esta tendencia? ¡Cuéntanos en nuestras redes sociales!

@TheDatlas

datlas_fintech_suscribe

-Keep it weird-

 

Fuentes: