El artículo de Francisco Guijarro trata de la valoración de inmuebles comparables por atributos comunes mediante procesos de “Machine Learning” (ML) mediante los cuales el algoritmo trabaja y aprende sobre las relaciones entre variables relevantes en la determinación del precio.
Contando con una amplísima base de datos local, compara con diferentes métricas distintos modelos, confirmando un buen rendimiento generalizado en este tipo de valoraciones, que son obligadas para la valoración de grandes carteras, como las subyacentes en las hipotecas de las entidades de crédito. De esta forma el artículo contribuye a dar confianza a esta metodología de valoración que se ve con recelo por sus características de desconocimiento del mecanismo interno de relación de datos (caja negra), y dificultad de interpretar los resultados obtenidos. Es la primera vez, en lo que conocemos, que se realiza un ejercicio de validación de modelos de valoración sobre una base de datos donde puede constatarse la capacidad evaluadora del modelo y la relevancia relativa de las variables o atributos de la vivienda, que se utilizan.
La literatura reciente sobre valoración inmobiliaria ha aportado diversas evidencias en el ámbito internacional sobre el buen desempeño de los modelos de machine learning en la predicción del comportamiento de los precios, sobre todo si se comparan con los obtenidos por los denominados métodos tradicionales valoración, muy extendidos sobre todo en la práctica profesional. Con todo, se siguen remarcando algunas limitaciones como el diseño de caja negra y la dificultad en la interpretación de los resultados proporcionados por estas técnicas. Este trabajo tiene por objeto comparar los resultados y el desempeño de diferentes modelos de machine learning aplicados en el ámbito de la valoración inmobiliaria residencial. Para ello se ha recopilado una amplia base de datos con ofertas de inmuebles en la ciudad de Madrid, que permite dividir la muestra en los grupos de entrenamiento y test. La comparación entre los modelos se ha llevado a cabo a través de diferentes métricas, entre las que destaca el MAPE (Mean Absolute Percentage Error) por ser uno de los preferidos por las sociedades de tasación. Las métricas utilizadas confirman un buen rendimiento generalizado para el conjunto de modelos entrenados, con variaciones relativamente pequeñas tras el proceso de validación.
Puede descargar el informe completo aquí
Puede leer más investigaciones aquí: