Определение цен на недвижимость с использованием нейронных сетей
ФГОУ
ВПО Финансовый Университет при правительстве Российской Федерации
Кафедра
«Математическое моделирование экономических процессов»
Теоретико-практическая
работа по дисциплине «Эконометрика» на тему:
Определение
цен на недвижимость с использованием искусственных нейронных сетей
Выполнила студентка
Бакулина А.Ю.
Проверил к.т.н. Богомолов А.И.
Москва,
2010
Введение
Использование эконометрических моделей в оценке
цены на недвижимость является полезным и реалистичным подходом для покупателей
и для местных и фискальных властей. В экономической литературе появилось много
работ, пытающихся сравнить методы классических гедонических моделей и
основанных на искусственных нейронных сетях моделей, более управляемых данными.
Мы
настаиваем на использование ИНС, если имеется достаточно статистической
информации.
В последнее десятилетие Испания представляла
собой продавца на рынке недвижимости. Приобретение
жилья в собственность стало традицией, что поддерживалось фискальным
стимулированием и низкими процентными ставками, относящимися ко всей еврозоне.
Цены постепенно росли, и часть семейного дохода, уплачиваемая на ипотеку и
расходы, связанные с содержанием жилища, возрастали. Эта тенденция внезапно
подошла к концу в 2008 году, вызвав потрясения в экономике. Таким образом,
необходим объективный подход к оценке рыночных цен на собственность. Это
необходимо как для покупателей и продавцов семейных квартир и домов, так и для
инвесторов, консалтинговых агентств и финансовых институтов, фискальных властей
на муниципальном и национальном уровнях. Гедонические модели
и модели ИНС могут служить способом к решению данного вопроса, однако для того,
чтобы они приносили пользу, они должны регулярно обновляться, чтобы выявить
изменения в цене.
Цены на недвижимость изучались в течение двух
десятилетий с 50-х годов, тогда Розен предложил использовать регрессионные
модели, названные гедонистическими моделями, и применил их в городских районах.
Методы искусственных нейронных сетей начали
применяться к ценам на недвижимость в последнее десятилетие с растущим
интересом.
ИНС ввели Маккалок и Питтс (1943) в качестве
альтернативы алгоритмического программирования, разработанного Картом Лашли в
двадцатые годы. Ниже приведены некоторые исследователи, занимавшиеся изучением
ИНС.
Таблица 1
Авторы
|
Год
|
Страна
|
Борст
|
1991
|
Новая
Англия (США)
|
Тай
и Хо
|
1992
|
Сингапур
|
Ду
и Грудницкий
|
1992
|
Калифорния
|
Коллинс
и Эванс
|
1994
|
Великобритания
|
Ворзала,
Ленк и Сильва
|
1995
|
Колорадо
|
МакКлуски
|
1996
|
|
Россини
|
1997
|
Австралия
|
Хайнес
и Тан
|
1998
|
Австралия
|
Бониссон
|
1998
|
|
Сечин
|
2000
|
Бразилия
|
Каракозова
|
2000
|
Финляндия
(Хельсинки)
|
Нгуен
и Криппс
|
2001
|
Теннесси
(США)
|
Кауко
|
2003
|
|
Лимсомбунчай
|
2004
|
Новая
Зеландия
|
Лий,
Жанг и Ву
|
2006
|
|
Селим
|
2009
|
Турция
|
1. Спецификация модели
ИНС представляет собой нелинейную регрессионную
или многомерную регрессионную модель с ненаблюдаемыми переменными. Однако когда
топология и параметры сети указаны, модель ИНС сводится к обычной
статистической или эконометрической модели.
Оценка цены продажи квартиры (y)
является целью модели ИНС. Объектом нашего исследования является город средних
размеров, расположенный в Южной Испании. Внешние переменные включают внутренние
данные о жилье и самом здании, а также его местоположении. В исследуемой
области находится 130563 квартир, и более чем 75% из них - главные места
жительства, приблизительно 14% - не используемые, и меньше чем 10% - вторичные
места жительства. В 2006 г. количество квартир увеличилось до 135920. Ценовые
данные зарегистрированы национальным институтом статистики и муниципалитетом в
финансовых целях, но они не содержат данных с точной оценкой отдельных свойств.
Рыночные посредники - главный источник точных данных; основная компания, Grupo
Barin, провела 10124
сделок со следующей динамикой: в 2002 г. - 772 сделки, в 2003 г. - 1685, в 2004
г. - 1399, в 2005 г. - 3380, и в 2006 г. - 2888. Эта компания состоит из 18
офисов, рассеянных по всему городу.
В таблице 2 отражены используемые эндогенные и
экзогенные переменные. Цена сделки является реальной рыночной ценой (ни
объявленной ценой, ни ценой предложения) - таким образом избегается
двойственность реально используемых данных.
Таблица 2
Внутренние
|
Внешние
|
Базисные
|
Основные
|
Год
постройки Лифт Прачечная
|
Основные
|
Качество
|
Пол
Окна Деревянная мебель (*) Кухонная мебель (*)
|
Дополни-тельные
|
Бассейн
(*) Теннисный корт (*) Сад (*)
|
|
Изменения
|
|
|
Планировка
(*)
|
Расположение
|
Зона
|
Экономические
|
Общие
расходы Рыночная цена
|
|
|
|
|
|
|
|
(*) Переменные являются бинарными, и
используются для разработки численных индексов в диапазоне (0; 1).
Многослойный персептрон используется при
следующих входных переменных: площадь квартиры, возраст здания, расположение,
дополнительные характеристики, общие расходы и качественные характеристики.
Выходной слой включает в себя только цену сделки, и есть шесть нейронов в
скрытом слое (как показано на рисунке 1).
Рисунок 1
В таблицах 3 и 4 представлены веса и пороги
входных и скрытых нейронов слоя.
Таблица 3 Параметры: внутренний и скрытый слои
|
2,1
|
2,2
|
2,3
|
2,4
|
2,5
|
2,6
|
Порог
|
-0,8637
|
-5.3193
|
0,8587
|
1,3877
|
-0,8773
|
-2.9494
|
Район
|
1,4581
|
-2.4698
|
-3,1902
|
0.8425
|
-0,3820
|
-0.6004
|
Общие
расходы
|
3,4714
|
-1.6389
|
1,7720
|
-0.5584
|
0,6896
|
-1.0893
|
Возраст
|
-0,0090
|
-0.1852
|
0,8528
|
0.7126
|
-1,2623
|
2.4097
|
Анекс
индекс
|
2,1949
|
-1.4684
|
-0,0846
|
-0.2235
|
-2,8127
|
1.4203
|
Расположение
|
-1,1403
|
-0.7805
|
-5,0060
|
-1.5345
|
0,3433
|
-2.8736
|
Индекс
качества
|
0,3414
|
-0.7721
|
1.4205
|
-1,0161
|
-0.0384
|
Таблица 4 Параметры: внутренний и скрытый слои.
|
3,1
|
Порог
1
|
-0.9370
|
2,1
|
3.9678
|
2,2
|
-3.9225
|
2,3
|
-3.7264
|
2,4
|
1.8743
|
2,5
|
0.9303
|
2,6
|
-2.5079
|
Анализ чувствительности позволяет оценить
влияние экзогенных переменных, используя ошибки отношения (таблица 5).
Таблица 5
Анализ чувствительности
Вход
|
Коэффициент
|
Результат
|
Район
|
1,2953
|
1
|
Общие
расходы
|
1,1577
|
3
|
Возраст
|
1,0395
|
6
|
Анекс
индекс
|
1,0414
|
5
|
Расположение
|
1,2009
|
2
|
Индекс
качества
|
1,0644
|
4
|
Другие три переменные являются менее важными, но
их вывести из модели, окончательные результаты окажутся менее симпатичными.
= 86,05% и RMSE=
39540,36 €. Средняя абсолютная ошибка составляет 28551,34 €, и в относительном
выражении 13,69%. На графике 1 показаны реальные значения цены (это редко может
быть достигнуто с помощью классических гедонических моделей).
Использование аналогичной модели с данными на
2002-2005 гг., в 80% случаев, результаты аналогичны.
График 1 Приблизительные цены
Анализ чувствительности позволяет оценить
влияние входных переменных на рыночную цену. На графике 2, переменные
упорядочены по мере их относительного влияния. В каждой модели области
переменная «район» появляется в первую очередь, а затем расположение
собственности. Затем наступает третья переменная, которой может быть возраст
здания, расходы на обслуживание или показатели качества. Остальные переменные
показывают меньшее влияние.
График 2
эконометрический модель нейронный
сеть
Заключение
Метод моделей ИНС - более гибкий чем
классические эконометрические модели. Некоторые обычные проблемы, в
гедонических моделях, такой как нелинейность в чрезвычайном диапазоне цен на
рынке недвижимости, могут быть легко решены с помощью моделей ИНС, хотя
некоторые авторы критикуют данный подход, называя его методом «черного ящика».
В нашем примере с многослойным персептроном, оценочные результаты хорошо совпали
с реальной ситуацией на рынке. «Темная сторона» этой методологии - сложность
составления выборки, которую возможно преодолеть только фирмам с широким
присутствием на рынках, также они должны обладать доступом к своим внутренним
базам данных и иметь возможность использовать их информацию, чтобы обладать
точными данными о жилье.
Анализ чувствительности показывает, что
небольшое расстояние до центра города имеет большое значение в моноцентричных
городах. Варьированность цены проявляется даже на той же самой улице/здании. В
испанских забитых городах наличие гаража резко увеличивает окончательную цену.
Общие расходы связаны с услугами, предоставленными зданием, таким образом, эта
переменная коллинеарна с другими используемыми переменными, и менее значима в
сделках.
В процессе ратификации ИНС менее распространен,
хотя в гедонических моделях мультиколлинеарность является существенной
проблемой в интерпретации гедонических цен.
Список использованной
литературы
1.
Borst, R. (1991) Artificial Neural Networks: The Next Modelling/ Calibration
Technology for the Assessment Community. Property Tax Journal, IAAO, 10 (1),
pp. 69-94.
.
Caridad, J. M. y Ceular, N. (2001) Un
análisis del mercado de la vivienda a través de Sistemas de Redes
Neuronales.
Revista de Estudios de Economía Aplicada 18, pp. 67-81.
. Collins,
A. y Evans, A. (1994) Artificial Neural Networks: an application to residential
valuation in the U.K. Journal of Property Valuation and
Investment, vol. 11, nº2, pp. 195-204.
4. Do,
A. y Grudnitski, G. (1992) A Neural Network Approach to Residential Property
Appraisal The Real Estate Appraiser, Vol.58 (3), pp. 38-45.
. Gallego
Mora-Esperanza, J. (2004) La inteligencia
artificial aplicada a la valoración de inmuebles. Un ejemplo para valorar
Madrid Revista CT/Catastro nº 50, pp.51-67
. Lara
Cabeza, J. (2005) Aplicación de las redes
neuronales artificiales al campo de la valoración inmobiliaria Revista
Mapping, nº 104, pp. 64-71.
. Nguyen,
N. y Cripps, A. (2001) Predicting housing value: a comparison of multiple regression
analysis and artificial neural networks Journal of Real Estate Research, 22
(3), pp. 314-336.
. Selim,
H. (2009) Determinants of house prices in Turkey:
Hedonic regresión versus artificial neural network Expert
Systems with Applications, nº36, pp.2843-2852.