В начало | Статьи | Книги | Связь
С. Сивец, кандидат технических наук, заслуженный эксперт-оценщик УОО (г. Запорожье, Украина)
И. Левыкина, ведущий оценщик УОО

Статистическая модель оценки стоимости объектов недвижимости

Использование сравнительного подхода в практике оценки, в частности метода сравнения продаж, даёт наиболее объективную величину рыночной стоимости для регулярно продаваемых объектов [1]. Но этот подход приемлем для объектов недвижимости, по которым имеется достаточное количество достоверной информации о недавних сделках купли-продажи.

Для успешного применения данного метода необходимо выполнение трех основных условий:

В основном, эксперты-оценщики при подборе аналогов и внесении поправок руководствуются профессиональным опытом и интуицией, что является заведомо субъективным подходом. Привлечение для обработки и анализа данных, используемых для сопоставления, современных статистических методов позволяет преодолеть влияние субъективизма оценщика.

Целью исследования являлось выявление наиболее существенных факторов, влияющих на формирование оценочной стоимости объектов недвижимости, и получение функционального уравнения, описывающего эту зависимость.

Для решения задач, связанных с обработкой и анализом статистической информации, применяется мощный и гибкий арсенал методов математической статистики [2,3]. Эти методы позволяют выявить закономерности на фоне случайностей, делать обоснованные выводы и прогнозы, давать оценки вероятностей их выполнения или невыполнения.

Выделим основные этапы исследования:

  1. Спецификация модели (определение её структуры)
  2. Формирование входной информации
  3. Оценка параметров (коэффициентов) модели и анализ качества (адекватности) модели
  4. Апробация модели
  5. Улучшение модели (при необходимости)

Рассмотрим подробнее все перечисленные этапы на примере получения статистической модели стоимости объектов недвижимости, расположенных в подвальных, полуподвальных помещениях или на первых этажах помещений, встроенных в жилые дома.

1. Спецификация модели

На этом этапе принимается решение относительного того, какие из факторов, влияющих на стоимость, следует включать в модель, а также анализируется влияние этих факторов на результирующий показатель (увеличивают или уменьшают они стоимость; является ли эта зависимость линейной или носит более сложный характер).

При этом в процессе такого исследования можно несколько раз возвращаться к этапу спецификации модели, уточняя перечень включаемых факторов или вид функции. Когда вид функции или её составляющие не соответствуют реальным процессам, то говорят об ошибках спецификации модели. Эти ошибки могут быть трёх видов:

Непосредственный отбор факторов для включения их в модель, должен осуществляться на основе качественного анализа, исходя из целей и задач исследования. Наряду с факторами, непосредственно формирующими уровень исследуемого результативного показателя, в анализ необходимо вводить так называемые глубинные факторы, действующие опосредовано.

Введение в модель большого числа факторов вовсе не так целесообразно, как иногда кажется. Правильнее отобрать только сравнительно небольшое число основных факторов, находящихся в корреляционной связи с выбранным функциональным (результирующим) показателем. Это объясняется двумя причинами. Во-первых, чрезмерное увеличение числа факторов может не прояснить, а напротив, затушевать картину множественных связей. А во-вторых, статистические методы исследования могут быть использованы, когда на каждый оцениваемый коэффициент модели приходится не менее 4-5 выборочных данных. А объём выборки, как правило, всегда ограничен из-за недостатка информации.

Выбор факторов, включаемых в модель, прежде всего предопределяется возможностью получения исходной статистической информации.

Факторы, включаемые в модель, не должны находиться между собой в функциональной связи. Наличие таких связей носит название мультиколлинеарности. С одной стороны, мультиколлинеарность свидетельствует о том, что некоторые факторы характеризуют одну и ту же сторону изучаемого объекта, поэтому их одновременное включение в модель нецелесообразно, так как они в какой-то мере дублируют друг друга. С другой стороны, мультиколлинеарность приводит к чисто математическим проблемам в оценке коэффициентов модели, а также ведёт к неустойчивости и ненадёжности результатов решения.

Факторы, включаемые в модель, должны быть, как правило, количественно измеримы. Правда, современный математический аппарат позволяет учитывать и качественные показатели, например, такие как зона, в которой расположен объект недвижимости.

Чтобы включить качественные переменные в модель, их нужно преобразовать в бинарные. Для этого, каждому значению качественной переменной ставится в соответствие 0 или 1. Например, если объект недвижимости находится в центральной части города, то соответствующее значение переменной равно 1, в противном случае — 0. Затем эти бинарные переменные вводятся в модель, наряду с другими факторами.

Для проведения исследований нами были проанализированы данные по оценке приватизируемых объектов недвижимости за два года в одном из областных центров Украины. Из предоставленной информации были отобраны объекты, расположенные в черте города в подвальных, полуподвальных или на первых этажах помещений, встроенных в жилые дома. Данные были выписаны из паспортов-сертификатов приватизируемых объектов и дополнительно не проверялись. На этом этапе в выборку вошло 49 объектов.

В нашем случае анализировалось влияние на стоимость единицы площади (в грн.) следующих факторов:

Количественно оценить наше предположение о значимости факторов можно с помощью коэффициента корреляции. Нами были рассчитаны коэффициенты корреляции между функциональным показателем (стоимость 1 м2 внутренней площади в грн.) и всеми предложенными факторами. В результате анализа этих данных было высказано предположение, что наиболее существенно на оценочную стоимость влияют факторы, перечисленные в таблице 1.

Таблица 1. Факторы, отобранные для включения в модель
Название фактора Коэффициент
корреляции
1 Затраты на улучшения единицы площади; грн./м2 0,75
2 Принадлежность к центральной зоне 0,34
3 Средневзвешенный физический износ, % −0,61
4 Соотношение общих наружной и внутренней площадей 0,3
5 Курс грн./US$ на дату оценки 0,62
6 Доля подвальных помещений в общей площади 0,28

Но необходимо также отметить, что наличие корреляции ещё не означает наличия причинно-следственной зависимости между величинами. Корреляция может возникнуть и в том случае, когда обе величины являются следствием единой причины, не отмеченной в наблюдениях.

После того, как были выявлены наиболее существенные факторы, влияющие на стоимость рассматриваемых объектов, встал вопрос о подборе вида функциональной зависимости, т. е. виде многофакторной регрессионной модели. От правильности этого выбора зависит то, насколько построенная модель будет адекватна изучаемому явлению, т. е. будет ли она соответствовать ему при заданном уровне точности, что, в свою очередь, предопределяет практическую ценность получаемых результатов.

Запас кривых для описания статистических данных, которыми располагает математический анализ, бесконечно разнообразен. Для выбора той из них, которая наиболее адекватна не только имеющемуся эмпирическому материалу, но и истинной зависимости между изучаемым показателем и обуславливающими его факторами, исходят из соображений самого различного характера — логического, графического и статистического.

При прочих равных условиях предпочтение отдается модели, зависящей от меньшего числа параметров, т. к. для их оценки требуется меньшее количество эмпирических данных.

На практике наибольшее распространение получили линейные (1), степенные (2) и экспоненциальные (3) формы зависимости.

(1)(1)y = a0 + a1x1 + a2x2 + … + anxn,

(2)(2)y = a0x1a1x2a2 … xnan,

(3)(3)y = a0ea1x1ea2x2 … eanxn,

В нашем случае мы предполагаем, что зависимость результирующего показателя от перечисленных шести факторов носит аддитивный характер, т.е. будем находить зависимость в виде (4):

(4)(4)y = a0 + a1x1 + a2x2 + a3x3 + a4x4 + a5x5 + a6x6,

где:

y — стоимость 1 м2 внутренней площади объекта (грн.);
x1 — затраты на улучшение единицы площади (грн./м2);
x2 — принадлежность к центральной зоне;
x3 — средневзвешенный физический износ (%);
x4 — соотношение общих наружной и внутренней площадей;
x5 — курс грн./US$ на дату оценки;
x6 — доля неподвальных помещений в общей площади.

Уравнение (4) в дальнейшем будем называть моделью линейной регрессии.

2. Формирование входной информации

Отбор исходных данных для регрессионного анализа требует большой осторожности, так как от качества и количества этих данных в значительной степени зависит ценность практических результатов. Отобранная для расчётов статистическая совокупность должна быть одновременно и достаточно мощной по объёму, и достаточно однородной по своему составу. С одной стороны, надежность статистических оценок непосредственно зависит от количества данных, использованных при расчёте (например, дисперсия обратно пропорциональна объёму выборки). Но, с другой стороны, включение в расчёт дополнительных данных может нарушить однородность изучаемой совокупности, что, в свою очередь, лишает получаемые статистические показатели реального смысла. Поэтому исходный статистический материал должен тщательно проверяться на однородность состава.

На этом этапе полезно провести анализ резко выделяющихся наблюдений. Если не удаётся устранить причину существенного отклонения наблюдений от среднего, то их просто исключают из дальнейшей обработки как нетипичные. В нашем случае, после проведения такого анализа, в выборке осталось 38 объектов из 49.

3. Оценка параметров и анализ адекватности модели

Оценка параметров регрессионной модели (4) проводилась классическим методом регрессионного анализа — методом наименьших квадратов (1МНК) с помощью пакета электронных таблиц Microsoft Excel™ [4].

В результате была получена следующая модель:

(5)(5)
y =0,542x1 +24,439x2 −3,458x3 + 77,815x4 + 55,304x5 + 17,07x6
 (0,072) (9,205) (0,599) (23,206) (5,517) (12,95) 

Под уравнением регрессии указаны стандартные отклонения для соответствующих коэффициентов. Если стандартное отклонение превышает соответствующий модуль оценки параметра, то это означает смещённость полученной оценки параметра. В нашем случае, полученные оценки оказались несмещёнными.

Никакая регрессионная модель не может быть точным отражением действительности, формализация реальных зависимостей всегда связана с упрощениями. Поэтому в процессе анализа должно быть выявлено соответствие полученной модели реальной зависимости, должны быть найдены пути улучшения модели и определены возможности практической реализации достигнутых результатов.

Адекватность построенной модели можно определить, проанализировав остатки модели при помощи специальных статистических тестов. Остатки вычисляются как разница между фактическими значениями зависимой (объясняемой) переменной y и значениями этой переменной, вычисленными при помощи модели.

Чтобы проверить, имеет ли распределение остатков неслучайный характер, используется статистический тест Дербина-Уотсона [3]. Результаты проведения этого теста показали отсутствие автокорреляции в построенной регрессионной модели. А это, в свою очередь, подтвердило наши предположения о включённых в модель факторах.

Количественным показателем адекватности полученной модели может служить коэффициент детерминации R2, который показывает долю дисперсии, объясняемой данной моделью в общей дисперсии. Значения коэффициента детерминации могут находиться на отрезке [0;1]. Чем ближе значения коэффициента детерминации к 1, тем лучше построенная модель описывает реальную зависимость. Для полученной модели коэффициент детерминации равен 0,945. Мы учли также тот факт, что наличие в модели большого числа факторов может вызвать необоснованный рост коэффициента детерминации. Для устранения этого недостатка рассчитывается скорректированный коэффициент детерминации, в нашем случае он равен 0,903, что говорит о хороших показателях качества модели.

Кроме этого, нами были проверены гипотезы о статической значимости коэффициентов в уравнении регрессии (5). Все коэффициенты, кроме коэффициента при переменной x6 и свободного члена a0, оказались статически значимыми. Это означает, что переменная x6 (доля неподвальных помещений в общей площади) не оказывает существенного влияния на формирование стоимости объекта. Следовательно, можно сделать вывод, что не все эксперты учитывают факт расположения оцениваемых объектов в подвалах. Статистическая незначимость свободного коэффициента a0 означает, что его можно взять равным нулю.

Так как величина свободного коэффициента в уравнении (4) равна стоимости 1 м2 объекта недвижимости при равенстве нулю всех учитываемых в модели факторов (x1, x2, x3, x4, x5, x6), то и логично было бы предположить, что величина a0 будет нулевой.

4.  Апробация модели

Построенная модель должна пройти апробацию на реальных объектах. В случае неудовлетворительного результата проводится корректировка модели путём изменения её спецификации. Нам удалось добиться среднего отклонения модельных оценок от реальных стоимостей объектов в пределах 3%. При этом максимальные отклонения достигали 27%.

Конечным продуктом наших исследований является модель, позволяющая рассчитать стоимость объекта по его характеристикам; получать, так называемый, точечный прогноз. Причём, полученная при этом стоимость является наиболее вероятной, т.к. уменьшено влияние случайных факторов. Точность этой оценки зависит от двух факторов: достоверности и представительности базы данных и адекватности модели.

Кроме точечного, можно вычислить интервальный прогноз стоимости объекта недвижимости. Для этого рассчитывается числовой интервал, в который с определённой, достаточно высокой вероятностью, попадает истинное значение рыночной стоимости оцениваемого объекта. Имея такой интервальный прогноз, эксперт получает нижнюю и верхнюю границы стоимости. Этого, конечно, недостаточно, чтобы сделать окончательное заключение о стоимости. Но в то же время, полученные данные являются хорошим подспорьем для проверки результатов расчёта стоимости классическими методами экспертной оценки.

5. Пример использования полученной модели

Для иллюстрации того, как проводилась апробация модели, приведём пример. Требуется оценить объект недвижимости N, представляющий собой встроенное нежилое помещение, расположенное на первом этаже пятиэтажного дома, со следующими технико-экономическими характеристиками:

По указанным характеристикам рассчитываются значения регрессионных переменных x1, x2, x3, x4, x5, x6 и подставляются в уравнение (5). В результате получаем точечный прогноз стоимости 1 м2 объекта N:

ŷ = 274,35 грн.

Зная истинную стоимость оценки 1 м2 рассматриваемого объекта, которая составила y = 250,5 грн., можно определить относительную ошибку:

δ = ((y − ŷ) ÷ y) · 100 = ((250,5 − 274,35) ÷ 250,5) · 100 = −9,52%

Интервальный прогноз стоимости 1 м2 объекта N, полученный с вероятностью 0,95:

246,56 грн. ≤ y ≤ 302,15 грн.

Этот результат можно интерпретировать так: среднее значение стоимости 1 м2 объекта N в грн. с вероятностью 0,95 попадает в интервал [246,54; 302,15]. Если же в результате применения других методов оценки, оценщик получил величину стоимости, не попадающую в данный интервал, то это должно послужить ему информацией для размышления.

6. Применение модели для подбора аналогов и корректировки их стоимости

Однако предыдущие рассуждения не исчерпывают все возможности, которые открываются после получения адекватной модели. Кроме получения прогнозов, весьма перспективной также представляется возможность применения полученной регрессионной модели для подбора аналогов и расчёта поправок в методе сравнения продаж.

Например, степень близости оцениваемого объекта и предполагаемого аналога можно оценить с помощью метрики (меры близости) [5]. В качестве метрики можно выбрать различные функции. Сравним две из них.

(6)(6)(6),

(7)(7)(7),

где:

xiо — і-го фактора оцениваемого объекта;
xiа — значение і-го фактора аналога.

Очевидно, что объекты будут абсолютно аналогичны в случае выполнения равенства P1 = 0. Поэтому в качестве аналогов выбираются те объекты из рассматриваемой группы, для которых P1 принимает минимальное значение. Недостатком метрики P1 является то, что в ней не учитывается степень влияния факторов на формирование стоимости. Этот недостаток удалось устранить в предлагаемой метрике P2. Показатели степени αi и являются коэффициентами степени важности соответствующих факторов. В качестве этих коэффициентов можно взять стандартизованные коэффициенты уравнения регрессии. При этом мы руководствуемся известной в статистике интерпретацией. А именно: чем больше величина стандартизованного коэффициента αi, тем более значимым при прочих равных условиях является i-й фактор. Если по сравниваемым характеристикам оцениваемый объект и аналог не отличается, то выполняется равенство P2 = 1. Т. е. из рассматриваемой группы объектов в качестве аналогов стоит выбирать объекты, для которых величина |P2 − 1| принимает минимальное значение.

После определения аналогов по указанному выше правилу, стоимость каждого отобранного объекта корректируется умножением на соответствующую величину P2. Тем самым мы осуществляем поправки по факторам, которые анализировались в метрике (7).

(8)(8)C = Cа · P2,

где:

Cа — стоимость 1 м2 аналога в грн.;
C — стоимость 1 м2 оцениваемого объекта.

Факторы, которые являются качественными, например местоположение, не должны корректироваться указанным способом, т.к. они плохо поддаются формализации и обобщению. Расчёт поправок по качественным факторам, на наш взгляд, является прерогативой эксперта, т. к. в этом вопросе необходим индивидуальный подход, профессиональный опыт, а зачастую и просто интуиция.

Приведём пример использования предложенной методики для подбора аналогов объекта N.

Из базы данных были отобраны десять объектов, которые относятся к тому же типу, что и объект N, и располагаются с ним в одной зоне. Объекты сравнивались с объектом N по следующим характеристикам:

Для каждого из 10 отобранных объектов было рассчитано значение метрики P2. По формуле (8) были получены стоимости объекта оценки. Результаты расчётов приводятся в таблице 2.

Таблица 2. Результаты корректировки стоимостей объектов-аналогов
№ объекта Стоимость 1 м2, грн.
С
P2 Стоимость 1 м2 с учётом поправки, грн.
С
Относительная ошибка, δ
1 229,6 0,79 181,41 27,58
2 357,7 0,8 286,2 −14,25
3 196,2 1,18 231,49 7,59
4 242,7 1,01 245,16 2,13
5 243,4 1,27 309,17 −23,42
6 127,19 0,72 91,58 63,44
7 261,3 0,97 253,43 −1,17
8 233,13 1,08 251,78 −0,51
9 269,7 0,78 210,34 16,03
10 139,25 1,22 169,89 32,18

По значениям метрики P2 видно, что лучшими аналогами по анализируемым характеристикам являются объекты 4, 7 и 8.

В заключение отметим, что при наличии достаточной и достоверной базы данных, а также необходимого программного обеспечения, в целях приближённой оценки стоимостей типичных объектов недвижимости построение и использование статистических моделей ценообразования оправдано, при условии существования перечня характеристик объектов недвижимости, для которых применима модель.

Литература

  1. Дж. Фридман, Н. Ордуэй. «Анализ и оценка приносящей доход недвижимости» — М., 1995.
  2. Драйпер Н., Смит Г. «Прикладной регрессионный анализ: в 2-х книгах» — М., 1987
  3. Замков О. О., Толстопятенко А. В., Черемных Ю. Н. «Математические методы в экономике» — М., 1997
  4. Тюрин Ю. Н., Макаров А. А. «Статистический анализ данных на компьютере» / Под. ред. В.Э. Фигурнова — М.: «ИНФРА», 1998. — 528 с.
  5. «Прикладная статистика: классификация и снижение размерности». Справочное издание под ред. С. А. Айвазяна — М., 1989.
Оглавление | Следующая
В начало | Статьи | Книги | Связь

© ООО Центр «БИЗНЕСИНФОРМ», 2003-2015