W miarę możności powinniśmy w analizie rynku i wycenie nieruchomości unikać cech ocennych i subiektywnych. Lokalizacja jest właśnie taką cechą, gdzie możemy się starać to zrobić i potraktować ją zarówno jako cechę jakościową jak i i ilościową.
Tu np. przykład analizy lokalizacji jako cechy ściśle jakościowej dla modelu wartości gruntów w Zabrzu (oraz Rudzie Śląskiej i Bytomiu, tu pominięte).
Lokalizacja jest tu po prostu opisana położeniem w określonym obrębie. Waloryzacja lokalizacji, czyli określenie która lokalizacja jest lepsza a która gorsza i jak wpływa to na wartość nieruchomości jest kwestią estymacji modelu szacowania. Sam podział jest w pełni zobiektywizowany.
Przykładem potraktowania lokalizacji jako cechy ściśle ilościowej jest poniży przykład, w którym lokalizacja została opisana jako funkcja odległości od centrum (tu od Rynku Głównego w Krakowie):
Tu też lokalizacja jest opisana parametrem czysto obiektywnym bez określania "lepszy" czy "gorszy". W tym wypadku wynikiem jest estymacja wpływu cechy, mówiąca, że dla analizowanego segmentu nieruchomości cena jednostkowa spada średnio o ok. 1/3 na każdy kilometr odległości od Rynku Głównego. Żadna "ocenność" w takim przypadku nie jest potrzebna.
Podobnie jest z innymi parametrami, zwykle opisywanymi w nieostrych i niejasnych kategoriach opisowych, które można się starać opisywać obiektywnie liczbami, jak np. kształt działki za pomocą współczynnika kształtu (Wk = 10*4*Pi*P/O^2).
Tu wynik estymacji wpływu współczynnika kształtu na wartość nieruchomości:
Znów nie musimy "oceniać" kształtu nieruchomości, wystarczy, że ją zmierzymy, wyliczymy współczynnik i zestymujemy jego wpływ na wartość nieruchomości. W tym wypadku możemy powiedzieć, że z każdym stopniem współczynnika kształtu ceny jednostkowe działek rosną o ok. 1/4.
Obiektywizowanie, czyli posługiwanie się zmiennymi nazwowymi (nominalnymi) lub parametrami liczbowymi jak wszystko ma wady i zalety. Zalety jednak, jak sądzę bardzo wyraźnie przeważają. Opisanie lokalizacji za pomocą obrębu, dzielnicy, strefy lub odległości nie jest doskonałe. Tak samo opisanie kształtu działki jedną liczbą. Co się straci na tym, to się z dużym naddatkiem zyska na obiektywizmie analizy. I na możliwościach analitycznego określenia wpływu cech. A to pozwala budować modele wartości dla określonych rynków.
Nie znaczy to, że że subiektywizm w opisie cech da się wyeliminować całkowicie. Ale należy się starać, bo naprawdę warto. Ja od jakiegoś czasu szacuję już tylko metodą analizy statystycznej rynku, w której posługuję się wyłącznie takimi zmiennymi, które są albo zmiennymi nominalnymi albo liczbowymi. Staram się pracować na maksymalnie dużych zespołach danych, z maksymalnie długich okresów (najlepiej z 7-10 lat, jak się da, to i więcej). To bywają tysiące danych. Oczywiste jest, że w tej sytuacji wprowadzenie subiektywnych opisów cech (lepsza, trochę lepsza, trochę lepsza niż średnia, lekkopółśrednia itd.) zamiast obiektywnych i dających się łatwo obliczyć, nazwać i posortować byłoby bez sensu. Ale dzięki temu uzyskuje się modele naprawdę sprawnie działające i obiektywizujące zachowanie rynku.
Powiem że aż dziw bierze jak sprawnie zachowuje się model zbudowany na kilku tysiącach zgeokodowanych i opisanych dla wystarczająco licznych klas transakcji. Zwłaszcza gdy się uwzględni odpowiednią zmienność zmiennej objaśnianej (cen) i zmiennych objaśniających (cech rynkowych). Okazuje się, że w jednym modelu można wtedy zmieścić całe continuum rynku. A wtedy szacowanie to już czysta przyjemność.




Chciałbym się odnieść do zdania "Staram się pracować na maksymalnie dużych zespołach danych, z maksymalnie długich okresów (najlepiej z 7-10 lat, jak się da, to i więcej)"
OdpowiedzUsuń na zawszeProszę o wyrozumiałość, gdyż nie znam się zbytnio na analizie statystycznej ale mam kilka wątpliwości które może uda się wyjaśnić:
czy budowanie modelu dla tak długiego okresu jest możliwe biorąc pod uwagę zmienność cech w czasie?
podam kilka przykładów
1. cecha nieruchomości która kilka lat temu była stymulantą teraz jest destymulantą. Powiedzmy że tzw. siding budynku kiedyś (np. 7 lat temu - choć to tylko przykład) był modny więc wpływał dodatnio na wartość. Dzisiaj może być uważany za obciachowy więc będzie wpływał na tą wartość obniżająco. Dana lokalizacja była uznawana za najlepszą 5 lat temu ale 3 lata temu wybudowano obok wysypisko śmieci i dziś nikt nie chce tam kupować.
2. w analizowanym okresie zmieniła się rozpiętość cechy. Jedna lokalizacja była "najlepsza" z trzech możliwych stanów, ale pojawiła się nowa dzielnica która teraz jest postrzegana jako "najlepsza" a poprzednia jest już tylko "dobra".
3. pojawia się cecha której wcześniej nie było, albo znika z rynku. Dzisiaj jeszcze mało kto patrzy na właściwości energetyczne budynku (lokalu), ale może za parę lat jak Unia wymusi (nie tylko na papierze ale w rzeczywistości) i świadomość się zmieni że przeciętny uczestnik rynku będzie zwracał na to uwagę. I teraz wyceniasz za lat 6 nieruchomość i analizujesz wpływ cechy "jakość energetyczna budynku" na cenę na próbce nieruchomościami na które do roku np. 2013 nie miało to wpływu w 2014 miało częściowy a dopiero od 2015 zaczęło być świadomie dostrzegane.
Podsumowując: czy można zbudować uczciwy model pracując na danych w których (oprócz trendu czasowego z którym umiemy sobie lepiej lub gorzej poradzić) zmieniały się też cechy, ich wagi, ilość czy atrybuty?
Pytanie brzmi raczej "czy można zbudować uczciwy model" nie robiąc tego?
OdpowiedzUsuń na zawszeOdpowiedź na Pańskie pytania jest stosunkowo prosta.
Ad 1. Cechy takie są bardzo rzadkie i raczej wysublimowane. Sam Pan nie potrafił podać nic bardziej przekonującego niż siding. Jeśli jakieś istotne cechy tego typu zauważę w analizie, to zobaczę co z tym fantem zrobić. Oczywiście wstępnie badam zmienność i korelację cech w czasie.
Kwestia wysypiska śmieci jest zupełnie innym zagadnieniem. Jeśli wybudowano wysypisko śmieci, to cecha ta "odległość od wysypiska śmieci" jest odrębną cechą. Zgeokodowanie transakcji pozwala na uwzględnienie odległości od różnych punktów, w tym od wysypisk śmieci, zjazdów z autostrad itp.
Ad 2. Jeśli pojawiły się nowe stopnie cechy jakościowej, to się po prostu uwzględnia ten stopień w analizie. Nie posługuję się w analizie cechami, które można określić nominalnie pojęciami względnymi typu "najlepsza", "lepsza", "gorsza" itd., więc problem ten w ogóle nie występuje. Posługuję się odniesieniami absolutnymi.
Ad 3. Jeśli jakiejś cechy na rynku nie było, to oczywiście wpływu jej na wartość uwzględnić nie można. Jak się pojawia, wtedy można takiej analizy dokonać. Dziś w 2011 r. nie wiem jakie cechy i jak będę postrzegane w 2015 r. I nawet nie staram się przewidywać. Wystarczająco dużo mam roboty z analizą tych cech które już oddziaływały i oddziałują na rynku.
Cieszę się, że Pan zamieścił ten komentarz, bo może i ja wreszcie od kogoś, kto zmaga się z tymi problemami da mi jakieś wskazówki jak postępować. Chętnie zapoznam się z metodami, które Pan stosuje w tym wypadu. Bo przecież jakieś musi Pan stosować. Jeśli okażą się skuteczne, z wielką radością z nich skorzystam.
Pozdrawiam i dziękuję za komentarz.
jak już pisałem wcześniej raczej nie jestem specjalistą, ale staram się czegoś nauczyć na podstawie Pańskich odpowiedzi na moje pytania zadane jako Advocatus diaboli ;)
OdpowiedzUsuń na zawszead.1
skoro siding nie przekonuje to może tak:
a co jeżeli w danym okresie czasu najbardziej poszukiwane są domy o powierzchniach np. 160-200m2 .Przychodzi kryzys, banki nie chcą dawać kredytów i teraz kupujący szukają najbardziej 110-150 albo mniejszych. Tu nie chodzi o to że mam wymyślać jaka cecha może się zmienić, tylko czy okres czasu nie jest za szeroki, bo że preferencje (oraz ich wpływ na ceny) na rynku się zmieniają w długim czasie jest raczej wysoce prawdopodobne.
Jeżeli chodzi o te wysypiska i inne to jak rozumiem w czasie geokodowania jest Pan wstanie sprawdzić i odpowiednio przypisać do konkretnej transakcji odpowiedni stan cechy w tym wypadku:
transakcja z roku 2005 ul. Słoneczna - odległość od wysypiska nieistotna (np. 2km)
transakcja z roku 2007 i pozniejsze ul. Słoneczna - wysypisko w odległości 300m.
Jeżeli robi Pan tak jak pokazuje powyżej to wymaga to nie tylko analizy przestrzennej dziś ale praktycznie takiej analizy (i to ogromnego rynku) w jakiś założonych odcinkach czasu (np. co miesiąc) czy czasem w danej lokalizacji coś się nie zmieniło. Czy rzeczywiście jest Pan w stanie dojść do takich danych sprzed 7-10 lat?. Przy tym ile trzeba cech rynkowych żeby wszystko opisać i uwzględnić?
ad. 2 co to znaczy "posługuję się odniesieniami absolutnymi"?
ad. 3.
Tutaj próbuje Pan unikać tematu. Nie wymagam przewidywania przyszłości, ale odniesienia się do cech które mogą być istotne a później zniknąć (albo nie ma ich wcale a się pojawią).
Trzymając się owego wysypiska śmieci ;)
Wyobraźmy sobie sytuację że mieliśmy jedno wysypisko poza miejscowością (i obiektywnie nie miało one żadnego wpływu na nieruchomości będące przedmiotem obrotu w 2005 roku).
W 2008 pojawia się nowe wysypisko które zaczyna wpływać na ceny transakcyjne nieruchomości których dotyczy.
I tu pojawia się mój problem bo wyliczamy wagi cech dla całego okresu, a przecież przed 2008 wagi cech rozkładały się inaczej gdyż nie było takiej cechy jak "odległość od wysypiska" która teraz zabiera nam np. 5%. My jednak analizujemy całą bazę w długim czasie i wyciągamy wnioski o cesze rynkowej z danych na które ta cecha nie mogła mieć wpływu.
pozdrawiam i dziękuję za odpowiedź
Załóżmy hipotetycznie, że nie potrafię odpowiedzieć na Pańskie pytania. Jaki sposób postępowania z zasygnalizowanymi problemami mi Pan doradzi? Ja je rozwiązać? Jak Pan je rozwiązuje?
OdpowiedzUsuń na zawszePozdrawiam i czekam na odpowiedź
Z przyjemnością czytam Pana bloga i wiele się dowiedziałem (choć pewnie nie wszystko zrozumiałem)
OdpowiedzUsuń na zawszeJednak wydaje mi się że przyjmowanie tak długich okresów czasu 7-10lat powoduje problemy.
Pierwszym jest to że preferencje nabywców w tak długim okresie czasu ulegają zmianie (i nawet ciężko jest zbadać wiarygodnie jakie były np. preferencje 6 lat temu).
Drugi problem jest związany z możliwościami poznania (a więc opisania) analizowanych nieruchomości, bo czym dawniej tym większe prawdopodobieństwo że się zmieniły one same albo ich otoczenie (więc nie wiemy jaki był ich stan w czasie zawierania transakcji)
Najprostszym z mojego punktu widzenia rozwiązaniem jest po prostu skrócenie badanego okresu do (np. 2 lat ale może być krócej, dłużej to już zależy jak daleko jesteśmy się w stanie cofnąć nie napotykając problemów wymienionych na początku). Taki zabieg prawdopodobnie zmniejszy lub wyeliminuj zmienność cech, oraz ułatwi ewentualne uwzględnienie tej zmienności przy geokodowaniu.
Jednak jest też cena: odbije się to oczywiście na ilości danych.
Ponieważ jest to Pana model i założenie żeby pracować na danych z długiego okresu, rozwiązanie musi Pan znaleźć sam, lub pokazać że się mylę.
pozdrawiam
Eeee, myślałem, że Pan na poważnie zaproponuje coś ciekawego. A tu tylko tak "amputacja".
OdpowiedzUsuń na zawszePrzecież zdaje Pan sobie sprawę, że wszystkie Pańskie zarzuty reprodukują się równie dobrze dla 2 lat jak i dla 8 lat. I ten siding i to wysypisko i te wielkości.
W efekcie proponuje Pan niewątpliwą stratę w imię bardzo wątpliwej korzyści.
Po pierwsze: podnoszone przez Pana wątpliwości są hipotetyczne. Może rzeczywiście problemy te występują a może nie. Trochę jakby amputować sobie rękę nie mając pewności, że jest gangrena. A i tak zawsze lepiej leczyć. Może to jedynie stłuczenie?
Po drugie: proszę pamiętać o pojęciu "przedziału ufności". Wartość każdego parametru, który ustalamy (taki jak średnia, wariancja, frakcja czy współczynnik równania) jest nam znany z pewną dokładnością. Wymiarem tej (nie)dokładności jest przedział ufności dla parametru. W szczegółach dla różnych parametrów przedział ufności liczy się różnie ale występuje wspólny element: przedział ufności, czyli nasz błąd jest wprost proporcjonalny do spójności danych (odchylenia standardowego) i odwrotnie proporcjonalny do kwadratu z liczby danych, na podstawie których określamy dany parametr.
I tu, jak mówią bracia Niemcy, liegt der Hund begraben.
Zmniejszają np. zakres danych z 8 lat do 2 lat ograniczamy sobie liczbę danych ok. czterokrotnie, co powoduje ok. 2-krotne (tj. pierwiastek(4)) powiększenie przedziału ufności, czyli dwukrotne powiększenie błędu określenia parametrów strukturalnych modelu. Aby skompensować ten efekt uzyskana w wyniku zastosowania tego rozwiązania spójność danych (i siła związku) musiałyby wzrosnąć też dwukrotnie. A to jest zazwyczaj absolutnie nieosiągalne! W efekcie zamiast uzyskiwać lepsze i dokładniejsze wyniki uzyskamy wyniki gorsze i mniej dokładne. Bardzo poglądowo można było to zobaczyć na REx03, gdzie badaliśmy trend dla rynków szerszych i węższych (obszarowo i funkcjonalnie). Zazwyczaj zastosowanie procedury "zawęźmy przedział zmienności" dawał efekty gorsze i mniej dokładne. Wyjątkiem były sytuacje, gdy w ewidentny sposób badania wstępne wykazywały wyraźnie, że mamy do czynienia z dwoma różnymi rynkami, które zachowują się inaczej. Ale to były przypadki sporadyczne. Jako zasada ogólna wskazówka ta się nie sprawdza.
A że w wyniku wzięcia dużej liczby danych pojawiają się problemy? Pewnie, że się pojawiają! W ogóle jak się w rzeczywistości bada rynek, to są same problemy. Idzie jednak o to, żeby ich nie leczyć lekarstwem bardziej szkodliwym niż choroba.
Na to są inne środki skuteczniejsze - badanie rozkładów, korelacji, analiza składowych głównych itp.
pozdrawiam
"Może rzeczywiście problemy te występują a może nie" jeżeli nie to oczywiście nie ma sprawy, ale dla "dobra" sprawy załóżmy że jednak występują - na ile w takiej sytuacji model jest poprawny? czy możemy po prostu te problemy zignorować bo to niewygodne dla modelu?
OdpowiedzUsuń na zawsze1. pozwolę sobie zaproponować Panu (gdyż ma Pan większą biegłość w budowaniu takich modeli a jak widać w wątku o wysokości lubi to robić) zbudowanie właśnie modelu do takiej hipotetycznej sytuacji.
a) proszę zapomnieć o trendzie czasowym
b) przyjąć okres analizy np. 2 lata
c) wymyślić prosty model z tylko jedną cechą
d) na podstawie tego modelu zbudować bazę nieruchomości odpowiednio opisanych w aspekcie tej jednej cechy rynkowej (ale tylko w okresie 1 roku)
e) teraz wymyślić bardziej skomplikowany model (z dwoma cechami - przyjąć jakieś wagowanie np. 80%,20%)
f) analogicznie jak w punkcie d) stworzyć bazę (tylko w tym drugim roku)
e) teraz proszę "zapomnieć" o wymyślonych modelach i spróbować zanalizować całą bazę jak by Pan ją widział po raz pierwszy.
Wiem że od razu pojawi się trudność w postaci "jak opisać notowania z pierwszego roku w aspekcie cechy której wtedy nie było", ale cóż (przynajmniej wie Pan że tej cechy tam nie było.
Ciekawy jestem wyników takiej analizy
2. Teraz trochę z innej strony. Proszę zdradzić w jaki sposób bada Pan jakie cechy rynkowe występują na rynku?
Moje pytanie nie dotyczy ostatecznego ustalenia że np. "jakość drogi dojazdowej" to np. 20% tylko raczej jak z szerokiego katalogu cech rynkowych które mogą przyjść do głowy typuje Pan akurat te które trafiają do ostatecznego modelu,
czy wszystkie je sprawdza pan w zbudowanym modelu? (a w związku z tym opisuje wszystkie analizowane nieruchomości w bazie wg. wszystkich tych cech)
pozdrawiam
co do propozycji modelu może to też być np. model z jedną cechą ale zmieniającą się ilością atrybutów cechy (z 3 do 5) powodującą przewartościowanie tych atrybutów dla nieruchomości w pierwszym roku,
OdpowiedzUsuń na zawszealbo od początku model z dwoma cechami ale z innymi wagami w roku pierwszym czy drugim
(usuniemy tym sposobem problem z opisem nieruchomości w aspekcie pojawiających się cech)