Kolik chtít za byt v Praze a proč

Pomocí automatizovaného skriptu se mi z webu sreality.cz podařilo stáhnout a následně strukturovat data o nabídkové ceně, velikosti, lokalitě, příslušenství a řadě dalších parametrů z více než čtyř tisíc inzerátů na prodej bytu v Praze uveřejněných v září. Ačkoliv je má odbornost, pokud jde o realitní trh, zhruba na stejné úrovni jako má znalost konstrukce raketového motoru, i tak si troufám říct, že jejich analýzou lze na otázku položenou v úvodu odpovědět.

Celou anabázi se stahováním a úpravou dat jsem podstupoval proto, že jsem si chtěl vyzkoušet zpracování kompletního “machine-learning” projektu od začátku až do konce. Jeho cílem je vytvořit model, který bude predikovat nabídkovou cenu bytu na základě jednotlivých parametrů bytu. Nezbytnou součástí každého takového modelu je úvodní fáze analýzy a popisu získaných dat, jejíž závěry jsou obsahem tohoto příspěvku. Případné další poznatky, které přinese druhá fáze – natrénování a validace modelu, budou obsahem příspěvku dalšího.

Jeden disclaimer hned na začátek – příspěvek je delší než počet deliktů na kontě Tomáše Řepky a obsahuje větší než malé množství opakujících se grafů. Text může obsahovat stopové množství informací, které jste neznali a obrovské množství informací, které nikdy nebudete potřebovat.

Nabídková vs. reálná cena

Než začneme, je potřeba uvést několik poznámek. Zaprvé, mým hlavním cílem nebylo stvořit sofistikovanou analýzu realitního trhu v Praze, ale procvičit si zpracování, analýzu a vizualizaci dat v Pythonu. Jde tedy spíše o analýzu a popis dat, která se (tak trochu shodou okolností) v tomto konkrétním případě týkají nemovitostí. I tak z ní ale vzešly závěry, o které má smysl se podělit.

Zadruhé, pokaždé když mluvím o “ceně” mám namysli nabídkovou cenu, kterou za nemovitost požaduje majitel v inzerátu. Ta je pochopitelně často nadhodnocena oproti následně dohodnuté a skutečně zaplacené kupní ceně. Proto, i když zde uvádím i některé absolutní částky, dává větší smysl zaměřit se na relativní rozdíly v cenách jednotlivých typů nemovitostí (tzn. informace, že průměrná cena bytu je např. 80 tis. Kč/m2, může být zavádějící, protože ve skutečnosti nový majitel mohl zaplatit např. jen 74 tis. Kč/m2, ale to, že byty v přízemí jsou levnější než byty nadzemní, platí tak jako tak.

Popis dat a základní úpravy

Základní datový soubor tvoří 4200 nejnovějších inzerátů z webu sreality.cz v sekci “prodej” omezené jen na území Prahy, bez inzerátů aukcí, stažených 9. září 2019. Z nich jsem následně odstranil 327 inzerátů, u nichž nebyla uvedena cena nemovitosti (většinou byla “dohodou”, nebo “k jednání” apod.) a poté ještě 142 inzerátů bytů jejichž cena přesahovala 20 mil. Kč nebo byly větší než 200 m2. Výsledkem je tedy data set se 3873 inzeráty u nichž je k dispozici 51 parametrů bytu. Samozřejmě ne všechny jsou dostupné pro všechny byty. Jejich počet jsem následně (po odstranění několika zbytečných, či většinově nevyplněných a vytvoření několika nových) zredukoval na 21 vlastností každého bytu.

1) cena a podlahová plocha

Typický pražský byt (vyjádřeno mediánem) v nabídce má rozlohu 67 m2 a stojí 5,6 milionu Kč. Rozložení cen a velikostí všech bytů je zobrazeno pomocí histogramů na prvních dvou obrázcích dole. Ten třetí zachycuje již zmíněnou závislost mezi velikostí podlahové plochy (osa x) a celkovou cenou bytu (osa y).

Ano, první zjištění je skutečně z kategorie “No shit Sherlock!” a to sice, že cena bytu závisí na jeho velikosti. Abych vyloučil vliv velikosti bytu na rozdíly v ceně mezi jednotlivými typy bytu (např. těmi s parkovací plochou a těmi bez parkovací plochy), budu dále za cenu považovat mnou dopočítanou cenu za metr čtvereční. Její střední hodnota za všechny byty je 93 260 Kč.

Price & Floor size charts
Histogramy pro cenu a velikost všech bytů a vztah mezi nimi

V dalších částech se budu věnovat tomu, jak cenu (za metr čtvereční) ovlivňují jednotlivé parametry, které se mi pro nabízené byty podařilo získat. Ve všech případech budu případné rozdíly v cenách jednotlivých typů demonstrovat pomocí následujících tří typů grafů – boxploty zachycující hlavní ukazatele ceny (odlehlé hodnoty nejsou v boxplotech zahrnuty, takže minimum a maximum z tabulky nemusí odpovídat minimu a maximu odečtenému z boxplotu), KDE ploty, které fungují jako “vyhlazený histogram” a zobrazují rozdělení cen pro jednotlivé typy bytů a nakonec jednoduchý sloupcový graf pro zobrazení střední hodnoty ceny (v tomto případě průměru) u každého typu bytu. Všechny tři často ukazují v zásadě tu samou informaci – že jeden typ bytu je dražší nebo levnější než jiný typ, takže se lze soustředit jen na poslední sloupcový graf.

2) typ konstrukce

Jak je patrné z tabulky i grafů dole, střední cena cihlových, skeletových a smíšených bytů se příliš neliší a ve všech případech se pohybuje blízko stu tisícům korun za metr čtvereční. Při bližším zkoumání sice zjistíme, že ceny skeletových bytů variují podstatně méně než další dva zmíněné typy ale skutečný rozdíl lze pozorovat až při porovnání panelových a ostatních typů bytů. Asi nikoho nepřekvapí, že panelové byty jsou v průměru výrazně levnější než ostatní typy bytů. Konkrétně se jejich cena za metr čtvereční pohybuje kolem 73 tis. Kč. Tedy asi o 27 % méně než je průměr ostatní typů bytů.

Construction type table
Základní popisné metriky ceny bytů podle typu jejich konstrukce
Construction type charts
Vizualizace rozložení a střední hodnoty ceny bytů podle typu jejich konstrukce

3) stav bytu

V průměru nejdražší jsou byty inzerované jako “po rekonstrukci”, u nichž je potřeba počítat s cenou přes 105 tis. Kč/m2. Vždy s odstupem několika jednotek tisíc korun za metr čtvereční potom následují novostavby v různých fázích rozpracovanosti – “ve výstavbě”, “novostavba”, “projekt”. Poté přichází na řadu byty ve “velmi dobrém” stavu, jejichž cena se pohybuje kolem 92 tis. Kč/m2 a ještě o dalších cca 10 tis. Kč jsou levnější byty v “dobrém” stavu a byty “před rekonstrukcí”.

Condition table
Základní popisné metriky ceny bytů podle jejich stavu
Condition charts
Vizualizace rozložení a střední hodnoty ceny bytů podle jejich stavu

4) typ vlastnictví

Mezi byty v osobním a družstevním vlastnictví lze najít, opět spíše očekávané, rozdíly. Průměrný družstevní byt je téměř o 25 % levnější než byt v osobním vlastnictví (cca 74 tis. Kč/m2 vs. 98 tis. Kč/m2). Výhody spojené s družstevními byty tedy zřejmě ani zdaleka nepřevažují nad skutečností, že takový byt není “tak úplně váš”, což se odráží na jejich ceně.

Ownership table
Základní popisné metriky ceny bytů podle typu vlastnictví
Ownership chart
Vizualizace rozložení a střední hodnoty ceny bytů podle typu vlastnictví

5) podlaží a výška budovy

Podlaží, ve kterých se jednotlivé byty nachází, jsem nejprve kategorizoval do těchto skupin – “1st- floor“, ve které jsou byty v prvním patře, přízemí a podzemích patrech, “above_gr“, kde jsou nadzemní byty a “penthouse“, kde jsou byty v posledním patře budovy. Toto proběhlo na základě předchozí analýzy cen bytů v jednotlivých patrech, která ukázala, že byty v podlažích, která jsem sloučil, se prakticky neliší. Problematický je také fakt, že ne všechny byty měly uvedenou hodnotu celkového počtu pater budovy. V těchto případech jsem chybějící informaci nahradil mediánovou hodnotou (6 pater) a poté je přiřadil do jedné ze skupin “above_gr” nebo “penthouse”.

Ani po sloučení jednotlivých podlaží do větších skupin, mezi nimi nejsou patrné větší rozdíly a podlaží, ve kterém se byt nachází, nemá na jeho cenu zásadní vliv. Celkem logicky ovšem vychází, že byty v nejnižších patrech jsou nejlevnější (v průměru 93 tis. Kč/m2 , zatímco nejdražší jsou střešní byty s cenou téměř 99 tis. Kč/m2). U nich je ale potřeba poznamenat, že ceny těchto bytů mají také největší rozptyl.

Stejně jako podlaží, ve kterém se nachází daný byt, jsem sloučil i celkové počty podlaží v budově, do které byt náleží. Dražší jsou v průměru byty, které se nachází v budovách o výšce pěti až osmi pater, následují byty v nejnižších budovách do čtyř pater a průměrně nejlevnější byt lze pořídit v budově s devíti a více podlažími.

Floor table
Základní popisné metriky ceny bytů podle podlaží
Floor chart
Vizualizace rozložení a střední hodnoty ceny bytů podle podlaží
Building floor table
Základní popisné metriky ceny bytů podle výšky budovy
Building floor chart
Vizualizace rozložení a střední hodnoty ceny bytů podle výšky budovy

6) Energetická náročnost

I v případě energetických štítků, jsem na základě předchozí analýzy byty sloučil do větší skupin a to konkrétně na ty s energetickou náročností A a B, dále na byty se štítky C, D, E nebo F a zvlášť jsem ponechal byty s náročností G. Nezdá se, že by toto kritérium mělo na cenu bytu nějaký zásadní vliv. Nejdražší byty s hodnocením AB stojí v průměru jen o cca 7 % více než “nejlevnější” byty ve skupině CDEF. Opět stojí za zmínku výrazný rozptyl cen bytů s hodnocením G. Pravděpodobně proto, že mezi ně zapadnou jak nové byty či byty ve výstavbě, jimž zatím energetický štítek udělen nebyl (a musejí tedy být označeny tím “nejhorším”), tak i byty, kterým toto označení po právu náleží. Zároveň do této skupiny patří veškeré starší byty, které energetický štítek nedodaly a musí tedy být povinně označeny jako G.

Energy table
Základní popisné metriky ceny bytů podle energetické náročnosti
Energy chart
Vizualizace rozložení a střední hodnoty ceny bytů podle energetického štítku

7) dispozice bytu

Jako trochu překvapivé se může jevit, že na cenu nemá až tak zásadní vliv ani dispozice bytu. Je ale potřeba si uvědomit, že vliv velikosti bytu (se kterou jeho dispozice úzce souvisí) jsem již eliminoval přepočtem ceny na cenu za metr čtvereční. I tak, zde ale rozdíly existují. Nejdražšími byty z hlediska dispozice jsou ty nejmenší – 1+1/kk, jejichž průměrná cena za metr čtvereční přesahuje 107 tis. Kč. Dalšími v pořadí jsou byty 2+1/kk, 4kk a větší a relativně nejlevnější jsou byty s dispozicí 3+1/kk, jejichž průměrná cena je jen těsně nad 90 tis. Kč./m2.

Disposition table
Základní popisné metriky ceny bytů podle jejich dispozice
Disposition chart
Vizualizace rozložení a střední hodnoty ceny bytů podle jejich dispozice

8) výtah v budově a bezbariérový přístup

Byty v domě s výtahem jsou celkem logicky o něco dražší, ale rozdíl je téměř minimální (jen asi 3 tis. Kč/m2). Zde je potřeba poznamenat, že toto může být částečně zkresleno faktem, že ne všechny byty měli informaci o výtahu vyplněnou. Pokud vyplněna nebyla, předpokládal jsem, že výtah v domě není dostupný.

Ještě větší cenová rovnost existuje v případě bezbariérových a “ne-bezbariérových” bytů. Zde bych popravdě čekal, že bezbariérové byty budou dražší, nicméně podle všeho tomu tak není a jejich ceny jsou prakticky shodné s těmi ostatními. Pokud informace uvedena nebyla, postupoval jsem stejně jako u výtahů a považoval jsem byt za “ne-bezbariérový”.

Elevator table
Základní popisné metriky ceny bytů s výtahem a bez výtahu
Elevator chart
Vizualizace rozložení a střední hodnoty ceny bytů s výtahem a bez výtahu
Accesibility table
Základní popisné metriky bytů s bezbariérovým přístupem a bez něj
Accessibility chart
Vizualizace rozložení a střední hodnoty ceny bytů s bezbariérovým přístupem a bez něj

9) Sklep, parkovací plocha, balkón / lodžie / terasa

Do výčtu parametrů, které na cenu bytu nemají velký vliv lze zařadit i příslušenství v podobě sklepního prostoru nebo parkovacího místa. Byty bez nich jsou v průměru levnější o cca 7 % v případě sklepu a o necelá 2 % v případě parkování.

Informace o sklepu byla vyjádřena počtem metrů čtverečních sklepního prostoru. Tu jsem zjednodušil na prosté dvě kategorie – se sklepem a bez něj. Opět platí, že pokud informace nebyla k dispozici, byt spadl do kategorie “bez sklepa / parkování”.

Informace o existenci balkónu, terasy nebo lodžie byla buď jen na té úrovni, že byt takovým příslušenstvím disponuje a nebo byla častěji vyjádřena v metrech čtverečních tohoto prostoru. Zde jsem naopak rozdělil byty do kategorií podle celkové plochy všech balkónů, teras či lodžií náležejících k bytu. Bytům, které uvedly jen to, že dané příslušenství “mají” byla přiřazena velikost 1 m2. Do kategorie “small” spadají byty s velikostí těchto prostor do 5 m2, “medium” pokrývá plochy od 6 do 10 m2, “large” představuje 11 až 50 m2 a “extra large” cokoliv většího. Samostatná kategorie “none” je tvořena byty bez balkonů, teras či lodžií.

Zajímavým zjištěním potom bylo, že byty bez těchto vnějších prostor jsou v průměru druhé nejdražší (po logicky první kategorii “extra large”), dále následují byty v kategoriích “large”, “small” a “medium”.

Basement table
Základní popisné metriky bytů se sklepním prostorem a bez něj
Basement chart
Vizualizace rozložení a střední hodnoty ceny bytů se sklepním prostorem a bez něj
Parking table
Základní popisné metriky bytů s parkovací plochou a bez ní
Parking chart
Vizualizace rozložení a střední hodnoty ceny bytů s parkovací plochou a bez ní
Outer space table
Základní popisné metriky bytů podle velikosti balkonu / lodžie / terasy
Outer space chart
Vizualizace rozložení a střední hodnoty ceny bytů podle velikosti balkonu / lodžie / terasy

10) Lokalita

Jednou z posledních vlastností každého bytu je jeho příslušnost do některé z částí Prahy. Ne u všech ji bohužel na základě uvedené adresy bylo možné identifikovat* a proto zde figuruje i možnost “Praha” (bez čísla), která označuje právě tyto byty. Poznatkem, za který by se nemusel stydět Captain Obvious jsme začali a také jím skončíme. Nejdražší byty jsou totiž… chvíle napětí… na Praze 1. Jo no, kdo by to byl řekl. Jejich průměrná cena za metr čtvereční (téměr 165 tis. Kč) tuto prominentní čtvrť výrazně odděluje od zbytku Prahy. Prakticky doslova. Ve druhé nejatraktivnější lokalitě, Praze 2, lze pořídit byt v průměru levnější o 40 tis. Kč /m2. Na druhém konci spektra se pohybují části Praha 10, Praha 9 a Praha 4, kde se cena pohybuje téměř na polovině ceny Prahy 1 (lehce přes 85 tis. Kč/m2).

Opět je fér upozornit na to, že ačkoliv je průměrná cena na Praze 1 nejvyšší, rozpětí cen bytů v této městské část je obrovské a lze v něm pořídit jak byty s cenou pod 100 tis. Kč/m2, tak ty s cenou dvojnásobnou.

District table
Základní popisné metriky bytů podle lokality
District chart
Vizualizace rozložení a střední hodnoty ceny bytů podle lokality

*pravda je ve skutečnosti taková, že jsem byl líný to udělat. Každý inzerát totiž obsahuje i informaci o ulici, kde se byt nachází a hlavně o jeho geografické poloze vyjádřené pomocí lon a lat parametrů. Na základě kterékoliv z těchto informací, by se dala příslušnost bytů do městských částí (u těch, které ji nemají explicitně uvedenou) odvodit. Snad příště.

Jestli jste dočetli až sem, nezbývá než se vám poklonit za trpělivost. Pokud máte jakýkoliv postřeh, který by bylo fajn doplnit, názor, o který byste se chtěli podělit, nebo doporučení, jak data zpracovat lépe, rád si je přečtu v komentářích. Pokud nic takového na srdci nemáte, prosté výkřiky jako “bravo”, “skvěle” nebo “ohromující” postačí.

10 thoughts on “Kolik chtít za byt v Praze a proč

  1. Bezvadný, díky za článek. Bylo by hodně zajímavé nechat toho spidera zapnutýho dýl aby byly vidět nějaké trendy…i tak paráda

    1. Díky za přečtení! Jo, určitě by dávalo smysl to po nějaké době zopakovat a podívat se na případné změny a rozdíly.

Napsat komentář

Vaše emailová adresa nebude zveřejněna.