Kolik chtít za byt v Praze a proč – část druhá

V předchozím příspěvku jsem popsal rozdíl v cenách jednotlivých typů bytů v Praze a tvrdil jsem, že jde jen o úvodní analýzu v rámci většího projektu, kterým bylo vytvořit model schopný doporučit cenu bytu na základě jeho vlastností. Z něj by následně bylo možné získat informace o důležitosti jednotlivých parametrů bytu, resp. o jejich vlivu…Continue reading Kolik chtít za byt v Praze a proč – část druhá

Kolik chtít za byt v Praze a proč

Pomocí automatizovaného skriptu se mi z webu sreality.cz podařilo stáhnout a následně strukturovat data o nabídkové ceně, velikosti, lokalitě, příslušenství a řadě dalších parametrů z více než čtyř tisíc inzerátů na prodej bytu v Praze uveřejněných v září. Ačkoliv je má odbornost, pokud jde o realitní trh, zhruba na stejné úrovni jako má znalost konstrukce…Continue reading Kolik chtít za byt v Praze a proč

Jak se tweetovalo o #volby2017

Volby skončily, nadšení/zděšení částečně opadlo a všechny velké a důležité analýzy již proběhly. Což znamená, že teď je řada na ty malé a nedůležité… třeba na pohled na to, jak se o letošních volbách tweetovalo. Hned na začátek si dovolím jeden disclaimer – nečekejte žádný politologický/filosofický/sociologický/jakýkoliv-jiný-ický rozbor toho, co který tweet znamenal a jaký měl…Continue reading Jak se tweetovalo o #volby2017

Knižní historie slova “fuck” s Google Ngram Viewer

Google Ngram Viewer je další z řady, neprávem prakticky neznámých, Googlích produktů, který sice již existuje několik let, ale dosud si nezískal tolik pozornosti, kolik by si pravděpodobně zasloužil. Po zadání vámi zvolené fráze vám ukáže, jak často se tato fráze vyskytuje v knihách publikovaných od roku 1800 dále (případně i starších). Samozřejmě se tím myslí, v knihách evidovaných…Continue reading Knižní historie slova “fuck” s Google Ngram Viewer

Česká mediální scéna na Facebooku

Zhruba před měsícem jsem (stejně jako vloni a předloni) plný nadšení odcházel z letošní konference New Media Inspiration a v hlavě mi (stejně jako vloni a předloni) jely obrázky všech těch krásných sítí a grafů, které Josef Šlerka dokázal vyrobit na základě dat z Facebooku. Nějak. Začal jsem si proto trochu hrát s Googlem, Pythonem, Facebook Graph API a…Continue reading Česká mediální scéna na Facebooku

Dataporno – všechno, co jste snad ani nechtěli vědět…

Před nedávnem jsem se tu rozplýval nad týmem lidí z Facebooku, kteří pod značkou Facebook Data Science, zpracovávají kvanta dat o uživatelích a publikují o těchto analýzách skvělé články. Je ale pravda, že internet není jenom Facebook. Je to hlavně porno. Například podle žebříčku Alexa traffic rank, je Pornhub – jeden z nejznámějších pornowebů, šedesátým…Continue reading Dataporno – všechno, co jste snad ani nechtěli vědět…

Metal never dies! Nebo ne?

Google spustil další ze svých datových projektů v rámci Google research. Google Music Timeline mapuje popularitu různých hudebních žánrů v čase od roku 1950. Data pro tuto vizualizaci pochází ze služby Google Play Music a ceý projekt stojí na datu vydání alb, která mají uživatelé Google Play ve svých “sbírkách”. Z vizualizace je například jasně…Continue reading Metal never dies! Nebo ne?