Česká mediální scéna na Facebooku

Zhruba před měsícem jsem (stejně jako vloni a předloni) plný nadšení odcházel z letošní konference New Media Inspiration a v hlavě mi (stejně jako vloni a předloni) jely obrázky všech těch krásných sítí a grafů, které Josef Šlerka dokázal vyrobit na základě dat z Facebooku. Nějak. Začal jsem si proto trochu hrát s Googlem, Pythonem, Facebook Graph API a Gephi a ve snaze přijít na to, jak tyhle úžasné věci Josef vyrábí, se mi více méně omylem podařilo vyrobit obraz českého mediálního trhu na Facebooku. Jak k tomu omylu došlo, na čem je ten obraz vlastně založený a proč není zase tak úplně přesný?

Lajky z Facebook Pages

Základním stavebním kamenem výsledné sítě jsou vzájemné vztahy stránek na Facebooku. Stránka může lajkovat jiné stránky stejně tak, jako to dělá běžný uživatel, a právě na základě toho, jak se stránky vzájemně lajkují mezi sebou jsem postavil výslednou vizualizaci vztahů. Nutno podotknout, že jednoduchost tohoto přístupu je vykoupena nižší vypovídací schopností, kterou výsledná síť vztahů má. Reprezentuje totiž „jen“ názor administrátora stránky, který se rozhodnul dát nebo nedat lajk jiné stránce. Nejde tedy o žádný vox populi, ale na druhé straně názor administrátora by měl odpovídat názoru subjektu, který stránka reprezentuje.

Při mých úvodních pokusech, kdy jsem přes Facebook Graph API jednoduše zadal výchozí stránku a následně stáhl všechny její lajky a následně lajky jejich lajků atd. jsem se ale dostal k tomu, že výsledná síť byla neuvěřitelně rozvětvená a po pravdě i ne zcela smysluplná. Naivně jsem očekával, že pokud jako výchozí bod zadám stránku mediální agentury a stáhnu její lajkylajky jejich lajků atd. atd. dostanu mapu vztahů mezi českými mediálními stránkami. To, co jsem ve skutečnosti dostal byl naprostý chaos složený přibližně z poloviny ze zahraničních stránek a z další poloviny stránek absolutně nesouvisejících s čímkoliv mediálním.

Využití lokality a kategorie

Vzal jsem si z tohoto úvodního nezdaru ponaučení – dostat se ve Facebook Social Graphu od jakékoliv stránky ke stránce o koťátkách nebo Hitlerovi jde rychleji, než byste řekli „co mají proboha tyhle stránky společného“. Kromě toho jsem také upravil svůj postup a tentokrát jsem již nestahoval všechny lajkované stránky, ale jen ty, které pochází z České republiky a zároveň patří do seznamu definovaných kategorií (jak vypadá location a category ve výpisu z Facebook Social Graphu je vidět na obrázku dole). Jeho kompletní podobu uvádím na konci, ale v zásadě by měl odrážet zaměření stránky na Média/Marketing/Reklamu apod.

Ani tento krok sice úplně neeliminoval stránky „mimo obor“ a to hlavně proto, že spousta stránek, které jsem v síti naopak chtěl ponechat, mají velmi vágně definovanou kategorii jako např. business nebo company. Kvůli nim jsem tyto kategorie musel ponechat v seznamu a výsledkem bylo opět částečné rozmělnění seznamu získaných stránek. Mimochodem – možná byste nevěřili, kolik českých mediálních stránek (tedy stránek firem, které by se měly starat mimo jiné i o sociální média svých klientů) buď vůbec nemá nebo má dokonce špatně nastavenou kategorii a lokaci.

Postup

Jako vstupní bod celé sítě posloužila stránka Mindshare Prague a počet kroků, které jsem v síti udělal jsem nastavil na 3. To znamená, že jsem stáhl lajky vstupní stránky, jejich lajky, a lajky jejich lajků. Co mě po několika pokusech s různým nastavením (různé vstupní stránky, vyšší počty kroků v síti) překvapilo, je skutečnost, že výsledná síť je prakticky stejná bez ohledu na tato nastavení. Finální síť vztahů si můžete prohlédnout buď na obrázku nahoře nebo v detailní vizualizaci. V obou případech jde o výstup z Gephi, kde jsem topologii sítě vytvořil pomocí Force Atlas algoritmu a velikost uzlů odpovídá hodnotě jejich indegree parametru. Tedy toho, kolik hran do uzlu směřuje (kolik lajků má stránka od jiných stránek v síti).

Z povahy sítě vyplývá, že pokud v ní nemůžete najít nějakou vaši oblíbenou mediální stránku, je to buď kvůli tomu, že jako location nemá nastaveno Česká republika/Czech republic nebo jako category nemá nastavenu ani jednu možnost ze seznamu na konci článku, nebo ji nikdo z ostatních mediálních stránek nemá rád. Případně se ještě může v Social Graphu nacházet dále než 3 kroky od Mindshare Prague, ale na to bych příliš nesázel (viz popis mých experimentů s nastavením sítě výše).

Mediář a MediaGuru jako největší spojovatelé

Asi málokoho překvapí, že nejvíce lajků okolních stránek si vysloužily oborové weby Mediář a MediaGuru, které tak plní roli největších spojovatelů českého mediálního trhu. Za nimi potom v této roli následuje konference PIAF – Prague International Advertising Festival a coworkingový prostor Impact Hub Praha. Vy, kterým v síti chybí stránka zpravodaje Marketing & Media, vězte, že category jeho stránky je vedena jako Magazine a abych předešel dalšímu „rozpliznutí“ tematického zaměření sítě, tuto kategorii jsem do seznamu nezařadil.

Čí chleba jíš, toho stránku lajkuj

Abych snáze odhalil dílčí skupinky podobných, či vzájemně se lajkujících stránek v rámci sítě, jednotlivé uzly jsem shluknul do clusterů pomocí KM Clustering algoritmu. Příslušnost ke konkrétnímu clusteru je vyjádřena barvou uzlu a shlukovací algoritmus jsem ponechal v základním nastavení. V interaktivní vizualizaci lze jednotlivé shluky vybírat přes možnost Group selector.

Samotného mě překvapilo, jak velký smysl výsledné clustery dávaly a jak přesný obraz reality vlastně poskytly. Samozřejmě, že jde stále jen o mapu toho, jak se lajkují stránky na Facebooku, ale například z ní můžete odvodit některé vlastnické či „síťové“ vztahy na českém trhu – viz miniclustery agentur Mark/BBDO a Proximity Prague nebo Ogilvy & Mather Prague a Geometry Global Prague. Ještě patrnější je to potom v případě shluku stránek MediaGuru, OMD Czech, !Attention! Media, s.r.o., PHD Media a Concept One. Dalším příkladem toho, jak síť vztahů na Facebooku odráží reálné majetkové či „tématické“ uspořádání, je shluk stránek agentur Universal McCann Prague, Initiative Meida Prague a McCann Erickson Prgaue.

Shlukem, který má společné spíše zaměření, jsou stránky Marketingové komunikace FMK UTB ve Zlíně, KOMAG – KOMunikační AGentura FMK UTB ve Zlíně, Konference projektový management a NeonTV.cz. Celkově jsou ale tyto stránky tematicky již poměrně daleko od zbytku sítě, což ilustruje i to, že se zbytkem sítě jsou spojeny jen přes Mediář, PIAF a Loosers Prague.

Vůbec nejpočetnějším shlukem je šestnáct stránek, u kterých je již obtížnější najít jednoznačný pojící prvek. Možná je jím nakonec to, že nemají žádné jednoznačně identifikovatelné společné zaměření. Patří sem třeba již zmíněný Mediář nebo PIAF. I v rámci tohoto shluku lze rozeznat skupiny stránek, které jsou si blíže než jiné. Například Dobrý web, Internet Info, Podnikatel.cz, Lupa a H1.cz nebo Lemonade Prague, Perfect Crowd, OUTBREAK a Idealisti. Pokud by měl někdo nápad, jak tento shluk pojmenovat nebo vysvětlit, budu rád, pokud se o něj podělíte v komentářích.

K čemu to je a co s tím dál?

Ačkoliv byla výsledná síť spíše vedlejším produktem mé snahy naučit se stahovat a vizualizovat data z Facebooku, překvapilo mě, jak moc odpovídá realitě a jak snadno lze na jejím základě český mediální trh popsat a to vše jen se znalostí jedné výchozí stránky. Samozřejmě, že trpí všemi možnými neduhy spojenými s metodikou, jakou jsem zvolil a s faktem, že jde o data s Facebooku. Myslím tím třeba to, že prakticky celá skupina GroupM (coby v realitě významný hráč na mediálním poli) v síti chybí, což je zapříčiněno tím, že stránky agentur GroupM buď nejsou v odpovídajících kategoriích nebo je nikdo nemá rád. Takových příkladů nedokonalosti popsané sítě byste určitě našli více. Pokud byste narazili na stránku, která by podle vás v síti být měla a není, dejte vědět v komentářích a já si alespoň ověřím, zda je to z objektivních důvodů, nebo mi nějak unikla a je potřeba vylepšit skript pro stahování dat.

I tak si ale myslím, že by podobná vizualizace mohla být prospěšná buď pro mapování konkurenčního prostředí v určitém sektoru (který je definovaný jen prostřednictvím kategorií stránek, jež vstupují do sítě) nebo třeba pro odhalení seznamu klientů jednotlivých hráčů na trhu (opět jen pomocí úpravy definice přípustných kategorií). To, že stránky agentur lajkují stránky svých klientů se ostatně promítá i do aktuální podoby sítě (přes všechna možná nastavení kategorií) třeba u VCCP Prague a jejich spojení s ČSOB a O2.

Otázka nakonec tedy zní, zda by vás zajímala mapa třeba nějaké jiného sektoru, než zrovna médií a marketingu. Napadají mě třeba restaurace v Praze, zpravodajské servery apod. Pokud byste něco takového uvítali, nebo máte zkrátka jen nějaký názor, postřeh či doplnění k čemukoliv ve článku, budu rád, když mi to napíšete do komentářů.

Slíbený seznam kategorií, do kterého musela stránka spadat, aby byla zařazena do sítě: Local Business, Media Agency, Media/News Company, News/Media Website, Social Media Agency, Entertainment Media, Broadcasting & Media Production Company, Marketing Agency, Marketing Consultant, Advertising/Marketing, Internet Marketing Service, Digital / Online Marketing Agency, Company, Business, Education, Software, Software Company, Community Organisation, Workplace & Office, Business Service, Market Research Consultant, Consulting Agency

Napsat komentář

Vaše emailová adresa nebude zveřejněna.