Blokování reklamy nesnižuje výnosy, ani za něj nemůže retargeting

Pokud jste minulý týden četli nadpisy hlavních českých webů věnujících se médiím, určitě jste poznali, že nadpis článku je přímou reakcí na titulky, které se na nich objevily a které tvrdí pravý opak. Ano, jde zejména o články na mediaguru.cz a mediar.cz. Oba referují o klubovém večeru SPIRu na téma “blokování reklamy na internetu” a ačkoliv s texty obou autorů v zásadě souhlasím, jejich nadpisy se podle mě dopouští silného zjednodušení, které trochu odvádí pozornost od samotné podstaty problému. Ta je podle mého názoru někde trochu jinde.

Blokuješ i ty?

Problematiku blokování reklamy na internetu shrnu jen velice stručně. Už proto, že zejména ve zmíněném článku na Mediáři najdete k tomuto tématu všechny podstatné informace.

Přibližně od roku 2013 globálně roste podíl uživatelů internetu, kteří využívají nějaký způsob blokování internetové reklamy. Nejčastěji prostřednictvím plug-inu do prohlížeče typu Adblock Plus a dalších. V Česku je takových uživatelů zhruba 10 – 15 % v závislosti na tom, který výzkum berete jako směrodatný. Stejně jako u všech ostatních trendů, i tady jsou Češi ve srovnání se zbytkem světa stále ještě pozadu a patří mezi země, kde je procento uživatelů blokujících reklamu relativně nízké. I tak se ale podle interních čísel jednotlivých provozovatelů najdou weby, kde je podíl blokujících uživatelů až mezi 40 a 50 %. Jde zejména o IT weby a weby jejichž uživatelé jsou především mladší muži.

No a proč je to problém? Pokud jste uživatel, který používá Adblock nebo něco podobného, potom to pro vás vlastně problém není. Pokud jste publisher, kterého živí reklama prodaná na jeho webech, potom to problém je, protože s tvorbou obsahu pro váš web jsou spojeny určité náklady, které typicky pokrýváte příjmy z reklamy. V důsledku jejího blokování vám na webu pobíhá čím dál tím více “černých pasažérů”, kteří sice konzumují obsah, ale neplatí za něj tím, že by zároveň byli vystaveni reklamě.

Není reklama, není imprese

Odsud zřejmě plyne jedna z rozšířených iluzí spjatých s tímto tématem. A to sice, že provozovatelům webů takto vzniká jakýsi ušlý zisk, či dokonce ztráta. I v samotné diskusi v rámci SPIR večera zaznělo, že je to bullshit. Proč?

Způsob jakým blokování reklamy probíhá, je založen na tom, že uživateli se jednak nezobrazí reklamní pozice, ale zároveň se z reklamního systému ani “nevydá” imprese této reklamní pozice. V podstatě se tedy taková návštěva pro reklamní systém tváří, jako by vůbec neexistovala. V žádném případě tedy nedochází k tomu, že by za takto nezobrazenou reklamu někdo platil. Tedy v drtivé většině případů. Existují i způsoby blokování reklamy založené na tom, že reklamní pozice jen “překrývají” či “schovávají” i když se reklama jinak tváří jako zobrazená. Jejich využití je ale naštěstí minoritní záležitostí.

I kdyby ale ne, byl by problém spíše na straně klientů, kteří by v takovém případě platili za imprese, které by nikdo neviděl. To se ale neděje a žádná ztráta tím pádem nevzniká. Problém je trochu někde jinde. Skutečnost, že části návštěvníků webu se reklama nezobrazí, vede k tomu, že provozovatelům webu se de facto snižuje objem inventory, na kterém mohou realizovat své výnosy, kterými by následně pokrývali náklady. Blokování reklamy tak v žádném případě nevede k nějaké iluzorní “ztrátě peněz z trhu”, či k poklesu výnosů publisherů. Jde o to, že zatímco bez “adblocků” by jim k tomu, aby vydělali stejné peníze, stačilo méně návštěv, než kolik jich musí vygenerovat v situaci, kdy část návštěvníků reklamu blokuje. To může paradoxně vést k situaci, kde ona “poctivá” část návštěvníků bude bombardována ještě větším množstvím reklamy, což je přesně ten důvod, který uživatele žene do náruče Adblocku.

Příčinou není cílení, ale to, že ho neumíme používat

Na tomto místě přichází na řadu mé druhé, mírně nesouhlasné pokývání hlavou. Týká se důvodů, proč se vůbec blokování reklamy stalo v poslední době masovou záležitostí. Podle mě zde existují dvě hlavní příčiny. A ani jednou z nich není fakt, že by uživatelé chtěli záměrně poškozovat weby tím, že je budou navštěvovat aniž by si na nich prohlédly všechny ty krásné reklamy. Už proto, že vztah mezi financováním obsahu webu, který můžu prohlížet zdarma a reklamou, která je na webu zobrazená, málokdo z nich vůbec vnímá.

Předně jde o to, že ať se nám to líbí nebo ne, reklamy je hodně. A na internetu dvakrát tolik. Není úplně výjimkou, že na některých webech musíte samotný obsah mezi reklamou doslova hledat. Zahlcenost internetového reklamního prostoru si pravděpodobně uvědomují i zadavatelé reklamy a provozovatelé webů. Většinou ale jejich prozření vede k úvahám typu – “všude už je tolik bannerů, že si jich stejně nikdo nevnímá, pojďme vymyslet nějaký speciální formát, kterého si všichni všimnou, ideálně něco co hraje, hýbe se, nedá se to vypnout a běží to přes celou obrazovku”. Tohle jsou přesně ty momenty, během kterých se vývojáři adblocků slastně zavrtí ve svých křeslech z kostí zkrachovalých vydavatelů a připálí si stodolarovkou další doutník.

Druhou příčinou nárůstu obliby blokování reklamy je potom retargeting, resp. cílená reklama. Údajně. Logika zastánců tohoto zdůvodnění je založena na tom, že díky cílení reklamy a retargetingu si lidé začali více všímat toho, že jsou na internetu sledováni, začalo jim to více vadit, a začali hledat způsoby jak se tomu vyhnout. Na to se dá těžko něco namítat. Ten podivný Orwellovský pocit, kdy si v e-shopu prohlédnete hodinky a následující týden máte pocit, že na internetu neexistuje nic jiného než hodinky, asi zažil každý.

Spíše než v samotném retargetingu je ale podle mě problém v tom, že v drtivé většině případů (můj čistě subjektivní dojem), je použit bez většího přemýšlení a dost “na sílu”. Osobně mi vůbec nevadí, že reklama, která se mi zobrazuje, nějak pracuje s tím, co mě asi zajímá a o nákupu čeho zrovna asi přemýšlím. Vadí mi, že si někdo myslí, že pokud jsem na jeho banner nekliknul v prvních třech případech, kdy jsem ho viděl, tak že mě zlomí tím, že mi ho ukáže ještě desetkrát. Nebo, že nejmenovaný e-shop nemá problém s tím, nabízet mi hodinky, které jsem si u něj už koupil. Přemýšlím nad tím, jestli si vážně někdo řekne “hm, ty hodinky se mu asi líbily, když si je koupil, třeba by chtěl ještě jednou ty samé”, nebo jestli je prostě jen líný retargeting správně nastavit.

Pointa ale je, že i ta druhá “retargetovací” příčina je ve své podstatě stejná jako ta první. Tedy přemíra reklamy, která je tentokrát jen servírovaná trochu sofistikovanější formou. Za popularitu adblocků tak podle mě v žádném případě nemůže cílená reklama. Může za ní to, že se často naplno nevyužívá její potenciál a tak jen ještě více obtěžuje uživatele, již tak dost zahlceného reklamou necílenou.

Jak to odblokovat?

O co lehčí bylo k současnému stavu sklouznout, o to těžší bude se z něj vyhrabat. Na stole je řada řešení, která se ale spíše snaží vypořádat s následky, než aby řešila příčinu. Mezi ně patří třeba možnost rozpoutat “tech-war”, ke které se na onom SPIR večeru nepřímo přihlásil zástupce firmy NeuronAD. Ta se zabývá blokováním nástrojů, které blokují reklamu. Zní to logicky, ale má to háček. Služby jako Adblock okamžitě zareagují možností blokovat nástroje, které blokují nástroje, které blokují reklamu. Firmy jako NeuronAD budou reagovat blokováním těchto blokovacích blokátorů a z podstaty věci budou vždycky o krok pozadu.

Další variantou je buď komunikace s uživateli webu, kteří blokátory používají. Ať už “po dobrém”, jak to zkoušeli (třeba) na root.cz, kde požádali uživatele s Adblockem, zda by si ho nemohli vypnout. Nebo “po zlém”, kdy například CET21 na některých svých webech neumožňuje shlédnout vybraný typ obsahu uživatelům s Adblockem. Obě cesty jsou legitimní a obě mají určité výsledky. K mému překvapení i ta první.

Vraťte internetové reklamě její hodnotu

Pokud bychom ale chtěli skutečně odstranit příčinu, nabízí se podle mě další daleko radikálnější cesta. Vrátit internetové reklamě její “hodnotu”. Dá se to přeložit i takhle – zdražit internetovou reklamu. Zní to možná zvláštně, ale myslím si, že by to vedlo ke kýženému cíli. Tedy k situaci, kdy by vyhráli všichni na ose vydavatel – uživatel – zadavatel reklamy.

V důsledku vyšších cen za imprese by provozovatelé webu mohli omezit počet reklamních pozic, který na svých webech mají, při zachování stejné úrovně příjmů. Uživatelé by mohli na internetu v klidu fungovat, aniž by museli obsah, kvůli kterému přišli hledat pod nánosy reklamních sdělení. Tím, že by reklamních pozic bylo méně, nebyla by pozornost návštěvníka webu roztříštěná mezi tolik reklamních sdělení zároveň (což typicky vede k tomu, že nevnímá ani jedno) a byla by tu větší šance, že si z nich skutečně něco odnese. Omezil by se tím navíc tlak na vznik různých nestandardních formátů a čím dál tím agresivnějších formátů, které se snaží kompenzovat fenomén bannerové slepoty.

Pro zadavatele by tato situace byla výhodná navzdory tomu, že by reklama byla dražší. Tedy za předpokladu, že by toto zdražení bylo skutečně kompenzováno “růstem kvality” a poklesem počtu reklamních pozic na webech. Sice by jednotková cena vzrostla, celkově by ale investice konkrétního zadavatele mohly zůstat stejné a v důsledku toho, že uživatelé by v takovém prostředí věnovali reklamě více pozornosti, by zůstal minimálně zachován i její efekt. A to je přeci to, co jako zadavatel potřebuji. Ne házet na uživatele imprese lopatou, ale v ideálním případě ho příliš neobtěžovat a zároveň mu doručit své sdělení. Součástí tohoto nového nastavení by nepochybně mělo být i smysluplnější využívání cílené reklamy. Pokud bych měl o trochu větší sklon k využívání honosných pojmenování, potom bych celý tenhle proces, nazval “kultivací internetového reklamního trhu”. Al tyhle sklony nemám.

Potřebu něčeho podobné si pravděpodobně uvědomilo i IAB, které před pár dny vydalo cosi, čemu říká L.E.A.N. Ads program. Jde o sadu standardů, či spíše principů, kterých by se měli provozovatelé webů a zadavatelé reklamy řídit v zájmu zvýšení “reklamní user experience”. Zajímavější než samotné standardy (reklamy by měly být Light, Encrypted, Ad choice supported, Non-invasive) je doprovodné zamyšlení k jejich vydání, které doporučuji jako povinnou četbu všem, kdo se o tohle téma zajímají. Začíná větami “We messed up. As technologists, tasked with delivering content and services to users, we lost track of the user experience“.

Láska kvete na Facebooku I.

Není to tak dávno, co jsem v příspěvku “Facebook ví, kdy se zamilujete, rozejdete a co si potom pustíte” psal o věcech, které je o nás Facebook schopný zjistit na základě analýzy toho obrovského množství dat, které mu každou vteřinu házíme do tváře. Jak se zdá, téma lásky Facebook Data Science tým skutečně fascinuje, protože v souvislosti s nedávným svátkem zamilovaných (resp. prodejců květin, čokolády a plyšových medvědů) se rozhodl po dobu jednoho týdne každý den publikovat jednu analýzu spojenou právě s tímto tématem. Tím myslím s láskou a vztahy, ne s čokoládou nebo medvědy.

Pokud vás tedy zajímá, jak láska souvisí s náboženstvím, jaké jsou průměrné věkové rozdíly mězi páry v jednotlivých zemích, jak dlouho trvají vaše vztahy nebo to, proč mají lidé, kteří přávě prožili rozchod tendenci zaplevelovat vaši timeline desítkami příspěvků denně a příliš se to nezlepšuje do té doby, dokud si opět nenajdou vztah, máte se na co těšit.

Může si Jedi vzít budhistu?

V prvním ze série příspěvků se na to jde poměrně ze široka. Zkoumá totiž otázku zda víra, kterou vyznáváme, ovlivňuje náš výběr partnerů resp. ve kterých zemích nejvíce. Zřejmě není potřeba žádná obsáhlá analýza, aby si člověk odvodil, že je pravděpodobnější, že lidé se stejným vyznáním skončí spolu. To, do jaké míry se tak skutečně děje v jednotlivých zemích ale může částečně ukazovat na určitou míru “integrace” (či naopak separace) jednotlivých náboženských proudů v dané zemi. A nebo ne, záleží na tom, do jaké míry považujete uživatele Facebooku za reprezentativní vzorek populace dané země.

Pro mě je na tom všem fascinující především samotný fakt, že pokud byste chtěli tuto věc skutečně ověřit, budete potřebovat rozsáhlý výzkum v hodnotě (minimálně) stovek tisíc korun. Facebooku se stačí jen podívat do dat, která jsme mu dali sami a zadarmo.

Z nich potom snadno zjistí, jaká je “náboženská skladba” uživatelů v jednotlivých zemích (kolik procent se v dané zemi hlásí ke kterému náboženství). Se znalostí této informace se dá spočítat, kolik procent uživatelů by skončilo ve vztahu s uživatelem stejného vyznání v případě náhodného výběru. Tedy v podstatě za situace, kdy by tito uživatelé při výběru svého partnera na jeho vyznání vůbec nebrali ohled. Potom už není nic jednoduššího než porovnat tuto hodnotu s tím, kolik procent uživatelů v dané zemi je skutečně v nějaké formě vztahu s někým stejného vyznání.

Poměr mezi očekávaným procentem párů stejného vyznání a skutečným počtem párů stejného vyznání v jednotlivých zemích
Poměr mezi očekávaným procentem párů stejného vyznání a skutečným počtem párů stejného vyznání v jednotlivých zemích | zdroj: Facebook Data Science

Na ose y grafu je skutečný podíl vztahů mezi osobami stejného vyznání v dané zemi, na ose x potom jejich očekávaný podíl. Dohromady lze graf číst tak, že například ve Velké Británii by statisticky mělo být 21% všech vztahů tvořeno osobami se stejnou vírou. Ve skutečnosti je to ale celých 73%.

Čím blíže je daná země levému hornímu rohu grafu, tím je tato disproporce větší a tím méně tedy osoby z jednotlivých náboženských skupin udržují romantické vztahy mezi sebou. Celý graf bohužel opět deformuje skutečnost, že osa y nezačíná na nule. Fakticky to ale nic nemění.

Obecně z tohoto grafu plynou dva hlavní závěry. Ten první je, že vztahů, jejichž účastníci nejsou stejného vyznání je obecně málo, bez ohledu na zemi. Španělsko, coby země s nejvíce takovými vztahy, jich i tak má pouze 28%. Za druhé, Taiwan a Singapur jsou země, ve kterých je navzdory značné náboženské diverzitě, velmi vzácné najít pár tvořený osobami s rozdílnou vírou. Rumunsko a Portugalsko jsou potom z tohoto hlediska na opačném konci spektra. Všechny závěry plynoucí z analýzy si samozřejmě můžete přečíst v původním příspěvku od Facebook Data Science.

O kolik starší už je starý?

Další téma, kterému se analytici Faceboku věnovali, byl věkový rozdíl mezi partnery ve vztahu. Jen zběžně – v 67% vztahů je muž tím starším a to v průměru o 2,4 roky, zatímco žena jen ve 20% případů. To ale asi nejsou čísla, nad kterými by někdo udělal “wow”. Zajímavé to začíná být až když se na ně podíváte po jednotlivých segmentech. Mimochodem, to platí téměř vždycky, bez ohledu na to o jaká jde zrovna data.

Vztah mezi průměrným věkem uživatele a průměrným věkovým rozdílem mezi ním a jeho partnerem. To vše v závislosti na pohlaví partnerů ve vztahu.
Vztah mezi průměrným věkem uživatele a průměrným věkovým rozdílem mezi ním a jeho partnerem. To vše v závislosti na pohlaví partnerů ve vztahu. | zdroj: Facebook Data Science

Na grafu nahoře jsem zobrazeny pouze vztahy uživatelů z USA a jsou rozděleny do třech skupin podle pohlaví. Vztahy, které tvoří dvě ženy jsou zobrazeny modře, zeleně jsou vyneseny vztahy mezi mužem a ženou a zeleně vztahy, které tvoří dva muži. Osa x ukazuje průměrný věk uživatele, osa y potom průměrný věkový rozdíl mezi ním a jejím partnerem.

Rázem můžeme pozorovat, že ve vztazích, které tvoří osoby stejného pohlaví, je běžný věkový rozdíl o cca dva až čtyři roky vyšší než u párů rozdílného pohlaví. Fakt, že do zrhuba 24 let věkový rozdíl mezi partnery prakticky neexistuje, lze vysvětlit tím, že v tomto období se většina vztahů formuje ve škole nebo prostředí s ní související, kde je mezi osobami jen minimální věkový rozdíl. A potvrzuje se i pokud se díváme na stejný graf, jen s rozdílným dělením – tentokrát podle zemí.

Vztah mezi průměrným věkem uživatele a průměrným věkovým rozdílem mezi ním a jeho partnerem. To vše v závislosti zemi.
Vztah mezi průměrným věkem uživatele a průměrným věkovým rozdílem mezi ním a jeho partnerem. To vše v závislosti zemi. | zdroj: Facebook Data Science

Z něj je mimo jiné vidět, že ačkoliv jsou absolutní věkové rozdíly mezi partnery v různých zemích různé, jejich vývoj je více či méně podobný napříč zeměmi. Možná vás zarazí výrazně vyšší věkový rozdíl, který mezi sebou mají páry v Egyptě. Nejde ale ani tak konkrétně o Egypt, jako o arabské státy obecně. Podle Facebooku vysvětlují tento jev kulturní rozdíly mezi zeměmi a odlišný přístup k mužům a ženám v některých částech světa.

Ten lze vyjádřit například prostřednictvím Global Gender Gap. Indexu, který každoročně zveřejňuje The World Economic Forum. Ukazuje se, že čím je nižší hodnota tohoto indexu (čím větší jsou v dané zemi rozdíly mezi muži a ženami), tím vyšší je v dané zemi průměrný věkový rozdíl mezi partnery. Tyto a některé další dílčí závěry si můžete přečíst v původním postu od Facebook Data Science.

Pokračování příště

Dalším příspěvkům z Valentýnské série se pravděpodobně budu věnovat v nějakém dalším článku, ale koho by zajímaly už nyní, najde jejich kompletní seznam na stránce Facebook Data Science.

Do té doby tu mám ještě něco jiného. Jak vidíte, Facebook toho o lásce ví poměrně hodně. A poměrně často a rád své poznatky publikuje. Web WorldWideLearn si dal tu práci a posbíral nejrůznější statistiky o vztazích na Facebooku (pocházející většinou právě od Facebooku) a poskládal je do podoby následující infografiky. Ta sice pochází “až” z roku 2012, ale většina informací, které obsahuje se od té doby pravděpodobně příliš nezměnila.

Infografika
Infografika “What Does Facebook Know About Your Love Life?” | zdroj: World Wide Learn

Twitter TV rating čtvrt roku poté. A co na to Facebook?

V říjnu loňského roku výzkumná agentura Nielsen oznámila, že uzavřela partnerství s Twitterem, jehož výsledkem bylo spuštění služby Nielsen Twitter TV Ratings. Zjednodušeně řečeno jde o měření toho, jak lidé tweetují o pořadech aktuálně vysílaných v televizi. Podle Nielsenu jde o reakci hned na několik fenoménů poslední doby, o kterých je slyšet čím dál tím častěji – Social TV a Second Screen Experience.

Prakticky vzato je tato služba stále ještě bezpečně za oceánem a k nám se jen tak nedostane (už proto, že ČR je jedna z mála zemí, kde realizátorem televizního měření sledovanosti není Nielsen). Brzy ale bude spuštěna v Německu a Japonsku a tak určitě stojí za to, se podívat, o co vlastně jde, jak to vychází a jestli je to skutečně cesta, po které by se TV měření mělo v budoucnu vydat.

S mobilem k televizi

Co, že je vlastně ta Social TV a Second Screen? Předně jsou to jedny z nejužívanějších buzzwords v poslední době. To ale automaticky neznamená, že by na nich nic nebylo. Celá myšlenka se opírá o to, že diváci televize v čím dál tím větší míře zároveň se sledováním televize používají další zařízení (typicky smartphone nebo tablet). Na sociálních sítích se potom jejich prostřednictvím dělí o své postřehy k právě vysílaným seriálům či filmům. To, že je tento jev stále častější, dokazují i data z několika různých zdrojů. Zpráva, která momentálně asi nejkomplexněji popisuje současný stav této problematiky pochází od IPG Media Lab.

Míra využití dalších zařízení při sledování televize (denně) podle výzkumu Nielsen a tdg
Míra využití dalších zařízení při sledování televize (denně) podle výzkumu Nielsen a tdg | zdroj: ipglab.com

Samotný fakt, že na Facebooku chvíli nepíšete o tom, čím jste si včera k večeři namazali chleba, ale řešíte ohoz Leoše Mareše v posledním díle Česko hledá SuperStar je ale jen prvním “stádiem”. Pokud chcete být u televize vážně sociální, můžete si na svou “druhou obrazovku” nainstalovat jednu z aplikací, které vám mohou váš divácký zážitek určitým způsobem obohatit.

NextGuide vám na základě dat z vašich profilů na sociálních sítích a účtu ve službě NetFlix (další věc, kterou v ČR nemáme) doporučuje, jaké další pořady vás můžou zajímat. Tvtag vám zase umožňuje jednoduše diskutovat o pořadech, které jsou právě ve vysílání nebo se “přihlašovat” k tomu, že právě sledujete určitý pořad atp.

S rozmachem televizí připojených k internetu, se potom dostáváme ještě o krok dále, protože obdobné aplikace můžete mít nainstalované přímo v televizi a vyhledávat tak například epizody vašeho oblíbeného seriálu, o kterých přátelé nejvíce mluví na Twitteru. Případně se podívat, který film má za poslední týden nejvíce pozitivních hodnocení na imdb a rovnou si ho nechat přehrát v rámci některé Video On Demand služby. To už je ale, zvlášť na poměry České republiky, opravdu sci-fi.

Zpátky k Nielsenu a Twitteru

Společný projekt Nielsenu a Twitteru odstartoval úvodním výzkumem, který se zabýval počtem tweetů souvisejících s televizním vysíláním a počtem jejich autorů. Logická otázka, na kterou se mi nepodařilo dohledat odpověď je, co je to ten “tweet about TV”. Pokud by měl někdo informace vedoucí k jeho dopadení, budu vděčný když se o ně podělíte v komentáři.

Nicméně ze zmíněné studie podle Nielsenu vyplývá, že jen za druhý kvartál 2013 se na Twitteru objevilo 260 milionů příspěvků týkajících se televizního vysílání. Ty byly napsány 19ti miliony autory. Obě tato čísla byla ale s větším či menším úsilím doměřitelná již dříve. Nielsen Twitter TV Ratings je ale dále doplňuje o ukazatele “zásahu”. Konkrétně o unikátní uživatele, kteří byli těmito tweety zasaženi a o počet jimi vygenerovaných “impresí”.

Infografika shrnující výsledky "zaváděcího" výzkumu služby Nielsen Twitter TV Ratings
Infografika shrnující výsledky “zaváděcího” výzkumu služby Nielsen Twitter TV Ratings | zdroj: socialguide.com

Pokud jde o velikost tohoto nově zjištěného zásahu, údajně ho lze (na úrovni tweetů o jedné odvysílané epizodě určitého pořadu) vyčíslit tak, že jeden autor zasáhne svým příspěvkem cca 50 followerů. Okruh “příjemců” tweetů ale neroste přímo úměrně počtu autorů, kteří je “vysílají” a to z jednoho prostého důvodu. S rostoucím počtem autorů píšících o tom samém, roste pravděpodobnost, že budou mít společné followery. Přírůstek “nových” lidí, kteří budou zasaženi tweetem o daném pořadu se tím postupně snižuje.

Jak celou tuhle záležitost vysvětlují přímo pánové Sean Casey (zakladatel SocialGuide) a Andrew Somosi (současný CEO SocialGuide), se můžete podívat sami.

Byl dříve Tweet nebo Rating?

Ok, takže tady máme službu, která je schopná změřit, kolik lidí tweetuje o televizním pořadu během jeho vysílání a kolik lidí tyto tweety čte. To je samo o sobě skvělá věc. Otázkou ale zůstává, k čemu to vlastně je? Přiznám se, že jde o otázku, na kterou sám nemám příliš uspokojivých odpovědí. Budu proto jenom rád, pokud mi někdo s větší představivostí otevře oči a uvede příklad toho, kdo na ose zadavatel-agentura-médium by měl být odběratelem těchto čísel a proč.

Nielsen sice nenabízí tak úplně odpověď, ale přichází alespoň se studií vzešlou z dat získaných partnerstvím s Twitterem, jejíž smysl a účel je jasnější. Ta řeší problém, zda zvýšená aktivita na Twitteru může způsobit příliv diváků pořadu v TV a naopak. Tedy zda vyšší sledovanost pořadu v TV způsobuje vyšší aktivitu diváků na Twitteru. Poměrně nepřekvapivě platí obojí a stejnětak nepřekvapivě nikde nenajdete exaktně popsanou metodiku této studie. Silnější vliv má ale přeci jen TV na objem tweetů o dané epizodě pořadu. Podle Nielsenu vzrostl počet tweetů o dané epizodě v důsledku její zvýšené sledovanosti (TV ratingu) ve 44% z 221 sledovaných epizod. Působení opačným směrem, tedy nárůst sledovanosti potom, co se o epizodě začalo více tweetovat, bylo odhaleno u 19% epizod.

Procento měřených pořadů daného žánru, ve kterém tweetování způsobilo změny ve sledovanosti
Procento měřených pořadů daného žánru, ve kterém tweetování způsobilo změny ve sledovanosti | zdroj: nielsen.com

Trochu mě v souvislosti s tímto zjištěním zaráží dvě věci. Za prvé je to samotná forma výstupu. Daleko větší smysl by mi dávalo publikovat nějakou kvantifikaci toho, o kolik procentních bodů je Twitter schopný nakopnout sledovanost mého pořadu. Z toho, že se Nielsen nakonec rozhodl publikovat raději jen informaci o tom, v kolika procentech případů se tak děje, se ale asi dá částečně usuzovat, že nejde o nijak závratná čísla.

Druhá poznámka se potom týká výsledků, které vidíte o kousek výš na stránce – tweetování nejčastěji ovlivňuje sledovanost pořadů spadajících do žánru realityshow a nejméně těch z kategorie drama. To celkem dává smysl. Co už mi smysl dává méně, je z tohoto pohledu poměrně nízká hodnota u sportu. Osobně se mi zdá, že pokud vůbec mají tweety vliv na sledovanost, tak je to právě na sledovanost sportovních přenosů. Na druhou stranu pro toto tvrzení nemám žádná data, zatímco Nielsen těmi svými dokládá spíše opak.

A vítězem se stává…

Samozřejmě tou nejzajímavější věcí, která se z celého Twitter TV Ratings projektu dá ukázat, jsou skutečně naměřené výsledky jednotlivých pořadů. Ty jsou k dispozici přímo na webu Nielsenu a to ve formě dat o deseti nejúspěšnějších pořadech v aktuálním týdnu. Následuje tedy žebříček top 10 pořadů podle metriky Unique Audience (kolik uživatelů četlo tweety o nich) v období mezi 27. lednem a 2. únorem 2014 v USA.

Top 10 pořadů podle hodnoty Unique Audience v období 27.1. - 2.2.2014 v USA
Top 10 pořadů podle hodnoty Unique Audience v období 27.1. – 2.2.2014 v USA | zdroj: Twitter TV Ratings

Z tohoto hlediska byl ve zmíněném období nejúspěšnějším pořadem přímý přenos Zprávy o stavu Unie. Tweety o něm se dostaly k téměř devíti milionům uživatelů Twitteru a na svědomí je mělo cca půl milionu autorů. Zároveň jde o jeden ze dvou pořadů, které v top 10 reprezentují zástupce mimo žánr seriálů pro mladé nebo realityshow. Tím druhým je NFL Honors – tradiční předávání cen pro nejlepší hráče amerického fotbalu večer před Super Bowlem. Jen pro srovnání, počet diváků nejsledovanějších pořadů týdne v ČR (klasická sledovanost v TV) se pohybuje okolo 1,8 milionu.

Společným znakem pořadů, které v daném období vládly Twitteru je buď jejich cílová skupina, kterou většinou tvoří buď přímo teenageři (Teen Wolf, New Girl), nebo jejich celospolečenský rozměr (zmíněné State of the Union 2014, NFL Honors). Jaká je ale vazba tohoto žebříčku na sledovanost? Jsou pořady, kolem kterých se na Twitteru vytváří největší buzz ty skutečně nejsledovanější? Nielsen naštěstí zveřejňuje i deset nejúspěšnějších pořadů z hlediska klasické sledovanosti, takže je odpověď vcelku jednoduchá.

Top 10 pořadů podle hodnoty Ratingu v období 27.1. - 2.2.2014 v USA
Top 10 pořadů podle hodnoty Ratingu v období 27.1. – 2.2.2014 v USA | zdroj: Nielsen

Spíše ne. Některé z pořadů, které byly v daném týdnu nejsledovanější v televizi se sice prosadily i do žebříčku těch nejvíce tweetovaných (New Girl, American Idol), ale jde spíše o výjimky. Ono to celkem dává smysl, co byste také chtěli na sociálních sítích psát o milionté epizodě NCIS (u nás Námořní vyšetřovací služba) nebo Big Bang Theory.

Existuje ale ještě jeden možný úhel, ze kterého lze na oba žebříčky nahlížet. Již zmíněnou epizodu seriálu New Girl, která figuruje v obou top 10, vidělo v televizi 26 mil diváků. Dva a půl milionu uživatelů Twitteru bylo navíc zasaženo tweety. “Sociální efekt” byl tedy ve výši celé jedné desetiny sledovanosti, což není málo. Problém je, že skupiny diváků seriálu a příjemců tweetů se z velké části překrývají. A ještě větší problém je, že nikdo neví jak velká ta část je. Tím pádem nelze říct, zda Twitter přináší z tohoto pohledu spíše dodatečný zásah (tweety o epizodě si najdou uživatele, kteří ji neviděli v TV) nebo zvýšení frekvence zásahu (tweety čtou uživatelé, kteří již seriál viděli v TV).

Vyvodit z Twitter TV Rating nějaké závěry není vůbec jednoduché. Pokud bych se o to ale měl i tak pokusit, řekl bych, že to, jakou úroveň “sociální ozvěny” pořad vyvolá, nezávisí ani tak na tom, kolik lidí ho sleduje, ale spíše na jakou cílovou skupinu míří. Je potom jen logické, že pořady orientující se na teenagery, coby obecně nejaktivnější skupinu uživatelů na sociálních sítích, vévodí žebříčku Twitter TV Rating.

Facebook si nechce nechat ujet vlak

Twitter má z hlediska Social TV a především jejího měření nezanedbatelnou výhodu v tom, že ve srovnání s ostatními sociálními sítěmi se svou podstatou nejvíce blíží klasickému televiznímu vysílání. Naladíte si určitý program, rozumějte přihlásíte se ke svému účtu a sestavíte si svůj seznam autorů, které budete odebírat, případně vyberete hashtag, který chcete sledovat, a potom už jen více či méně pasivně sledujete lineární vysílání (stream příspěvků).

Facebook je z tohoto pohledu daleko komplexnější už jen tím, že máte k dispozici několik různých typů interakcí. Můžete o pořadu napsat vlastní status, olajkovat kamarádův status, sdílet ho, okomentovat něco na stránce pořadu atd. Možná i proto Facebook zatím nepřistoupil k nějaké pravidelné formě reportingu dat o interakcích, které vyvolává televizní vysílání ale rozhodně k tomu, i podle svých vlastních slov, směřuje.

První vlaštovkou je oznámení partnerství se SecondSync. Firmou, která se specializuje na analýzy konverzací o televizních pořadech napříč sociálními sítěmi. Ve spolupráci s ní nedávno publikovali poměrně obsáhlou studii, která shrnuje všechny podstatné poznatky o Facebooku z hlediska Social TV (metodika opět prakticky chybí).

V první části studie se ukazuje, že interakce (spojené s konkrétním pořadem) se na Facebooku odehrávají především v době vysílání tohoto pořadu, což by měly ilustrovat grafy dole. Z analýzy navíc vyplývá, že 80% z nich je realizováno prostřednictvím mobilního zařízení.

Minutový vývoj počtu interakcí na Facebooku během vysílání epizody Breaking Bad, zápasu NFL a epizody X Factor

Minutový vývoj počtu interakcí na Facebooku během vysílání epizody Breaking Bad, zápasu NFL a epizody X Factor |zdroj: SecondSync

Podle Facebooku je 60% interakcí provedeno právě v době vysílání a těmito interakcemi je myšleno převážně postování statusů. Po skončení pořadu se aktivita na Facebooku přesouvá spíše do roviny lajkování těchto statusů a diskuse pod nimi. Tento fakt dobře ilustruje následující graf, na kterém je jasně vidět, že nejdříve nastane výkyv směrem nahoru u křivky zobrazující počet postů. Následují komentáře a lajky, které se drží ještě dlouho po skončení epizody, zatímco počet postů již nijak závratně neroste. Jedinou výjimkou, kdy se jich ještě objeví větší množství, je bezprostředně po skončení epizody.

Minutový vývoj počtu jednotlivých typů interakcí během epizody seriálu The Walking Dead a následujících čtyř hodin

Minutový vývoj počtu jednotlivých typů interakcí během epizody seriálu The Walking Dead a následujících čtyř hodin | zdroj: SecondSync

Možná nejzajímavější částí studie je ta, zabývající se průběhem počtu Facebookových interakci o pořadu v závislosti na jeho žánru. Například u pořadů spadajících do kategorie drama dochází k největší aktivitě až na jeho konci případně po skončení, zatímco u filmů nebo dokumentů je engagement tažen především komentáři, které jsou ale poměrně rovnoměrně rozprostřeny po celé délce pořadu. Naopak soutěže nebo talk-show, tedy pořady jejichž děj je do značné míry nepředvídatelný negenerují závratné objemy interakcí, ale spíše se u nich objevuje náhlý výrazný jednorázový výkyv v důsledku jejich momentálního vývoje.

Typický vývoj počtu interakcí na Facebooku v čase pro pořady z jednotlivých žánrů
Typický vývoj počtu interakcí na Facebooku v čase pro pořady z jednotlivých žánrů | zdroj: SecondSync

Když jsem o něco výš mluvil o výhodě Twitteru směrem k měření Social TV efektu, potom je třeba jedním dechem dodat, že Facebook disponuje jinou neoddiskutovatelnou výhodou – množstvím dalších informací o uživatelí, kteří tento efekt generují. Podívat se například na odlišnosti v demografickém složení uživatelů, kteří interagují s konkrétní epizodou Breaking Bad nebo televizní adaptací muzikálu The Sound of Music Live je potom jen tou nejzákladnější možností.

Demografický profil uživatelů aktivních v souvislosti s epizodou seriálu Breaking Bad a adaptací muzikálu The Sound of Music Live | zdroj: SecondSync
Demografický profil uživatelů aktivních v souvislosti s epizodou seriálu Breaking Bad a adaptací muzikálu The Sound of Music Live | zdroj: SecondSync

Eh… a k čemu, že to tedy je?

Tohle je otázka za sto bodů, na kterou jsem již jednou narazil a na kterou momentálně asi neznám odpověď. Celé téma Social TV a Second Screen Experience je totiž tak trochu schizofrenní.

Na jedné straně se možnost vyčíslit přeliv klasické televizní sledovanosti do dění v dalším mediatypu jeví jako skvělá věc. Otevírá se tím spousta možností plánování integrovaných reklamních kampaní a jejich takřka real-time optimalizace. Představte si, že by televize mohly analyzovat, co na Facebooku lajkují uživatelé, kteří zrovna generují interakce okolo vysílaného pořadu a nasazovat do něj reklamy zadavatelů, které právě nejvíce vyhovují jejich vkusu?

A pojďme ještě o kus dále – uživatel si propojí svůj Facebookový účet s nějakou aplikací ve své k internetu připojené televizi. Co by potom bránilo tomu, spouštět každému individuálnímu uživateli spot, který je pro něj nejvhodnější? Takové internetově televizní RTB. Dobře, to už je asi vážně utopie, alespoň pro teď. Nemuselo by to tak ale být na pořád, stačí se podívat na letošní Super Bowlhashtag nebo další odkaz na nějakou sociální síť obsahovala více než polovina (televizních) reklamních spotů, které v jeho průběhu odběhly. Nebo na nástroj, který před půl rokem spustil TwitterTV ad targeting. Ten umožňuje cílit vaše promoted tweets přímo na uživatele, kteří byli vystaveni vaší televizní reklamě (nebo si to o nich alespoň myslí Twitter).

Takže ve zkratce, potenciál k využití fenoménu Social TV ze strany inzerentů tu je a někteří z něj těží již teď. Problém je v tom, že čím je tento potenciál větší, tím je vlastně menší. Takhle to zní zvláštně, ale je potřeba si uvědomit jednu věc, která prakticky z každé studie na toto téma a z každého uveřejněného grafu o vývoji počtu tweetů, lajků a čehokoliv dalšího v průběhu vysílání pořadu, přímo kape.

Největší objem této aktivity uživatelé generují po dobu reklamních breaků. Volně přeloženo, v době, kdy se v pořadu něco děje jej sledují a ve chvíli, kdy začne reklama, přechází na onen slavný Second Screen a tam se o dosavadní děj dělí s přáteli, followery a ostatními. A to určitě není věc, kterou by zadavatelé chtěli slyšet.

Twitter se sice snaží dokázat, že tento problém prakticky neexistuje a tak ve spojení s Nielsenem dokonce spočítal, že 70% tweetů je průměrně publikováno během vysílacího času samotného pořadu a zbylých 30% v reklamním čase. Pokud připustíme, že přibližně ten samý poměr je mezi časem, po který běží samotný pořad a časem, který v něm zabírá reklama, můžeme říct, že uživatelé tweetují rovnoměrně v průběhu celého pořadu, a o reklamních pauzách nejsou žádné rozdíly. To ostatně tvrdí i sám Twitter v následující infografice shrnující poznatky o této problematice.

Infografika shrnující poznatky týkající se tweetování v reklamním čase a v čase vysílání samotného pořadu
Infografika shrnující poznatky týkající se tweetování v reklamním čase a v čase vysílání samotného pořadu | zdroj: Nielsen

Argumentace Twitteru má ale podle mě dvě slabiny. Za prvé, to že uživatelé v reklamních pauzách netweetují více než jindy během pořadu nemusí být žádná výhra. Ono úplně stačí, aby tweetovali stejně a i tak to jejich pozornost odvádí jinam. Za druhé, zveřejněná čísla pracují s počtem publikovaných tweetů a ne s tím, jak je uživatelé následně konzumují.

Napsat během pořadu tweet je otázka dvaceti vteřin. Projít si, co se na Twitteru píše o pořadu, který právě sleduji, je záležitost na podstatně delší dobu, vyžadující podstatně větší stupeň soustředění a uživatelé si ji spíše nechají až na pauzu v podobě reklamního breaku.

Právě popsaný paradox Social TV si podle mě zatím uvědomuje relativně málo lidí a stále převládá původní nadšení z myšlenky, jak se budou kampaně v TV a na sociálních sítích doplňovat. Pro Social TV je to zatím vlastně dobře, ale až úvodní nadšení opadne, bude už muset mít v ruce argumenty pro to, aby svůj význam opodstatnila. Pokud máte vy již teď v ruce argumenty proti tomuto mému tvrzení, budu rád, když se o ně podělíte ve svém komentáři ke článku.

Vymře dříve Facebook nebo američtí vědci?

Když článek začíná slovy “Američtí vědci zjistitili, že…“, obvykle je to signál toho, že bude následovat spíše nějaká populárně-naučná kuriozita než seriózní závěr. Této zásady se bohužel minulý týden nedržela mnohá česká a často ani světová média, když na titulních stranách se smrtelnou vážností prorokovala faktický konec Facebooku do roku 2017. Následující komiks poměrně přesně ilustruje, co se vlastně stalo a článek pod ním se pokouší vysvětlit proč.

The Science News Cycle
The Science News Cycle | zdroj: PhD Comics

To vše na základě článku dvou doktorandů z Princetonu, který (což už v pozdějších mutacích původní zprávy chybělo úplně) ještě ani neprošel recenzním řízením. Facebook si ale nedal nic líbit a vzkázal na Princeton, že podle jejich výzkumu a dat tato univerzita zcela vymizí z mapy vysokých škol do roku 2021.

Tento v podstatě marginální spor v sobě skrývá hned několik otázek. Tou, která se prvoplánově nabízí je, zda má Facebook skutečně problém a to i vzhledem k dalším zprávám, které nedávno proběhly internetem a které tvrdí, že největší sociální síť dneška čelí masivnímu odlivu nejmladší skupiny uživatelů. Nad tím vším se ovšem vznáší širší téma důvěryhodnosti dat vytržených z kontextu a jejich věrohodnosti v případě, že jsou účelově vybrána s cílem podpořit určitý závěr a ne naopak – činit závěry na jejich základě.

Facebook jako virus a data z Google Trends

Pro ty z vás, kterým by se nechtělo původní článek číst, na začátek jen shrnu, jak John Cannarella a Joshua A. Spechler ke svým závěrům dospěli. Předem upozorňuji, že i já se zde dopustím několika zkratek a zjednodušení.

V centru celé myšlenky stojí tzv. SIR model, který se běžně využívá pro modelování šíření epidmiologických nákaz a který pracuje se třemi základními ukazateli. Množinou osob, které se danou nemocí mohou potenciálně nakazit (Susceptible), množinou, která je již nakažená a šíří virus dál mezi zatím zdravé jedince (Infected) a konečně množinou, která se vůči nemoci stala imunní nebo na její následky zemřela (Removed). V zásadě jde tedy o systémově dynamický model, kde systém (populace) na základě nastavení několika parametrů hledá rovnovánu mezi třemi popsanými “zásobami” jednotek (osob). Jeho fungování při různém nastavení parametrů si můžete vyzkoušet třeba na stránce RunTheModel a to dokonce jak v system-dynamic, tak v agent-based verzi.

Stock and Flow diagram SIR modelu
Stock and Flow diagram SIR modelu | zdroj: iseesystems.com

Celé téma šíření epidemií v populaci je poměrně vzdálené problematice sociální sítích jen do chvíle, než si uvědomíte některé analogie. Na začátku existuje početná skupina osob, které na dané síti nejsou, ta se postupně začne přelévat do skupiny “nakažených” (uživatelů dané sítě) a následně o síť ztrácí zájem a putují do skupiny “Removed”. Drobným rozdílem je jen definice pojmu Removed. Jak píší sami autoři, v důsledku používání sociálních sítí lidé sice neumírají (tedy většinou ne – to autoři nepíší), ale buď ji zcela opouští, nebo o ní ztrácí zájem (dále se na ni nepřihlašují). V důsledku této odlišnosti také provedli z mého pohledu poměrně spornou úpravu modelu, kterou ale můžeme ignorovat.

Až po tuto část by se námitky hledaly jen těžko. Jejich hledání ale svým dalším postupem usnadnila sama dvojice doktorandů z Princetonu. Jejich další postup se dá stručně popsat tak, že vzali data o hledanosti MySpace (sociální sítě považované za předchůdce Facebooku a dnes již zcela mrtvé) z Google Trends (o tom kolik srandy si s tímhle nástrojem můžete užít, jsem psal v Náboženství vs. Čokoláda) a použili je pro nastavení dynamiky modelu. Prostě reálnými daty o hledanosti proložili tu červenou čáru.

Normalizovaný objem vyhledávání termínu "MySpace" na Google Trends proložený SIR modelem
Normalizovaný objem vyhledávání termínu “MySpace” na Google Trends proložený SIR modelem | zdroj: Epidemiological Modeling of Online Social Network Dynamics

Se znalostí určených parametrů následně model nakrmili dosavadní hledaností slova “Facebook” a nechali jej spočítat budoucí vývoj. Prostě ten samý tvar červené čáry přenesli na data Facebooku a podívali se, ve kterém roce (na ose x) se čára dostane na nulu.

Normalizovaný objem vyhledávání termínu "Facebook" na Google Trends extrapolovaný pomocí SIR modelu
Normalizovaný objem vyhledávání termínu “Facebook” na Google Trends extrapolovaný pomocí SIR modelu | zdroj: Epidemiological Modeling of Online Social Network Dynamics

Výsledek jste si potom koncem týdne mohli přečíst prakticky na každém, alespoň okrajově se internetem zabývajícím médiu – Facebook končí kolem roku 2017.

A proč tedy ten humbuk?

Máme tady článek, který pracuje s daty, je v angličtině, z Princetonu, se spoustou cizích slov a používá se v něm nějaký model. Sounds good, tak v čem je háček? Ve skutečnosti je jich hned několik a bude jednodušší rozdělit je na dvě skupiny háčků. První z nich pokrývá několik věcných připomínek, druhá potom otevírá otázku práce s daty obecně.

Když to vezmeme od začátku, tak je třeba se ptát, zda jsou data z Google Trends skutečně vhodným ukazatelem obliby těchto sítí a ekvivalentem schopným vyjádřit míru účasti populace na nich. Jedna z logických námitek proti tomuto tvrzení zní, že čím více má daná síť pravidelných uživatelů, tím méně by ji měli hledat přes Google. Pokud mám na Facebooku účet, půjdu přeci rovnou na facebook.com. Pravdou ale je, že toto příliš neplatí, stačí se podívat na nejvyhledávanější slova v Google v ČR (ne, že by ČR bylo měřítko, ale pro názornost to stačí).

Druhá věc, která stojí mimo pozornost původního článku je maličkost, které jsme si zvykli říkat mobilní internet. Podle zprávy Facebooku za Q3 2013 je na této síti již téměř 900 mil. uživatelů, kteří na ni pravidelně přistupují z mobilních zařízení. S tím jak se liší chování uživatelů s přístupem přes mobil a klasické pc obecně, se také liší jejich vyhledávací zvyklosti. Mobilní uživatelé pravděpodobně Facebook využívají spíše přes aplikace, ať už externí nebo integrované v jejich mobilních OS. A zatímco objem vyhledávání Facebooku na Google Trends od roku 2012 mírně klesá (což je v podstatě základem pro závěr učiněný v původním článku), jeho reálné využívání může vesele růst.

Druhá věc, která je vcelku na vodě je potom samotné srovnání s MySpace. Za prvé, o MySpace a Facebooku nejde uvažovat odděleně ve smyslu – hledanost MySpace se vyvíjela takhle a Facebooku se zatím vyvíjí takhle. Jsou to spojené nádoby. MySpace nezanikl nijak spontánně, sám od sebe. Facebook ho prostě zabil, i když ve chvíli, kdy přišla smrtící rána už měl MySpace sám problémů až až. V podstatě tak došlo k tomu, že z MySpace se nikdo “nevyléčil”, jen se nakazil dokonalejší “mutací” – Facebookem. To ostatně dokladují i oblíbené objemy hledanosti těchto dvou sítí z Google Trends.

Když zmizíme my, tak Princeton taky!

Druhou skupinu námitek, které bych k draftu článku z Princetonu měl, za mě daleko lépe a zábavněji než bych to kdy dovedl já, shrnul Facebook sám. Ten totiž toto popíchnutí nenechal stranou své pozornosti a zavelel do protiútoku prostřednictvím jednoho ze svých “data guys” – Mike Develina.  Ten ve svém příspěvku na Facebooku ukázal, že pokud na to máte žaludek, najdete data, která vám podloží prakticky jakoukoliv hypotézu. V duchu stejné logiky, která byla aplikována na predikci ohledně Facebooku se podíval, zda existuje závislost mezi objemem vyhledávání termínu “Princeton” a počtem přihlášek na tuto univerzitu. A zjistil, že existuje. Tedy spíše “existuje” – koeficient shody modelu s daty 0,5 není v tomto konkrétním případě žádná hitparáda.

Korelace mezi objemem vyhledávání termínu "Princeton" z Google Trends a počtem přihlášek na tuto univerzitu
Korelace mezi objemem vyhledávání termínu “Princeton” z Google Trends a počtem přihlášek na tuto univerzitu | zdroj: Mike Develin

Následně zjistil, jak se vyvíjí hledanost Princetonu v Google Trends za poslední roky a dal si dvě a dvě dohromady – počet přihlášek na Princeton je tím nižší, čím nižš je hledanost termínu “Princeton”. A hledanost klesá. Následuje extrapolace časové řady a závěr, že Princeton je odsouzen k zániku nejdéle v roce 2021.
Ale s tím, že na Princetonu nebudou žádní studenti se Facebook nespokojil a na datech z Google Scholar se podíval na počty publikací této univerzity v poslední letech. Následoval obdobný scénář – od roku 2009 počty publikovaných článků klesají – prodloužení časové řady – závěr. Tímto tempem nebudou žádné publikované výsledky z Princetonu již kolem roku 2020.

Trend vývoje počtu publikací Princetonu na Google Scholar
Trend vývoje počtu publikací Princetonu na Google Scholar | zdroj: Mike Develin

Další závěry, včetně těch, že Princeton pravděpodobně brzy zmizí i z Facebooku a že do roku 2060 zřejmě zmizí vzduch ze země (!) si spolu s komentářem k výše uveřejněným grafům můžete přečíst v původním příspěvku na Facebooku.

Takže kdo tedy vymře a kdy to bude?

Jedno je (podle mě) jisté, v dohledné době se nechystá zmizet ani Facebook, ani Princeton. A nakonec ani vzduch na zemi. Bylo by ale chybou celou studii odsoudit a nic si z ní nevzít. Zvlášť v kontextu některých dalších čísel, která se o Facebooku poslední dobou objevují. Ta naznačují, že ačkoliv odliv uživatelů v rozsahu, který naznačují doktorandi z Princetonu, sice nehrozí,  i tak čelí Facebook vážné generační hrozbě, kterou by neměl přehlížet, pokud nechce přehodit výhybku směrem MySpace.

Na grafu od statista.com, který zachycuje změny ve věkovém složení uživatelů Facebooku (podle jeho vlastní Social Ads Platform) je jasně vidět úbytek v nejmladších kategoriích 13-17 a 18-24. Opět je ale třeba zasadit tato čísla do širšího kontextu a jedním dechem uvést, že období ve kerém ke změně došlo zahrnuje tři roky (2011-2014) a uživatelé se tedy z těchto věkových kategorií přesunuli do těch starších. I tak je to ale problém, protože ačkoliv celkově Facebooku uživatelé neubývají, tak stárnou.

Změna věkové skladby uživatelů Facebooku v letech 2011 a 2014
Změna věkové skladby uživatelů Facebooku v letech 2011 a 2014 | zdroj: statista.com

Podobný vývoj potvrzují i další výstupy, jako např. ten od istrategylabs.com. V případě, že se týmu kolem Marka Zuckerberga nepodaří tento trend včas zastavit, mohla by studie, která celou diskusi rozpoutala, náhle nabýt na aktuálnosti, protože je to právě nejmladší skupina uživatelů, která v případě sociálních sítí reprezentuje tzv. early-adopters.

Ve skutečnosti potom teenageři nemusí z Facebooku ani odcházet (jak nesprávně naznačuje titulek grafu ze statista.com). Úplně postačí, když si “noví, dorůstající teenageři” budou stále častěji vybírat jinou komunikační platformu než je Facebook a začnou tuto nákazu šířit kolem sebe. Rychlá (a z hlediska PR mimořádně povedená) reakce Facebooku na článek z Princetonu dává ve světle těchto čísel ještě větší smysl. Jeho úkolem je totiž nejen trend “nepříchodu” nových uživatelů z nejmladších věkových skupin zvrátit, ale také rozptýlit veškeré obavy (zejména inzerentů) o to, že k němu vůbec dochází.

Dataporno – všechno, co jste snad ani nechtěli vědět…

Před nedávnem jsem se tu rozplýval nad týmem lidí z Facebooku, kteří pod značkou Facebook Data Science, zpracovávají kvanta dat o uživatelích a publikují o těchto analýzách skvělé články. Je ale pravda, že internet není jenom Facebook. Je to hlavně porno. Například podle žebříčku Alexa traffic rank, je Pornhub – jeden z nejznámějších pornowebů, šedesátým osmým světově nejnavštěvovanějším webem. A pokud bychom z žebříčku odstranili vyhledávače, tak se posune ještě o pořádný kus nahoru.

Důvod, proč se o tom zmiňuji je ten, že právě Pornhub má také svůj vlastní “Pornhub Data Science” tým. A tak zatímco Facebook analyzuje data o vztazích svých uživatelů, Pornhub analyzuje data o… no… o pornu.

Ti japonci…

Jeden z nejlepších příspěvků je interaktivní infografika, zobrazující to, o kolik procent vzroste či klesne návštěvnost Pornhubu v konkrétní, nějak významný den. Těchto dní je na výběr hned několik a jsou rozdělené do oblastí sport, zprávy, svátky a televize. No a které jsou tedy ty nejvíc porno-friendly dny v roce?

Tohle není tak jednoduché zodpovědět. Ve dnech, které Pornhub vybral, se totiž návštěvnost téhle stránky spíše snižuje. Tedy většinou a ve většině zemí. Samozřejmě ale existují výjimky. Například na štědrý den (v americkém pojetí, tedy 25. prosince) průměrná návštěvnost webu klesá o 22%, zatímco v Japonsku o 8% roste. Všude zřejmě není zvykem sledovat o Vánocích jen pohádky.

Vliv jednotlivých dní na návštěvnost webu, resp. konzumaci porna si můžete projít sami. Jeden, našemu geografickému prostoru bližší den, jsem ale přeci jen vybral jako ukázku. Je jím finálový den Mistrovství Evropy ve fotbale 2012. Schválně si podle mapy nárůstů a poklesů sledovanosti tipněte, které země se utkaly ve finále.

Mapa nárůstů a poklesů sledovanosti ve vybraných zemích v den finálového zápasu Eura 2012
Mapa nárůstů a poklesů sledovanosti ve vybraných zemích v den finálového zápasu Eura 2012 | zdroj: Pornhub Insights

Je jasně vidět, že v tento konkrétní den šlo ve Španělsku a Itálii všechno stranou fotbalu. I porno. Toto konkrétní zjištění ale podle mě není až tak zásadní jako to, že ve zbytku Evropy došlo naopak k sedmiprocentnímu nárůstu. K tomu, aby se dalo z tohoto zvýšení návštěvnosti něco vyvozovat, by ale bylo potřeba vědět, jaké jsou výkyvy v konkrétních zemích mezi “běžnými”, nijak nevýznamnými dny. To ale bohužel v článku uvedeno není.

Pornohlédnutí za rokem 2013

Za pozornost také určitě stojí poměrně obsáhlé shrnutí návštěvnosti za rok 2013. Jako nejzajímavější, mi z něj přijde graf návštěvnosti podle platforem – mobily a tablety totiž generují již téměř 50% celkové návštěvnosti Pornhubu. Pokud vezmeme pouze návštěvnost generované americkými uživateli, rázem zjistíme, že na ní se jen mobily podílí z plných 52%.

Mezi další informace, s jejichž znalostí budete v kolektivu bezesporu za hvězdu potom patří třeba to, že nejvíce sledujeme porno v lednu zatímco nejméně v srpnu. V průběhu týdne je to potom nejvíce v pondělí a nejméně v neděli. Z hlediska průměrné délky jedné návštěvy webu jsou na tom “nejlépe” Britové s průměrnou návštěvou přes deset minut.

Za zmínku stojí i to, že nejsledovanější video na Pornhubu v roce 2013 mělo přes 12 mil. shlédnutí. Pokud dáme tohle číslo do kontextu s počtem shlédnutí asi nejsledovanějšího videa loňska na YouTube – van Damme splitu (necelých 68 mil.), tak nejde říct nic jiného než “not bad”. Je totiž potřeba si uvědomit, že zatímco hypu kolem reklamy Volva se nedalo uniknout a odkazy na ni sdíleli snad i lidé, kteří ji sami ani neviděli, tak odkazy na porno z podstaty věci nesdílí nikdo… a i tak to Jean Claude dotáhl “jen” na pětkrát vyšší číslo.

Každý má to svoje

Obecně nejzajímavějším typem výstupů, které na Pornhub Insights můžete nalézt jsou nejhledanější slova podle jednotlivých států (v tomto případě států USA). Na následující vizualizaci si po najetí na konkrétní stát můžete prohlédnout tři nejvyhledávaněší slova a průměrnou délku návštěvy z daného státu.

Nejvyhledávanější slova v jednotlivých státech USA (stejná barva označuje stejný nejvyhledávanější termín)
Nejvyhledávanější slova v jednotlivých státech USA (stejná barva označuje stejný nejvyhledávanější termín) | zdroj: Pornhub Insights

Všimněte si, že podle tohoto kritéria se spojené státy dělí na několik vcelku homogenních geografických oblastí se stejnými nejvyhledávanějšími termíny. Zatímco západní pobřeží se shání po asiatkách, severovýchod jede ve vysokoškolačkách a na jihu hledají černošky. O centrální části USA raději taktně pomlčím. Podobně detailní rozbor si můžete prohlédnou i třeba pro Velkou Británii nebo Irsko. Pro nás ale bude určitě zajímavější podívat se hned vedle – na Rakousko.

Alles gutte

Tam vítězí v hledanosti slovo “German” a to dokonce ve všech spolkových zemích bez výjimky. Není ovšem třeba se automaticky domnívat, že Rakušané trpí nějakou formou obsese po videích právě z Německa. Daleko spíše jde o to, že hledají jim jazykově blízká videa.

Nejvyhledávanější slova v jednotlivých spolkových zemích Rakouska
Nejvyhledávanější slova v jednotlivých spolkových zemích Rakouska | zdroj: Pornhub Insights

To je ovšem naprosto běžný jev všude po světě, alespoň to tedy vyplývá z již zmíněného shrnutí roku 2013. S ohledem na to, jak hledaná jsou videa v rodném jazyce se tedy zdá, že význam dialogů v pornu se dlouhodobě podceňuje…

Nejvyhledávanější slova ve vybraných zemích
Nejvyhledávanější slova ve vybraných zemích | zdroj: Pornhub Insights

Stejně jako na nejhledanější termíny se lze podívat i na čas, který průměrně připadá na jednu návštěvu z dané spolkové země. Zde bych jen upozornil na legendu heatmapy zobrazující právě průměrnou délku návštěvy. Minimální hodnota nezačíná na nule, ale na osmi minutách a patnácti vteřinách. Rozdíl mezi zemí s nejnižší a nejvyšší průměrnou délkou návštěvy je tedy pouze 42 vteřin. Podobně je popisována většina map v rámci Pornhub Insights, takže pozor na to.

Průměrná doba návštěvy z dané spolkové země Rakouska. Čím tmavší barva tím delší průměrná doba návštěvy.
Průměrná doba návštěvy z dané spolkové země Rakouska. Čím tmavší barva tím delší průměrná doba návštěvy | zdroj: Pornhub Insights

Pokud pomineme minimální rozpětí mezi jednotlivými spolkovými zeměmi, můžeme prohlásit, že nejdéle se na Pornhubu zdržují návštěvníci z Vídně. Naopak nejméně potom ti ze Štýrska a Voralberska. Btw teď už nemůžete říct, že vás porno nic nenaučilo – alespoň já jsem o existenci země s názvem Voralbersko do teď neměl nejmenší ponětí.

A když je zima, nebo nemám peníze?

Lidé okolo Pornhub Insights se naštěstí nespokojí jen s tím, že by zjišťovali, jaké speciality hledají lidé v té které zemi. Místy mají i zajímavější nápady.

Jeden z nich se váže k relativně nedávné minulosti. Asi všichni v médiích zaznamenali zprávy o extrémních mrazech, které postihly USA hned zkraje letošního roku. Ty donutily mnohé obchody a úřady vůbec neotevřít a všichni jejich zaměstnanci i zákazníci tak zůstali doma. Logicky se tak nabízí otázka – co tam všichni dělali?

Statistici z Pornhubu nabízí svou verzi odpovědi. K té došli tak, že se podívali zda se ve dnech sedmého a osmého ledna nějak změnila návštěvnost z konkrétních států USA. A výsledky mluví celkem jasně – státy ze severovýchodu (Maine, Michigan), které byly v určených dnech mrazy postižené nejvíce, zaznamenávají téměř padesátiprocentní nárůst návštěvnosti. Ta tentokrát není vyjádřena jen počtem návštěv, ale je možné si zobrazit i rozdíl v průměrném času stráveném na stránce nebo počtu zhlédnutých stránek na jednu návštěvu.

Změna v počtu návštěv ve dnech 7. - 8. ledna 2014 oproti dennímu průměru v lednu 2014 vyjádřená v procentech.

Změna v počtu návštěv z konkrétních států ve dnech 7. – 8. ledna 2014 oproti dennímu průměru v lednu 2014 vyjádřená v procentech | zdroj: Pornhub Insights

 Ok, tolik k mrazu. A co ty peníze? Další studie se věnuje tomu, zda porno více sledují lidé s nízkým či vysokým příjmem. Více, nízký a vysoký jsou všechno pojmy velice relativní. Proto nejprve pár slov k metodologii. Jako nízkopříjmová skupina jsou definovány návštěvy uskutečněné z deseti měst s nejnižším příjmem na hlavu v USA, jako vysokopříjmová skupina potom návštěvy z měst z opačného konce spektra.

Dělící kritérium – návštěvnost z určité lokality není pro podobnou studii úplně ideální, protože mezi obyvateli “chudých” měst je jistě i mnoho osob, jejichž příjem bychom označili za vysoký (pokud bychom hodnotili skutečně příjem), nicméně i ty nyní padají do nízkopříjmové kategorie, protože na internet přistupují ze “špatné” lokality a obráceně. Pokud ale odhlédneme od metodologických nedostatků, dostaneme tento obrázek:

Rozdíly mezi top 10 vysokopříjmovými a nízkopříjmovými městy USA v (1) počtu zhlédnutých stránek za návštěvu (2) průměrné délce návštěvy (3) počet zhlédnutých stránek na hlavu
Rozdíly mezi top 10 vysokopříjmovými a nízkopříjmovými městy USA v (1) počtu zhlédnutých stránek za návštěvu (2) průměrné délce návštěvy (3) počet zhlédnutých stránek na hlavu | zdroj: Pornhub Insights

Zdá se, že mezi oběma skupinami měst, resp. návštěv z těchto měst není rozdíl, pokud jde o počet stránek zobrazených při jedné návštěvě (cca půl stránky v tomto případě nepovažuji za rozdíl). Na druhou stranu je vidět, že nízkopříjmová města tráví na Pornhubu v průměru přibližně o minutu déle.

Vyvaroval bych se ale ukvapených závěrů o tom, že lidé z měst s nízkým příjmem sledují porno ve větší míře. Delší průměrná návštěva může být způsobena pouze nižší rychlostí internetového připojení, které se v těchto městech dá očekávat. Pokud z této studie vůbec nějaký závěr plyne, tak spíše ten, že z tohoto pohledu žádné rozdíly neexistují. Jen pro pořádek znovu upozorňuji, že osy prvních dvou grafů nezačínají na nule.

Jmenuji se Nicky a jsem herečka.

Pornhub ale nemá monopol na zpracování “pornodat”. Existuje i řada dalších, přičemž jedním z nejlepších je podle mého názoru studie “Deep Inside” (vzhledem k tématu, člověk jednoduše musí obdivovat ten název) od Jona Millwarda. Ten strávil přes půl roku analýzou osobních údajů více než deseti tisíců herců a hereček vystupujících ve filmech pro dospělé (volně dostupné v rámci databáze IAFD) a výsledek skutečně stojí za to.

Podle mého názoru jde o jednu z nejlépe zpracovaných infografik, se kterými jsem se kdy setkal (a s pár už jsem jich měl tu čest). Přesto, že je velice obsáhlá, je přehledná, a design každé její části zcela koresponduje s informací, kterou má podat. Zjistíte, že pornoherečky nejčastěji pocházejí ze západního pobřeží, typicky se jmenují Nicky Lee a jsou blondýny. Ale to je vážně jenom zlomek, nakonec podívejte se sami. Jen ještě doplním, že určitě stojí za to, se podívat i na originální blogpost autora celého projektu, kde popisuje celý proces od sběru dat až po tvorbu výsledné grafiky a komentuje výsledky.

Infografika shrnující výsledky analýzy dat z databáze IAFD
Infografika shrnující výsledky analýzy dat z databáze IAFD | zdroj: Jon Millward

Nic se nemá přehánět

To dokazuje druhá, s pornem spojená infografika. Tu zpracovala skupina lidí, kteří se dali dohromady na sociální služby Reddit a říkají si NoFap. Není asi nutné zabíhat zbytečně do detailů, nicméně podle jejich názoru je porno vysoce návykové a závislost na něm významně ovlivňuje kvalitu života.

Zda je či není porno návykové a jaký má vliv na kvalitu života nechávám na posouzení každému z vás. Z hlediska dat a jejich vizualizace je ale počínání této skupiny lidí zajímavé zejména proto, že shromáždili impozantní sadu statistik pocházejících z webu YouPorn a z vlastního výzkumu a dokázali vyrobit další parádní infografiku shrnující všechny jejich závěry. Stejně jako u předchozího příspěvku doporučuji přečíst si v případě zájmu i původní příspěvek na webu ProjectKnow.

Infografika shrnující závěry vlastního výzkumu v rámci komunity NoFap
Infografika shrnující závěry vlastního výzkumu v rámci komunity NoFap | zdroj: ProjectKnow

Jak jste se doufám přesvědčili, tak i svět o kterém se příliš nemluví umí s daty pracovat na obstojné úrovni a prezentovat je způsobem, který by mohla “normální” odvětví závidět. Než tedy znovu otevřete tu druhou záložku prohlížeče, kterou mátebeztak hned vedle tohoto článku, uvědomte si, že v tu chvíli se i vy stanete dalším řádkem v databázi, kterou jednou určitě někdo zanalyzuje.

Metal never dies! Nebo ne?

Google spustil další ze svých datových projektů v rámci Google research. Google Music Timeline mapuje popularitu různých hudebních žánrů v čase od roku 1950. Data pro tuto vizualizaci pochází ze služby Google Play Music a ceý projekt stojí na datu vydání alb, která mají uživatelé Google Play ve svých “sbírkách”.

Vizualizace popularity hudebních žánrů
Vizualizace popularity hudebních žánrů | zdroj: Google Music Timeline

Z vizualizace je například jasně vidět obrovská popularita Jazzu kolem roku 1950, nebo rozmach rocku v šedesátých a sedmdesátých letech. Podle Google lze popularitu těchto žánrů odvodit z informace o tom, že jazzová alba uživatelů jsou typicky s datem vydání právě kolem roku 1950, zatímco rocková alba se začínají ve velkém objevovat s datem vydání 1960 a dále.

Z toho mimo jiné vyplývá, že ve skutečnosti není zcela pravda, že by tato vizualizace mapovala skutečnou oblibu žánru v konrétních letech ale reprezentuje “pouze” aktuální preferenci alb z určitého období, která jsou shluknutá podle žánru. Pokud ovšem od tohoto (vcelku podstatného) nedostatku odhlédneme, dostaneme fascinující obrázek vývoje jednotlivých hudebních žánrů.

Pokud bych měl odpovědět na otázku v titulku, tak skutečně nic nenasvědčuje tomu, že by Metal postupně odumíral. Jeho popularita sice od “zlatých osmdesátek” částečně klesá, ale rozhodně je to menší úbytek, než jaký v historii zaznamenal rock. Na ten z jedné strany útočí hip-hop/rap a z druhé strany je vytlačován alternative/indie vlnou (nebo se v ní transformuje, záleží na tom, jak se na to díváte).

Vizualizace populartiy subžánrů v rámci hudebnho žánru Metal
Vizualizace populartiy subžánrů v rámci hudebnho žánru Metal | zdroj: Google Music Timeline

Po kliknutí na konrétní žánrový proud se můžete dostat na ještě detailnější pohled, který odhaluje vývoj popularity jednotlivých subžánrů. Pokud se tedy blíže podíváte třeba právě na Metal, uvidíte jak se vývoj celého tohoto hudebního stylu nastartoval na začátku osmdesátých let, kdy jej skupiny jako Metallica, Anthrax nebo Megadeth v podstatě zakládaly. A také to, jak následně přibíral prvky z dalších a dalších žánrů a sílil tzv. alternative metal na úkor původního thrash subžánru.

Pozn.: Při zkoušení téhle služby, která byla spuštěna skutečně velice nedávno, se mi často stávalo, že se interaktivní vizualizace vůbec nezobrazila. Pokud by tato obtíž potkala i vás, doporučuji chvíli počkat a stránku obnovit, potom se mi většinou již načetla.

Jaká slova volí papež František?

Jedno z mála smysluplných využití wordcloudu, které jsem v poslední době viděl můžete najít u článku “God’s Word: an analysis of Pope Francis’ new vocabulary“. Autor jej použil k analýze projevů papeže Františka a jeho předchůdce Benedikta.

První z nich zachycuje slova, která František používá alespoň o 50% častěji než Benedikt. Druhý potom to samé pro Benedikta. Můžeme vidět, že téma, které si sám nový papež vyhlásil za stěžejní – boj s chudobou, v jeho projevech skutečně rezonuje podstatně více než u jeho předchůdce. Ten se ve svých projevech prokazatelně více věnoval čistě “teologickým” tématům.

Slova, která papež František používá ve svých projevech alespoň o 50% častěji než papež Benedikt
Slova, která papež František používá ve svých projevech alespoň o 50% častěji než papež Benedikt | zdroj: vizynary.com
Slova, která papež Benedikt používal ve svých projevech alespoň o 50% častěji než papež František
Slova, která papež Benedikt používal ve svých projevech alespoň o 50% častěji než papež František | zdroj: vizynary.com

 

Zpravodajství českých televizí. Je libo politiku, kalamity nebo vraždy?

Společnost Media Tenor zvěřejnila pravidelnou čtvrtletní analýzu tematické skladby zpravodajství na jednotlivých českých televizních kanálech. Už proto, že kvalita zpravodajství některých českých televizních stanic je poměrně často diskutovaným tématem, stojí za to se podívat jestli jsou mezi Událostmi, Televizními novinami a zprávami FTV Prima nějaké objektivní rozdíly. Nehledě na to musí člvověka fascinovat, kolik práce a času muselo zabrat takovou analýzu vypracovat.

V Událostech se vraždí o polovinu méně

První část dokumentu hodnotí, kterým tématům jednotlivá zpravodajství věnovala nejvíce času. Nebudu hodnotit, která ze stanic ze srovnání vychází nejlépe, protože pod pojmem “kvalitní zpravodajství” si někdo může představit reportáž o skladbě státního rozpočtu a někdo fenomenální reportáže Vládi Hrušky. Nicméně pokud se podíváme na první čtvrtletí 2013, Události se ve čtvrtině svého vysílacího času tématicky věnovali státní správě. Ta je na  čelní příčce s výrazným odstupem před zpravodajstvím o kriminálních činech a společenských tématech.

Tematická skladba komerčních stanic vypadá následovně. Prima největší část vysílacího času Zpráv věnovala taktéž státní správě, nicméně zhruba srovnatelný čas vysílání byl věnován i kalamitám a dopravním nehodám. Televizní noviny na Nově zvolily zcela odlišný formát. Téměř třetinu jejich vysílacího času zabírá informování o kriminálních činech, následují nehody a kalamity a na třetím místě společnost. První dvě zmíněná témata (kriminalita a kalamity) tak zabírají téměř přesně polovinu vysílání Televizních novin. Logicky mi z toho vyplývá, že člověk, který pravidelně sleduje zpravodajství na Nově, musím mít dojem, že se u nás vraždí a znásilňuje dvakrát tolik, než jak to vidí divák Událostí na ČT. Znovu říkám, že nehodnotím, který přístup je správnější.

Témata zpravodajství na jednotlivých kanálech
Tematická struktura hlavních zpravodajských pořadů (Q1/2013). | zdroj: Media Tenor

Nagygate hlavním tématem

Ve zbytku článku se již budu věnovat pouze výsledkům za třetí čtvrtletí uplynulého roku. V tom se na podobě zpravodajských relací na všech stanicích citelně podepsala aféra kolem premiéra Nečase a jeho současné manželky. Tu převážně pokrývala tématická oblast “kriminální činy”, která se tak dostala do popředí i v případě Událostí a Zpráv FTV Prima. Faktem ale zůstává, že Nova se při tom všem stihla věnovat i řadě dalších kriminálních činů, díky čemuž podílem tohoto tématu na vysílání předstihla konkurenční stanice i ve třetím čtvrtletí.

Témata zpravodajství na jednotlivých kanálech Q3/2013
Tematická struktura hlavních zpravodajských pořadů (Q3/2013). | zdroj: Media Tenor

Konkrétní témata, kterým se nejvíce věnovaly Události (tato statistika není pro další dva kanály k dispozici) bylo dění na vládě (opět v souvislosti s kauzou Nagyová). Tomu byly věnovány celé tři hodiny a čtyřicetsedm minut vysílání Událostí. Rozjíždějící se předvolební období se také odrazilo na tomto žebříčku, když se pátým nejčastěji zmiňovaným tématem staly právě předvolební kampaně.

Čas věnovaný jednotlivým tématům v Událostech
Čas věnovaný jednotlivým tématům v Událostech v hodinách a minutách (Q3/2013) | zdroj: Media Tenor

Na Nově je politika více osobní

Samostatná část analýzy je věnována zpravodajství o politice.  Výrazné téma pádu vlády se samozřejmě muselo projevit i tady a celkem logicky je tedy nejvíce zmínek v Událostech věnovaných ODS. Následuje ČSSD, coby hlavní opoziční strana, která se k celé kauze také poměrně často vyjadřovala. Z (v tu dobu) neparlamentních stran se nejvíce mluvilo o SPOZ a KDU-ČSL, coby tehdy nejnadějnějších kandidátech na nové strany ve sněmovně. Za zmínku určitě stojí i fakt, že v žebříčku v tu dobu ještě zcela chybí ANO.

Pokud přihlédneme i ke kontextu (ve smyslu pozitivní/negativní) v jakém byly zmínky o konkrétních stranách uváděny, vyjde nám z toho nejhůře (zcela nepřekvapivě) opět ODS. Tu následují dvě strany, které původně kandidovaly jako jedna a nakonec už nekandidovala ani jedna… nebo jak to vlastně bylo – VV a LIDEM. Relativně nejméně negativních zmínek v Událostech potom nasbírala KDU-ČSL s KSČM.

Intenzita a kontext zmínek o konkrétních politických stranách v pořadu Události (Q3/2013)
Intenzita a kontext zmínek o konkrétních politických stranách v pořadu Události (Q3/2013) | zdroj: Media Tenor

Poměrně předvídatelný je potom žebříček zobrazující intenzitu zpravodajství o konkrétních postavách české politické scény. Na prvním místě je s výrazným náskokem v počtu zmínek současný prezident Miloš Zeman, následovaný jím dosazeným premiérem Rusnokem. Ten se na druhou příčku dostal především díky reportážím o jeho sporném jmenování. Zajímavé je, že pan Fischer se na třetí místo dostal sice v důsledku své prezidentské kandidatury, nicméně především kvůli dluhům za vlastním mediální kampaň a spekulacím o pozadí jejich bleskového splacení. No a na čtvrtém místě nemůžeme opomenout jednoho z hlavních aktérů kauzy kolem pádu vlády, již několikrát zmiňovaného bývalého premiéra Nečase.

Intenzita a kontext zmínek o konkrétních politicích v pořadu Události (Q3/2013)
Intenzita a kontext zmínek o konkrétních politicích v pořadu Události (Q3/2013) | zdroj: Media Tenor

Zajímavý pohled, který o zaměření konkrétního zpravodajského pořadu také leccos vypovídá, je tematická struktura zmínek o politických tématech obecně (o stranách i konkrétních politicích dohromady). Pokud z tohoto hlediska porovnáme zpravodajství obou komerčních televizí, vychází nám, že zatímco na Primě jsou informace týkající se politických postojů a osobních témat naprosto vyvážené, na Nově jasně převládají informace zahrnující osobní záležitosti jednotlivých politiků. ČT se z tohoto pohledu blíží spíše pojetí Primy.

Tematická struktura zmínek o politicích a politických stranách v jednotlivých zpravodajských pořadech (Q3/2013)
Tematická struktura zmínek o politicích a politických stranách v jednotlivých zpravodajských pořadech (Q3/2013) | zdroj: Media Tenor

Za zmínku určitě stojí i analýza “konfrontačnosti” moderátorů pořadů Interview ČT24 a Hyde Park. Té se zpráva taktéž věnuje, nicméně její hodnota je podle mě natolik závislá na mnoha různých faktorech, které se sejdou u konkrétního vydání analyzovaných pořadů, že lze jen těžko cokoliv zobecňovat. Můžete si ji ale samozřejmě dohledat na straně 15 zprávy. Za mě jen podotku, že největší kouř dostala Miroslava Němcová od Bohumila Klepetka.

Když se nepochválíš sám, …

Tak jako byl v oblasti politiky nosným tématem pád vlády, v rámci ekonomického zpravodajství se nejvíce mluvilo o situaci kolem OKD resp. NWR, která oznámila záměr utlumit těžbu v části svých dolů na ostravsku.

Pokud se blíže podíváme opět jen na situaci v Událostech, výše zmíněné se nám jasně potvrzuje. Současně můžeme vidět, že OKD spolu s NWR jsou dvě společnosti s absolutně i relativně nejvyššími podíly negativně laděných zmínek. Zdatně jim ale z tohoto hlediska sekunduje Dopravní podnik hlavního města Prahy, čemuž se nikdo, kdo přišel do styku s noční tramvají, nemůže divit. Pohled na opačný konec tohoto “žebříčku popularity”, ale také není bez zajímavosti. Už proto, že instituce o které Česká televize informovala nejvíce pozitivně, je překvapivě Česká televize.

Intenzita a kontext zmínek o konkrétních politických stranách v pořadu Události (Q3/2013)
Intenzita a kontext zmínek o konkrétních firmách v pořadu Události (Q3/2013) | zdroj: Media Tenor

Na druhou stranu je ale třeba říct, že taková porce samochvály není nic výjimečného. Třeba FTV Prima, byla podnikem, o kterém zpravodajství FTV Prima informovalo nejčastěji. Na Nově jsme potom častěji než o Nově slyšeli jen o OKD. Tomu v Televizních novinách připadla takřka každá pátá zmínka týkající se ekonomických témat.

Podíl nejčastěji zmiňovaných firem na zpravodajství s ekonomickou tematikou na jednotlivých kanálech (posledních 12 měsíců)
Podíl nejčastěji zmiňovaných firem na zpravodajství s ekonomickou tematikou na jednotlivých kanálech (posledních 12 měsíců) | zdroj: Media Tenor

S ČT do světa, s Novou do regionů

Poslední částí analýzy, kterou bych rád okomentoval se týká toho, jak se jednotlivé kanály ve zpravodajství věnují jednotlivým lokalitám v rámci zahraničního či regionálního zpravodajství. Relativně nejvíce se o zahraničních záležitostech dozvídáme prostřednictvím Událostí, naopak nejméně o čemkoliv za hranicemi ČR informují Televizní noviny. Podstatnou část z toho mála navíc “spolknulo” zpravodajství o narození britského následníka trůnu.

Obecně ale prostor zahraničního zpravodajství obsazovaly spíše informace o syrské krizi vyvolané použitím chemických zbraní a zvažovaném vojenském zásahu USA a Francie. Spojené státy byly zároveň zahraniční zemí, která si zabrala největší podíl tohoto typu zpravodajství – téměř čtyři hodiny. Jen pro srovnání – Rusko dostalo prostor v délce hodiny a tři čtvrtě.

Podíl zahraničního zpravodajství jednotlivých kanálů a čas věnovaný jednotlivým zemím v Událostech v hodinách a minutách (Q3/2013)
Podíl zahraničního zpravodajství na jednotlivých kanálech a čas věnovaný jednotlivým zemím v Událostech v hodinách a minutách (Q3/2013) | zdroj: Media Tenor

I pokud přejdeme na domácí půdu můžeme vidět jasně patrné rozdíly ve struktuře zpravodajství, které jsou nejvíce zřetelné mezi Novou a ČT. Zatímco Události se v domácím zpravodajství primárně orientují na informování o ČR obecně, případně na témata mající zahraniční přesah, Nova se orientuje především na regionální zpravodajství, které tvoří téměř dvě třetiny zpráv o ČR. Prima je ve svém pojetí domácího zpravodajství opět blíže České televizi než komerční konkurenci.

Struktura domácího zpravodajství na jednotlivých kanálech a čas věnovaný jednotlivým obcím v Událostech v hodinách a minutách (Q3/2013)
Struktura domácího zpravodajství na jednotlivých kanálech a čas věnovaný jednotlivým obcím v Událostech v hodinách a minutách (Q3/2013) | zdroj: Media Tenor

Prima má blíže k ČT

Abych tedy zodpověděl otázku z úvodu, zda existují rozdíly mezi jednotlivými zpravodajskými pořady, tak určitě ano. Spíše než, že by se každá stanice orientovala jiným směrem mi ovšem z analýzy vyplývá, že z nabízených úhlů pohledu se Události a Zprávy FTV Prima společně více věnují “seriózním” tématům a zprávám ze světa, které prezentují spíše uceleně a “z nadhledu”.

Naproti tomu Televizní noviny se více orientují na “aktuální senzace” a zprávy z regionů, do kterých častěji zapojují osobní hledisko. Pokud by vás téma zaujalo, můžete si projít i analýzy prvního a druhého kvartálu, případně mi napsat, co dalšího byste z nich vyčetli a já jsem podle vás nezmínil.

Facebook ví, kdy se zamilujete, rozejdete a co si potom pustíte.

Často se mluví a ještě častěji píše o tom, kolik má Facebook k dispozici našich osobních údajů, které na něj sami doslova házíme. Podstatně zajímavější než konspirační teorie o tom, jak jsou tato data nelegálně zneužívána, jsou ale ukázky toho, jak jsou kreativně (a zcela legálně) využívána.

Pro tyto účely slouží Facebooková stránka Facebook Data Science, která čas od času publikuje analýzy dat nasbíraných na profilech jednotlivých uživatelů. A rozhodně se nejedná jen o suchou statistiku. V jednom z posledních příspěvků “From Classmates to Soulmates” se například zabývá tím, jak je pravděpodobné, že si svého životního partnera najdete na střední nebo vysoké škole. Láska a vztahy jsou pro tým analytiků Facebooku pravděpodobně velice fascinující, protože jak uvidíte, není to zdaleka jejich první příspěvek na toto téma.

Spolužáci na celý život?

Většina z nás má pravděpodobně na svém Facebookovém profilu vyplněnou informaci o tom, na kterou střední nebo vysokou školu jsme chodili. Nemálo z nás má na profilu také informaci o svém rodinném stavu a často uvedeno i jméno partnera. Pokud všechny tyto informace zkombinujeme, není problém (pokud si tedy odmyslíme, to, že musí někdo všechna ta data zpracovat) je vzít a dojít k následujícím závěrům.

15% zkoumaných uživatelů studovalo stejnou střední školu jako jejich současní životní partneři. Pokud jste ale chodili na střední školu na východním pobřeží (analýza pracuje pouze s data uživatelů z U.S.), pravděpodobnost toho, že se vaším životním partnerem stane bývalý spolužák/spolužačka klesá. Tento fakt je způsoben vyšší hustotou obyvatelstva resp. vyšším počtem středních škol v dané lokalitě.

Mapa středních škol v USA
Body reprezentují jednotlivé střední školy v USA obarvené podle pravděpodobnosti toho, že si student dané školy vybere za životního partnera někoho ze stejné školy. Červená znamená vysokou pravděpodobnost, modrá nízkou. | zdroj: Facebook Data Science

Vysoké školy přejí manželství ještě více. Podle té samé analýzy je totiž 28% vysokoškoláku sezdáno s někým, kdo promoval na stejné vysoké škole. Faktorů, které ovlivňují pravděpodobnost toho, že se dva absolventi konkrétní vysoké školy nakonec vezmou, je podle Facebook Data týmu několik. Jednak jde o poměr mužů a žen na škole (tento faktor by například značně diskvalifikoval Matfyz…) a o její velikost. Dále se také ukazuje, že zmíněná pravděpodobnost roste s tím, jak silně je daná vysoká škola nábožensky založena a zda mezi jejími studenty převládají konzervativci.

Mapa vysokých škol v USA
Body reprezentují jednotlivé vysoké školy v USA obarvené podle pravděpodobnosti toho, že si absolvent dané školy vybere za životního partnera někoho ze stejné školy. Červená znamená vysokou pravděpodobnost, modrá nízkou. Spojnice mezi body spojují školy s neobvykle vysokým počtem vzájemně sezdaných studentů | zdroj: Facebook Data Science

Poslední část analýzy se zabývá tím, na kterých vysokých školách je nejvyšší procento žen resp. mužů, které/kteří mají své partnery ze stejné vysoké školy. Co to přesně znamená se vysvětluje stejně složitě jako to zní, proto se pokusím shrnout závěry, ze kterých je to  snáze pochopitelné.

U žen jsou na předních příčkách technické univerzity, mezi jejímiž studenty jasně převažují muži. Možné vysvětlení je, že jako žena máte v takovém prostředí velké množství potenciálních partnerů a malou konkurenci. Pravděpodobnost, že z takové situace něco vzejde je tedy relativně vysoká. V konkrétním případě první univerzity tohoto ženského žebříčku – Rose Hulman Institute of Technology má 70% žen absolventů jako svého partnera absolventa právě této školy.

Univerzity s nejvyšším procentem žen majících za partnera bývalého spolužáka
Univerzity s nejvyšším procentem žen majících za partnera bývalého spolužáka | zdroj: Facebook Data Science

Zajímavá je situace u mužů. Žebříček škol, na kterých má nejvíce mužů za partnertky své bývalé spolužačky, totiž není obdobou toho ženského, jak by člověka mohlo napadnout. Na prvních příčkách, jsou zde univerzity s vyrovnaným poměrem studentů a studentek. Zřejmě ale nebude náhoda, že se na čelních příčkách často vyskytují školy jako “Faith Baptist Bible College and Theological Seminary”, na kterých se dá předpokládá relativně vyšší počet věřících studentů. Nemám po ruce žádnou statistiku, která by podpírala mou domněnku, nicméně myslím si, že např. počet partnerů, které tito studenti za život vystřídají bude nižší než v obecné populaci a je tím pádem pravděpodobnější, že to se svým partnerem, kterého potkali na škole dotáhnout až k manželství. Znovu ale upozorňuji, že jde jen o mou hypotézu a budu rád, pokud mě opravíte nebo nabídnete alternativní vysvětlení.

Univerzity s nejvyšší procentem mužů majících za partnerku bývalou spolužačku | zdroj: Facebook Data Science
Univerzity s nejvyšší procentem mužů majících za partnerku bývalou spolužačku | zdroj: Facebook Data Science

Původní článek, ve kterém autoři blíže vysvětlují metodiku a některá z ní vyplývající omezení ze stránek Facebook Data Science si můžete přečíst tady.

 Sezonalita vztahů – počkejte si na pondělí

Druhá analýza využívá informace o tom, zda jsou uživatelé Facebooku single nebo zadaní k tomu, aby odhalila období, kdy se lidé nejvíce dávají dohromady. V podstatě takovou vztahovou high season.

Základem celé analýzy je procentuální přírůstek či úbytek vztahů v daném období stanovený jako podíl počtu osob, které si v daném období změnili svůj stav na jednu z variant “ve vztahu” a počtu osob, které si v změnili stav na jednu z variant “single”. Například na Valentýna změní svůj stav na “zadaný” o 49% uživatelů víc než na “single”. Shodou okolností je právě na Valentýna tento čistý přírůstek nejvyšší. Ok, není to shoda okolností. Je to klišé až to bolí.

Zajímavější je, že poměrně vysoký je tento poměr i 25. prosince (34%). Valentýn a Vánoce vztahům zřejmě přejí. O 20% více vztahů také vzniká na Apríla, nicméně druhého dubna je naopak den s nejvyšší čistou rozchodovostí (11%). To ale podle mě svědčí pouze o tom, že spousta lidí považuje za vrchol své aprílové invence změnit si svůj stav na Facebooku na “zadaný” a den na to prohlásit, že šlo o apríl. Což je smutné.

Celkově je ale duben pro vztahy spíše průměrný měsíc, jak je vidět z následujícího grafu. Ten byl zkonstruován tak, že pro každý den v roce byla vypočtena ona čistá procentuální změna stavů na zadaný nebo single a pro jednolitvé měsíce byly následně zkonstruovány boxploty.  Stručně a poněkud zjednodušeně – čím níže je boxplot tím nižší přírůstek (resp. vyšší úbytek) vztahů, čím je boxplot “menší” tím méně se liší hodnoty jednotlivých dnů v měsíci. Barva vyjadřuje rozdíl daného měsíce oproti průměru roku, čím zelenější, tím výše je daný měsíc nad průměrem roku, pro červený odstín opačně. To vše pro tři věkové kategorie uživatelů 0-24, 25-44, 45+.

Boxploty pro denní hodnoty čistého přírůstku vztahů v daném měsíci pro danou věkovou kategorii | zdroj: Facebook Data Science
Boxploty pro denní hodnoty čistého přírůstku vztahů v daném měsíci pro danou věkovou kategorii | zdroj: Facebook Data Science

Pár závěrů vyplývajících z grafů. Za prvé, v létě máte solidní šanci, že dostanete kopačky ať je vám kolik chce. Za druhé s rostoucím věkem se zvyšuje rozpětí výsledků v rámci jednotlivých měsíců a také se do určité míry stírají rozdíly mezi měsíci samotnými (do pětadvaceti v tom máte jasno – přežít zimu ve vztahu, před prázdninami se rozejít a užívat si a kolem září se zase po někom poohlédnout, ale čím jste starší, tím náhodněji se scházíte a rozcházíte v průběhu celého roku)

Na stejná data se lze dívat nejen na měsíční bázi ale určitou sezonalitu lze pozorovat i v rámci týdne. Pro uživatele starší 25 let shodně platí, že nejvíce lidé oznamují svůj nový vztah v pondělí. S postupem týdne poté poměr nových vztahů a rozchodů klesá a v pátek se již překlápí ve prospěch rozchodů. U nejmladší věkové skupiny vzniká nejvíce vztahů již v neděli a největší rozchodovost nastává již ve čtvrtek.

Čistý procentuální přírůstek vztahů v jednotlivých dnech týdne | zdroj: Facebook Data Science
Čistý procentuální přírůstek vztahů v jednotlivých dnech týdne | zdroj: Facebook Data Science

Pokud se shodneme na tom, že nejvíce vztahů skutečně vzniká o víkendu, potom se podle mě dá tento posun vysvětlit skutečností, že mezi lidmi do 25ti let budou převažovat studenti, kteří příliš neodlišují všední dny a víkend, minimálně z pohledu aktivity na Facebooku. Své nové vztahy tak oznamují více méně ve stejný čas kdy skutečně vznikají. Jejich starší, většinou pracující kolegové se na Facebook hromadně vrhají po návratu do práce – v pondělí. Ale to je jen jedna z možných hypotéz.

Původní článek ze stránky Facebook Data Science si můžete přečíst zde.

Ne vždycky je to ale taková věda…

Důkazem toho, je poslední analýza, kterou chci představit. I když tentokrát je slovo analýza třeba brát skutečně s rezervou. Myšlenka za tím vším je skvělá – zjistit, co nejvíc poslouchají lidé po rozchodu a lidé, kteří jsou právě na začátku nového vztahu.

Přišlo by mi logické podívat se písničky, které na Facebooku nejvíce sdílí uživatelé, kteří si v posledním cca týdnu změnili svůj stav buď na “single”, nebo na “ve vztahu”. Tým výzkumníků Facebooku na to ale šel jinak a sledoval, které písničky nejvíce přehrávají uživatelé, kteří na Facebooku právě oznámili svůj status prostřednictvím hudební služby Spotify.

To by ale samo o sobě nebyl takový problém, jako to, že metodika celé analýzy je popsána jen velice stručně a povrchně a není tedy jasné, kdo jsou přesně analyzovaní uživatelé, ani co přesně znamená “nejvíce hrané” písničky. V každém případě je mezi čerstvě zamilovanými údajně nejpopulárnější “Don’t Wanna Go Home” (resp. byl v době analýzy), zatímco u čerstvě osamělých vede “The Cave”.

Kompletní žebříčky nejoblíbenějších skladeb mezi oběma skupinami uživatelů (spolu s připravenými playlisty pro Spotify) jsou uvedeny v původním příspěvku na stránce Facebook Data Science. Za mě můžu říct jen tolik, že poslech obou playlistů pro mě byl zážitek podobně příjemný jako šlápnutí na rezavý hřebík…

Taky jste ta Big Data nikdy neviděli? Víme proč.

Pamatujete si na Cloud Computing? Bývaly doby, kdy byl tohohle slova plný internet, všichni to měli, nebo chtěli mít, byla v tom budoucnost a pokud jste to slovo nepoužili alespoň třikrát během jedné pracovní schůzky, byli jste prostě “out”. Stejné je to teď s Big Data.

Komiks o Dillbertovi a Big Datech

Každý je má, musí je analyzovat nebo o nich alespoň psát (hups) a přitom existuje jen minimum lidí, kteří s nimi kdy přišli do styku a minimum textů, které by o nich říkaly cokoliv jiného, než že se bez nich neobejdete. Strávil jsem proto poslední dobou nemálo času rešerší na téma “co jsou to sakra vlastně ta Big Data a jak se liší oproti těm normálním, nudným Datům” a vážně není jednoduchý úkol, najít takovou informaci pohromadě.

První co je nutné si o Big Datech uvědomit je fakt, že pod tímto termínem není možné hledat (tak jak jsem dlouho naivně hledal) jakýsi nový, větší a lepší typ dat, která známe nyní. Big Data nejsou “věc”, spíše jde o koncept, jakousi komplexní filosofii přístupu k datům, která známe nyní. Hlavní otázkou potom je, co tento koncept charakterizuje.

Podstatnou část odpovědi je schopný poskytnout článek Big Data: The Management Revolution publikovaný před rokem na webu Harvard Business Review (kompletní znění článku v pdf je na Google Scholar). Podle autorů jsou klíčovými charakteristikami, které Big Data odlišují od těch “klasických” dat, především:

ROZSAH – Terabajty jako jednotky velikosti jednotlivých datových setů již v poslední době přestávají stačit. Ve zmíněném článku je jako příklad rozsahu dat, která mají dnešní firmy k dispozici řetězec Wallmart. Pravda Wallmart není firma, kterou by šlo považovat za běžnou, minimálně pokud jde o její velikost a úroveň zpracování dat. Nicméně její zákazníci vygenerují každou hodinu dva a půl petabajtu (1000 TB) dat o uskutečněných transakcích. Na data o takovém rozsahu je už přeci jen třeba nahlížet trochu jinak než na klasickou databázovou tabulku o několika stech, maximálně tisících řádků. I přesto by se ale dalo namítnou – ok, těch dat je hodně, ale pořád jsou to jen data. A nedá se s tím nesouhlasit.

RYCHLOST – Daleko podstatnějším rysem a současně rozdílem proti klasickým datům, je rychlost jejich vzniku, resp. frekvence jejich aktualizace chcete-li. V rámci Big Data konceptu, se celý proces vzniku dat, jejich sběru, analýzy a implementace sbližuje až na úroveň prakticky real-time zpracování dat. Představte si například, že by dopravní podnik na základ real-time dat o poloze obyvatel na území daného města (data dostupná např. z mobilní sítě, jak ukázal případ Jana Cibulky) dokázal posilovat či naopak oslabovat intenzitu spojů a tím optimalizovat vytížení linek. Něco takového je zatím asi utopie, ale co třeba zpracování dat o zdravotním stavu pacientů připojených na přístroje v reálném čase, umožňující zachytit signály nastupujícího akutního stavu a zasáhnout tak ještě před plným rozvojem nemoci? Konkrétní případovou studii, která dokazuje, že druhý případ už je daleko blíže realitě (stejně jako spoustu dalších užitečných materiálů, pokud vás téma Big Data zajímá více do hloubky) můžete najít na IBM The Big Data Hub.

ROZMANITOST – Zjednodušeně řečeno se v rámci pojetí standardních dat pod pojmem data, rozumí pouze data strukturovaná. Tedy taková, která mají typicky podobu tabulky, u které víme, jakou informaci nese který sloupec, a co reprezentuje každý řádek atd. V pojetí Big Data je za data považováno prakticky cokoliv, co lze potenciálně využít pro predikci. Takových “potenciálních datových zdrojů” je spousta – příspěvky a obrázky na sociálních sítích, výpisy hovorů, geolokační údaje, maily a další. S tím ovšem také přichází nutnost umět tato data zpracovat a logicky je interpretovat.

Právě popsané odlišnosti Big Dat a klasických dat, jsou pojmenovávány jako 3V (z anglických slov Volume, Velocity, Variety) a jsou všeobecně přijímány. Objevují se ale i další např. Veracity vyjadřující nejistotu v datech, či nekvalitu dat vyplývající z výše popsaných vlastností tohoto přístupu a Value, která má představovat přidanou hodnotu, kterou Big Data přináší, případně Visualization.

Infografika Čtyři V Big Dat
Infografika Čtyři V Big Dat | IBM The Big Data Hub

Každá z vlastností konceptu Big Data zároveň představuje vývojový posun v přísupu k datům. Nejvýrazněji se na tomto posunu podepisuje rychlost, se kterou vznikají stále nová a nová data. V jejím důsledku je totiž nutné se orientovat spíše na “tok” dat, proces jejich sběru, analýzy a implementace, který musí být nastaven tak, aby mohl fungovat stejně rychle, jak rychle jsou nová data generována. Toto pojetí je přímým protikladem převládajícího přístupu, založeného na “zásobě” dat ve formě databází a jejich více či méně dávkového zpracování.

Big Data jsou tedy spíše způsob, jak přisupovat k datům obecně, než úplně nový ulitmátní, všeřešící typ dat, která vám dají odpověď na všechno. Je totiž skvělé, pokud máte všechny ty zásady pro Big Data ve vaší firmě implementovány, ale na druhou stranu není potřeba si myslet, že jste úplně mimo, pokud máte dojem, že vám pořád stačí ta stará “klasická” data. Už jen pokud se podíváte na ony znaky Big Dat, zjistíte, že oblastí resp. konkrétních firem, pro které je vhodný tento přístup, není mnoho. Kde všude potřebujete pracovat s petabajty dat vznikajícími každou hodinu ve formě stovek různých nestrukturovaných datových zdrojů? Pokud máte dojem, že vám pořád stačí vaše klasické týdenní reporty, databáze a především strukturovaná numerická data, tak proč se honit za Big Daty? Pro případ, že by byl váš dojem špatný, ale určitě není od věci uvažovat nad tím, zda tuto filozofii, či některé její části nezavést i do vaší firmy, byť třeba jen v omezené formě.

Pokud máte zájem dozvědět o myšlence Big Dat ještě víc a to i poměrně zábavnou formou, doporučuji následující playlist sestavený z přednášek v rámci TED talks nazvaný “Making sense of too much data”, který obsahuje přednášky řečníků jako Hans Rosling nebo David McCandless.