Když článek začíná slovy „Američtí vědci zjistitili, že…„, obvykle je to signál toho, že bude následovat spíše nějaká populárně-naučná kuriozita než seriózní závěr. Této zásady se bohužel minulý týden nedržela mnohá česká a často ani světová média, když na titulních stranách se smrtelnou vážností prorokovala faktický konec Facebooku do roku 2017. Následující komiks poměrně přesně ilustruje, co se vlastně stalo a článek pod ním se pokouší vysvětlit proč.
To vše na základě článku dvou doktorandů z Princetonu, který (což už v pozdějších mutacích původní zprávy chybělo úplně) ještě ani neprošel recenzním řízením. Facebook si ale nedal nic líbit a vzkázal na Princeton, že podle jejich výzkumu a dat tato univerzita zcela vymizí z mapy vysokých škol do roku 2021.
Tento v podstatě marginální spor v sobě skrývá hned několik otázek. Tou, která se prvoplánově nabízí je, zda má Facebook skutečně problém a to i vzhledem k dalším zprávám, které nedávno proběhly internetem a které tvrdí, že největší sociální síť dneška čelí masivnímu odlivu nejmladší skupiny uživatelů. Nad tím vším se ovšem vznáší širší téma důvěryhodnosti dat vytržených z kontextu a jejich věrohodnosti v případě, že jsou účelově vybrána s cílem podpořit určitý závěr a ne naopak – činit závěry na jejich základě.
Facebook jako virus a data z Google Trends
Pro ty z vás, kterým by se nechtělo původní článek číst, na začátek jen shrnu, jak John Cannarella a Joshua A. Spechler ke svým závěrům dospěli. Předem upozorňuji, že i já se zde dopustím několika zkratek a zjednodušení.
V centru celé myšlenky stojí tzv. SIR model, který se běžně využívá pro modelování šíření epidmiologických nákaz a který pracuje se třemi základními ukazateli. Množinou osob, které se danou nemocí mohou potenciálně nakazit (Susceptible), množinou, která je již nakažená a šíří virus dál mezi zatím zdravé jedince (Infected) a konečně množinou, která se vůči nemoci stala imunní nebo na její následky zemřela (Removed). V zásadě jde tedy o systémově dynamický model, kde systém (populace) na základě nastavení několika parametrů hledá rovnovánu mezi třemi popsanými „zásobami“ jednotek (osob). Jeho fungování při různém nastavení parametrů si můžete vyzkoušet třeba na stránce RunTheModel a to dokonce jak v system-dynamic, tak v agent-based verzi.
Celé téma šíření epidemií v populaci je poměrně vzdálené problematice sociální sítích jen do chvíle, než si uvědomíte některé analogie. Na začátku existuje početná skupina osob, které na dané síti nejsou, ta se postupně začne přelévat do skupiny „nakažených“ (uživatelů dané sítě) a následně o síť ztrácí zájem a putují do skupiny „Removed“. Drobným rozdílem je jen definice pojmu Removed. Jak píší sami autoři, v důsledku používání sociálních sítí lidé sice neumírají (tedy většinou ne – to autoři nepíší), ale buď ji zcela opouští, nebo o ní ztrácí zájem (dále se na ni nepřihlašují). V důsledku této odlišnosti také provedli z mého pohledu poměrně spornou úpravu modelu, kterou ale můžeme ignorovat.
Až po tuto část by se námitky hledaly jen těžko. Jejich hledání ale svým dalším postupem usnadnila sama dvojice doktorandů z Princetonu. Jejich další postup se dá stručně popsat tak, že vzali data o hledanosti MySpace (sociální sítě považované za předchůdce Facebooku a dnes již zcela mrtvé) z Google Trends (o tom kolik srandy si s tímhle nástrojem můžete užít, jsem psal v Náboženství vs. Čokoláda) a použili je pro nastavení dynamiky modelu. Prostě reálnými daty o hledanosti proložili tu červenou čáru.
Se znalostí určených parametrů následně model nakrmili dosavadní hledaností slova „Facebook“ a nechali jej spočítat budoucí vývoj. Prostě ten samý tvar červené čáry přenesli na data Facebooku a podívali se, ve kterém roce (na ose x) se čára dostane na nulu.
Výsledek jste si potom koncem týdne mohli přečíst prakticky na každém, alespoň okrajově se internetem zabývajícím médiu – Facebook končí kolem roku 2017.
A proč tedy ten humbuk?
Máme tady článek, který pracuje s daty, je v angličtině, z Princetonu, se spoustou cizích slov a používá se v něm nějaký model. Sounds good, tak v čem je háček? Ve skutečnosti je jich hned několik a bude jednodušší rozdělit je na dvě skupiny háčků. První z nich pokrývá několik věcných připomínek, druhá potom otevírá otázku práce s daty obecně.
Když to vezmeme od začátku, tak je třeba se ptát, zda jsou data z Google Trends skutečně vhodným ukazatelem obliby těchto sítí a ekvivalentem schopným vyjádřit míru účasti populace na nich. Jedna z logických námitek proti tomuto tvrzení zní, že čím více má daná síť pravidelných uživatelů, tím méně by ji měli hledat přes Google. Pokud mám na Facebooku účet, půjdu přeci rovnou na facebook.com. Pravdou ale je, že toto příliš neplatí, stačí se podívat na nejvyhledávanější slova v Google v ČR (ne, že by ČR bylo měřítko, ale pro názornost to stačí).
Druhá věc, která stojí mimo pozornost původního článku je maličkost, které jsme si zvykli říkat mobilní internet. Podle zprávy Facebooku za Q3 2013 je na této síti již téměř 900 mil. uživatelů, kteří na ni pravidelně přistupují z mobilních zařízení. S tím jak se liší chování uživatelů s přístupem přes mobil a klasické pc obecně, se také liší jejich vyhledávací zvyklosti. Mobilní uživatelé pravděpodobně Facebook využívají spíše přes aplikace, ať už externí nebo integrované v jejich mobilních OS. A zatímco objem vyhledávání Facebooku na Google Trends od roku 2012 mírně klesá (což je v podstatě základem pro závěr učiněný v původním článku), jeho reálné využívání může vesele růst.
Druhá věc, která je vcelku na vodě je potom samotné srovnání s MySpace. Za prvé, o MySpace a Facebooku nejde uvažovat odděleně ve smyslu – hledanost MySpace se vyvíjela takhle a Facebooku se zatím vyvíjí takhle. Jsou to spojené nádoby. MySpace nezanikl nijak spontánně, sám od sebe. Facebook ho prostě zabil, i když ve chvíli, kdy přišla smrtící rána už měl MySpace sám problémů až až. V podstatě tak došlo k tomu, že z MySpace se nikdo „nevyléčil“, jen se nakazil dokonalejší „mutací“ – Facebookem. To ostatně dokladují i oblíbené objemy hledanosti těchto dvou sítí z Google Trends.
Když zmizíme my, tak Princeton taky!
Druhou skupinu námitek, které bych k draftu článku z Princetonu měl, za mě daleko lépe a zábavněji než bych to kdy dovedl já, shrnul Facebook sám. Ten totiž toto popíchnutí nenechal stranou své pozornosti a zavelel do protiútoku prostřednictvím jednoho ze svých „data guys“ – Mike Develina. Ten ve svém příspěvku na Facebooku ukázal, že pokud na to máte žaludek, najdete data, která vám podloží prakticky jakoukoliv hypotézu. V duchu stejné logiky, která byla aplikována na predikci ohledně Facebooku se podíval, zda existuje závislost mezi objemem vyhledávání termínu „Princeton“ a počtem přihlášek na tuto univerzitu. A zjistil, že existuje. Tedy spíše „existuje“ – koeficient shody modelu s daty 0,5 není v tomto konkrétním případě žádná hitparáda.
Následně zjistil, jak se vyvíjí hledanost Princetonu v Google Trends za poslední roky a dal si dvě a dvě dohromady – počet přihlášek na Princeton je tím nižší, čím nižš je hledanost termínu „Princeton“. A hledanost klesá. Následuje extrapolace časové řady a závěr, že Princeton je odsouzen k zániku nejdéle v roce 2021.
Ale s tím, že na Princetonu nebudou žádní studenti se Facebook nespokojil a na datech z Google Scholar se podíval na počty publikací této univerzity v poslední letech. Následoval obdobný scénář – od roku 2009 počty publikovaných článků klesají – prodloužení časové řady – závěr. Tímto tempem nebudou žádné publikované výsledky z Princetonu již kolem roku 2020.
Další závěry, včetně těch, že Princeton pravděpodobně brzy zmizí i z Facebooku a že do roku 2060 zřejmě zmizí vzduch ze země (!) si spolu s komentářem k výše uveřejněným grafům můžete přečíst v původním příspěvku na Facebooku.
Takže kdo tedy vymře a kdy to bude?
Jedno je (podle mě) jisté, v dohledné době se nechystá zmizet ani Facebook, ani Princeton. A nakonec ani vzduch na zemi. Bylo by ale chybou celou studii odsoudit a nic si z ní nevzít. Zvlášť v kontextu některých dalších čísel, která se o Facebooku poslední dobou objevují. Ta naznačují, že ačkoliv odliv uživatelů v rozsahu, který naznačují doktorandi z Princetonu, sice nehrozí, i tak čelí Facebook vážné generační hrozbě, kterou by neměl přehlížet, pokud nechce přehodit výhybku směrem MySpace.
Na grafu od statista.com, který zachycuje změny ve věkovém složení uživatelů Facebooku (podle jeho vlastní Social Ads Platform) je jasně vidět úbytek v nejmladších kategoriích 13-17 a 18-24. Opět je ale třeba zasadit tato čísla do širšího kontextu a jedním dechem uvést, že období ve kerém ke změně došlo zahrnuje tři roky (2011-2014) a uživatelé se tedy z těchto věkových kategorií přesunuli do těch starších. I tak je to ale problém, protože ačkoliv celkově Facebooku uživatelé neubývají, tak stárnou.
Podobný vývoj potvrzují i další výstupy, jako např. ten od istrategylabs.com. V případě, že se týmu kolem Marka Zuckerberga nepodaří tento trend včas zastavit, mohla by studie, která celou diskusi rozpoutala, náhle nabýt na aktuálnosti, protože je to právě nejmladší skupina uživatelů, která v případě sociálních sítí reprezentuje tzv. early-adopters.
Ve skutečnosti potom teenageři nemusí z Facebooku ani odcházet (jak nesprávně naznačuje titulek grafu ze statista.com). Úplně postačí, když si „noví, dorůstající teenageři“ budou stále častěji vybírat jinou komunikační platformu než je Facebook a začnou tuto nákazu šířit kolem sebe. Rychlá (a z hlediska PR mimořádně povedená) reakce Facebooku na článek z Princetonu dává ve světle těchto čísel ještě větší smysl. Jeho úkolem je totiž nejen trend „nepříchodu“ nových uživatelů z nejmladších věkových skupin zvrátit, ale také rozptýlit veškeré obavy (zejména inzerentů) o to, že k němu vůbec dochází.
Hodně dobře ty! 🙂
Je fascinující, přes kolik lidí musí ten článek projít, aby se reálně dostal do kanceláře deset metrů vedle :). Ale v každém případě díky moc!