Facebook ví, kdy se zamilujete, rozejdete a co si potom pustíte.

Často se mluví a ještě častěji píše o tom, kolik má Facebook k dispozici našich osobních údajů, které na něj sami doslova házíme. Podstatně zajímavější než konspirační teorie o tom, jak jsou tato data nelegálně zneužívána, jsou ale ukázky toho, jak jsou kreativně (a zcela legálně) využívána.

Pro tyto účely slouží Facebooková stránka Facebook Data Science, která čas od času publikuje analýzy dat nasbíraných na profilech jednotlivých uživatelů. A rozhodně se nejedná jen o suchou statistiku. V jednom z posledních příspěvků „From Classmates to Soulmates“ se například zabývá tím, jak je pravděpodobné, že si svého životního partnera najdete na střední nebo vysoké škole. Láska a vztahy jsou pro tým analytiků Facebooku pravděpodobně velice fascinující, protože jak uvidíte, není to zdaleka jejich první příspěvek na toto téma.

Spolužáci na celý život?

Většina z nás má pravděpodobně na svém Facebookovém profilu vyplněnou informaci o tom, na kterou střední nebo vysokou školu jsme chodili. Nemálo z nás má na profilu také informaci o svém rodinném stavu a často uvedeno i jméno partnera. Pokud všechny tyto informace zkombinujeme, není problém (pokud si tedy odmyslíme, to, že musí někdo všechna ta data zpracovat) je vzít a dojít k následujícím závěrům.

15% zkoumaných uživatelů studovalo stejnou střední školu jako jejich současní životní partneři. Pokud jste ale chodili na střední školu na východním pobřeží (analýza pracuje pouze s data uživatelů z U.S.), pravděpodobnost toho, že se vaším životním partnerem stane bývalý spolužák/spolužačka klesá. Tento fakt je způsoben vyšší hustotou obyvatelstva resp. vyšším počtem středních škol v dané lokalitě.

Mapa středních škol v USA
Body reprezentují jednotlivé střední školy v USA obarvené podle pravděpodobnosti toho, že si student dané školy vybere za životního partnera někoho ze stejné školy. Červená znamená vysokou pravděpodobnost, modrá nízkou. | zdroj: Facebook Data Science

Vysoké školy přejí manželství ještě více. Podle té samé analýzy je totiž 28% vysokoškoláku sezdáno s někým, kdo promoval na stejné vysoké škole. Faktorů, které ovlivňují pravděpodobnost toho, že se dva absolventi konkrétní vysoké školy nakonec vezmou, je podle Facebook Data týmu několik. Jednak jde o poměr mužů a žen na škole (tento faktor by například značně diskvalifikoval Matfyz…) a o její velikost. Dále se také ukazuje, že zmíněná pravděpodobnost roste s tím, jak silně je daná vysoká škola nábožensky založena a zda mezi jejími studenty převládají konzervativci.

Mapa vysokých škol v USA
Body reprezentují jednotlivé vysoké školy v USA obarvené podle pravděpodobnosti toho, že si absolvent dané školy vybere za životního partnera někoho ze stejné školy. Červená znamená vysokou pravděpodobnost, modrá nízkou. Spojnice mezi body spojují školy s neobvykle vysokým počtem vzájemně sezdaných studentů | zdroj: Facebook Data Science

Poslední část analýzy se zabývá tím, na kterých vysokých školách je nejvyšší procento žen resp. mužů, které/kteří mají své partnery ze stejné vysoké školy. Co to přesně znamená se vysvětluje stejně složitě jako to zní, proto se pokusím shrnout závěry, ze kterých je to  snáze pochopitelné.

U žen jsou na předních příčkách technické univerzity, mezi jejímiž studenty jasně převažují muži. Možné vysvětlení je, že jako žena máte v takovém prostředí velké množství potenciálních partnerů a malou konkurenci. Pravděpodobnost, že z takové situace něco vzejde je tedy relativně vysoká. V konkrétním případě první univerzity tohoto ženského žebříčku – Rose Hulman Institute of Technology má 70% žen absolventů jako svého partnera absolventa právě této školy.

Univerzity s nejvyšším procentem žen majících za partnera bývalého spolužáka
Univerzity s nejvyšším procentem žen majících za partnera bývalého spolužáka | zdroj: Facebook Data Science

Zajímavá je situace u mužů. Žebříček škol, na kterých má nejvíce mužů za partnertky své bývalé spolužačky, totiž není obdobou toho ženského, jak by člověka mohlo napadnout. Na prvních příčkách, jsou zde univerzity s vyrovnaným poměrem studentů a studentek. Zřejmě ale nebude náhoda, že se na čelních příčkách často vyskytují školy jako „Faith Baptist Bible College and Theological Seminary“, na kterých se dá předpokládá relativně vyšší počet věřících studentů. Nemám po ruce žádnou statistiku, která by podpírala mou domněnku, nicméně myslím si, že např. počet partnerů, které tito studenti za život vystřídají bude nižší než v obecné populaci a je tím pádem pravděpodobnější, že to se svým partnerem, kterého potkali na škole dotáhnout až k manželství. Znovu ale upozorňuji, že jde jen o mou hypotézu a budu rád, pokud mě opravíte nebo nabídnete alternativní vysvětlení.

Univerzity s nejvyšší procentem mužů majících za partnerku bývalou spolužačku | zdroj: Facebook Data Science
Univerzity s nejvyšší procentem mužů majících za partnerku bývalou spolužačku | zdroj: Facebook Data Science

Původní článek, ve kterém autoři blíže vysvětlují metodiku a některá z ní vyplývající omezení ze stránek Facebook Data Science si můžete přečíst tady.

 Sezonalita vztahů – počkejte si na pondělí

Druhá analýza využívá informace o tom, zda jsou uživatelé Facebooku single nebo zadaní k tomu, aby odhalila období, kdy se lidé nejvíce dávají dohromady. V podstatě takovou vztahovou high season.

Základem celé analýzy je procentuální přírůstek či úbytek vztahů v daném období stanovený jako podíl počtu osob, které si v daném období změnili svůj stav na jednu z variant „ve vztahu“ a počtu osob, které si v změnili stav na jednu z variant „single“. Například na Valentýna změní svůj stav na „zadaný“ o 49% uživatelů víc než na „single“. Shodou okolností je právě na Valentýna tento čistý přírůstek nejvyšší. Ok, není to shoda okolností. Je to klišé až to bolí.

Zajímavější je, že poměrně vysoký je tento poměr i 25. prosince (34%). Valentýn a Vánoce vztahům zřejmě přejí. O 20% více vztahů také vzniká na Apríla, nicméně druhého dubna je naopak den s nejvyšší čistou rozchodovostí (11%). To ale podle mě svědčí pouze o tom, že spousta lidí považuje za vrchol své aprílové invence změnit si svůj stav na Facebooku na „zadaný“ a den na to prohlásit, že šlo o apríl. Což je smutné.

Celkově je ale duben pro vztahy spíše průměrný měsíc, jak je vidět z následujícího grafu. Ten byl zkonstruován tak, že pro každý den v roce byla vypočtena ona čistá procentuální změna stavů na zadaný nebo single a pro jednolitvé měsíce byly následně zkonstruovány boxploty.  Stručně a poněkud zjednodušeně – čím níže je boxplot tím nižší přírůstek (resp. vyšší úbytek) vztahů, čím je boxplot „menší“ tím méně se liší hodnoty jednotlivých dnů v měsíci. Barva vyjadřuje rozdíl daného měsíce oproti průměru roku, čím zelenější, tím výše je daný měsíc nad průměrem roku, pro červený odstín opačně. To vše pro tři věkové kategorie uživatelů 0-24, 25-44, 45+.

Boxploty pro denní hodnoty čistého přírůstku vztahů v daném měsíci pro danou věkovou kategorii | zdroj: Facebook Data Science
Boxploty pro denní hodnoty čistého přírůstku vztahů v daném měsíci pro danou věkovou kategorii | zdroj: Facebook Data Science

Pár závěrů vyplývajících z grafů. Za prvé, v létě máte solidní šanci, že dostanete kopačky ať je vám kolik chce. Za druhé s rostoucím věkem se zvyšuje rozpětí výsledků v rámci jednotlivých měsíců a také se do určité míry stírají rozdíly mezi měsíci samotnými (do pětadvaceti v tom máte jasno – přežít zimu ve vztahu, před prázdninami se rozejít a užívat si a kolem září se zase po někom poohlédnout, ale čím jste starší, tím náhodněji se scházíte a rozcházíte v průběhu celého roku)

Na stejná data se lze dívat nejen na měsíční bázi ale určitou sezonalitu lze pozorovat i v rámci týdne. Pro uživatele starší 25 let shodně platí, že nejvíce lidé oznamují svůj nový vztah v pondělí. S postupem týdne poté poměr nových vztahů a rozchodů klesá a v pátek se již překlápí ve prospěch rozchodů. U nejmladší věkové skupiny vzniká nejvíce vztahů již v neděli a největší rozchodovost nastává již ve čtvrtek.

Čistý procentuální přírůstek vztahů v jednotlivých dnech týdne | zdroj: Facebook Data Science
Čistý procentuální přírůstek vztahů v jednotlivých dnech týdne | zdroj: Facebook Data Science

Pokud se shodneme na tom, že nejvíce vztahů skutečně vzniká o víkendu, potom se podle mě dá tento posun vysvětlit skutečností, že mezi lidmi do 25ti let budou převažovat studenti, kteří příliš neodlišují všední dny a víkend, minimálně z pohledu aktivity na Facebooku. Své nové vztahy tak oznamují více méně ve stejný čas kdy skutečně vznikají. Jejich starší, většinou pracující kolegové se na Facebook hromadně vrhají po návratu do práce – v pondělí. Ale to je jen jedna z možných hypotéz.

Původní článek ze stránky Facebook Data Science si můžete přečíst zde.

Ne vždycky je to ale taková věda…

Důkazem toho, je poslední analýza, kterou chci představit. I když tentokrát je slovo analýza třeba brát skutečně s rezervou. Myšlenka za tím vším je skvělá – zjistit, co nejvíc poslouchají lidé po rozchodu a lidé, kteří jsou právě na začátku nového vztahu.

Přišlo by mi logické podívat se písničky, které na Facebooku nejvíce sdílí uživatelé, kteří si v posledním cca týdnu změnili svůj stav buď na „single“, nebo na „ve vztahu“. Tým výzkumníků Facebooku na to ale šel jinak a sledoval, které písničky nejvíce přehrávají uživatelé, kteří na Facebooku právě oznámili svůj status prostřednictvím hudební služby Spotify.

To by ale samo o sobě nebyl takový problém, jako to, že metodika celé analýzy je popsána jen velice stručně a povrchně a není tedy jasné, kdo jsou přesně analyzovaní uživatelé, ani co přesně znamená „nejvíce hrané“ písničky. V každém případě je mezi čerstvě zamilovanými údajně nejpopulárnější „Don’t Wanna Go Home“ (resp. byl v době analýzy), zatímco u čerstvě osamělých vede „The Cave“.

Kompletní žebříčky nejoblíbenějších skladeb mezi oběma skupinami uživatelů (spolu s připravenými playlisty pro Spotify) jsou uvedeny v původním příspěvku na stránce Facebook Data Science. Za mě můžu říct jen tolik, že poslech obou playlistů pro mě byl zážitek podobně příjemný jako šlápnutí na rezavý hřebík…

Napsat komentář

Vaše e-mailová adresa nebude zveřejněna. Vyžadované informace jsou označeny *