csfd-header

Nikdo nemá čas sledovat špatné seriály

Už je to nějaký ten pátek, co skončila Hra o trůny i Černobyl a je na čase se rozhodnout, čím zaplníte to prázdné místo ve svém životě. Mluvím k vám, kteří jste odolali pokušení zaplnit jej tak patetickými aktivitami jako je sport, cestování, hra na lesní roh nebo osobní rozvoj.

Stejně jako Sheldon, i vy dobře víte, že vybrat si seriál je poměrně velký závazek, ke kterému byste neměli dojít bez rozmyslu. Všichni asi znáte ten pocit, kdy se na první pohled slibná série po několika epizodách či sezónách zvrhne v naprostou katastrofu (yep, looking at you Dexter) a vaše nemalá časová investice vezme za své. Díky datům, která se dají získat z ČSFD se ale všichni můžeme těmto tragickým okamžikům lidského života vyhnout.

Který z nejlepších seriálů je ten nejlepší?

Na tuto otázku samozřejmě nelze univerzálně odpovědět, protože každý má kritéria kvality nastavena po svém (dělám si samozřejmě srandu, je to Odpadlík). Jednou z variant jak stanovit, co je nejlepší, je spolehnout se na „moudrost davů“, kterou v tomto případě reprezentují hodnocení jednotlivých epizod na ČSFD. Řídit se jen pouhým průměrem epizod je ale problém, protože se vystavujete riziku, že si sice vyberete vysoce (průměrně) hodnocený seriál, ale jeho kvalita bude kolísat, nebo se, v nejhorším případě, stanete obětí „Dexterova efektu“ – vysoké průměrné hodnocení bude vyhnané skvělými úvodními sériemi, které pohřbí závěr.

Dole jsem připravil několik interaktivních vizualizací, které nabízí detailní pohled na top 300 seriálů podle jejich průměrného hodnocení na ČSFD. Konkrétně jsem se snažil vystihnout míru variability v hodnocení jednotlivých epizod a dát ji do kontextu s počtem epizod a průměrným hodnocením celého seriálu tak, aby bylo možné si vybrat ten „nejlepší“ – s rozumně vysokým hodnocením, malým rozdílem v hodnocení jednotlivých epizod a vyhovujícím počtem epizod.

Průměr vs. variabilita

Úvodní vizualizace ukazuje prvotní pohled, na všechny seriály právě z hlediska tří výše zmíněných kritériích. Každý bod reprezentuje jeden seriál, jehož průměrné hodnocení* epizod je vyneseno na ose y a směrodatná odchylka** hodnocení jednotlivých epizod na ose x. Směrodatná odchylka zde zastupuje informaci o variabilitě hodnocení a jednoduše řečeno, čím menší hodnota, tím menší jsou rozdíly mezi hodnocením jednotlivých epizod a naopak. Barva seriálu potom vyjadřuje počet epizod seriálu. Pro zjednodušení jsem seriály z hlediska počtu epizod rozdělil do čtyř skupin – krátké (maximálně 15 epizod), střední (16 až 50 epizod), dlouhé (51 až 100 epizod) a nekonečné (více než 100 epizod).

Pokud si chcete vybrat co nejlepší seriál, u nějž budete mít jistotu, že vás po dobu jeho sledování nezklame, stačí si jen určit, na jak dlouhý seriál máte chuť (filtr Length Category), který žánr preferujete (filtr Genre) a potom si najít ten, který je „nejvýš vlevo„. Má tedy nejvyšší průměrné hodnocení a kvalita jeho dílů nejméně kolísá. Po najetí na konkrétní seriál můžete zjistit jeho konkrétní průměrné hodnocení, směrodatnou odchylku a počet epizod.

*Průměrné hodnocení jednotlivých epizod je jiné číslo, než které figuruje jako hodnocení celého seriálu přímo na ČSFD. Tam máte totiž možnost hodnotit zvlášť seriál jako celek (toto číslo se objeví na ČSFD v profilu seriálu a podle něj také ČSFD řadí seriály v jeho žebříčku) a zvlášť každou jeho epizodu. S jejich průměrným hodnocením pracuji já. Například seriál Sherlock má jako celek na ČSFD hodnocení 91 %, průměrné hodnocení jeho epizod (které vidíte jak hodnocení seriálu v následujících vizualizacích) je ale „jen“ 86 %.

**Pro lepší ilustraci, co v tomto konkrétním případě představuje směrodatná odchylka, doporučuji následující příklad. Za určitých předpokladů by mělo platit, že zhruba 68 % epizod by se se svým hodnocením mělo vejít do vzdálenosti jedné směrodatné odchylky nad nebo pod průměrem. V praxi se tedy dá např. u seriálu Gangy z Birminghamu (Peaky Blinders), jehož půrměrné hodnocení je 91 a směrodatná odchylka 4 p.b. čekat, že 68 % z jeho třiceti epizod bude mít hodnocení v rozmezí od 87 do 95. A skutečně, do tohoto intervalu se vešlo 21 z 30 epizod. Tedy přesně 70 %.

Box & Whiskers

Alternativní pohled na jednotlivé seriálové tituly nabízí druhá vizualizace, která se více soustředí na variabilitu v hodnocení jednotlivých epizod. Ta je zachycena prostřednictvím klasických box plotů, které zároveň popisují, jak minimum a maximum, tak dolní a horní kvartil a medián. Seriály jsou seřazeny sestupně podle jejich průměrného hodnocení (které znázorňuje šedá čára), což lze změnit volbou parametru „Sort by (desc)“. Jako u předchozí vizualizace i tady lze vyfiltrovat jen seriály s určitým rozsahem počtu epizod a / nebo spadající do konkrétního žánru.

Epizody jedna po druhé

Dole je pohled, který klade větší důraz na hodnocení jednotlivých epizod (napříč sériemi). Seriály opět najdete seřazené podle jejich průměrného hodnocení (vyjádřené šedou čárou), což lze i zde změnit parametrem „Sort by (desc)“. I zde je možné omezit výběr jen na seriály z určitého žánru a v určité kategorii počtu epizod.

K-Means clustering

Vzhledem k tomu, že každý seriál je v podstatě charakterizován třemi proměnnými – průměrným hodnocením, směrodatnou odchylkou hodnocení epizod a počtem epizod, přirozeně se mezi nimi objevují dílčí skupiny seriálů, které jsou si z hlediska těchto tří kritérií podobné.

Tyto dílčí skupiny lze identifikovat pomocí shlukové analýzy. Konkrétní formou, kterou jsem vybral je K-Means clustering, který jednotlivé seriály přiřadí do shluků na základě jejich vzdálenosti od imaginárního středu shluku. Výsledkem tohoto algoritmu je osm skupin seriálů, které jsou znázorněné na vizualizaci dole. Ta je naprosto stejná jako ta úvodní (na osách jsou průměrné hodnocení seriálu a směrodatná odchylka), ale seriály jsou tentokrát obarvené podle jejich příslušnosti do konkrétních shluků.

Po pravdě je poměrně obtížné dát každému shluku nějaký reálný význam a odpovídající popis, nicméně několik z nich lze popsat celkem snadno.

Asi nejatraktivnější je shluk 0, který sdružuje nejlépe hodnocené (nad 90 %) seriály s nízkou variabilitou mezi jednotlivými epizodami a s relativně nízkým počtem epizod. Patří sem například klasiky jako Jistě, pane premiére, Mr. Bean nebo Taková normální rodinka. Dále potom hity jako Černobyl, Spartacus nebo Bratrstvo neohrožených a potom taky cokoliv s Davidem Attenboroughem.

Shluk 3 dal dohromady seriály s více než stovkou epizod (Teorie velkého třesku, Přátelé nebo Simpsonovi). Šestka jsou spíše delší, relativně hůře hodnocené (ale pořád se bavíme o ČSFD Top 300) seriály s vyšší variabilitou hodnocení epizod (Hra o trůny nebo Domek z karet) apod.

Tak jde čas

Poslední pohled, který nabízím, je potom graf vývoje hodnocení jednotlivých epizod tak, jak šly za sebou, pro konkrétní vybraný seriál (výběr lze provést přes filtr „name“). Modré pásmo znázorňuje přesně vzdálenost jedné směrodatné odchylky od průměru směrem nahoru i dolů (v něm by měla ležet většina epizod). U každého seriálu jsou vždy zobrazeny dva popisky hodnot. Ty označují epizody s nejnižším a nejvyšším hodnocením.

Ačkoliv se nesluší kopat do mrtvoly, doporučuji podívat se např. na vývoj hodnocení epizod seriálu Hra o trůny nebo si prostudovat postupně upadající úroveň seriálu Teorie velkého třesku.

Poznámky k datům, úpravám atd.

Rád bych předešel lynči své osoby za to, že některý z vašich oblíbených seriálů chybí, ve skutečnosti má jiný počet epizod apod. Proto ještě na závěr připojuji několik poznámek k samotným datům.

  • Celá analýza je založena na hodnocení jednotlivých epizod, která jsem sbíral ze profilu daného seriálu na ČSFD (např. pro Narcos by to byla tato stránka https://www.csfd.cz/film/56207-narcos/epizody/ ). Problém je, že ne každý z 300 nejlepších ČSFD seriálů nabízí i hodnocení jednotlivých epizod. U některých (např. Unplugged)je k dispozici jen hodnocení celého seriálu. V těchto případech seriál do analýzy zařazen nebyl (proto je jich ve výsledku méně než 300).
  • Některé epizody některých seriálů nebyly vůbec hodnoceny, proto do analýzy nevstupovaly a počet epizod seriálu tedy ve skutečnosti vyjadřuje počet epizod, které mají nějaké hodnocení na ČSFD. Např. u seriálu Šéfkuchařův stůl, vstoupily do analýzy jen epizody S01E01 až S03E01. Nikoliv ty od epizody S03E02 dále.
  • Simpsonovi, jako suverénně nejdelší seriál ve vybrané třístovce, jsem musel „oříznout“ a zahodit všechny epizody od čtrnácté série dále. Jde o to, že ještě několik dalších seriálů ve výběru má alespoň třináct sérií, ale čtrnáct a více už žádný a Simpsonovi by tím pádem celou analýzu zkreslovali.
  • Všechny vizualizace pohromadě, je možné si prohlédnout i samostatně na webu Tableau Public

Jako vždycky budu vděčný za jakýkoliv názor / komentář jak ohledně vašeho výběru seriálů, tak ohledně toho, co by se dalo zlepšit / upravit / vyhodit ze stávající analýzy.

Napsat komentář

Vaše e-mailová adresa nebude zveřejněna. Vyžadované informace jsou označeny *