Přestože si v hlavě pořád ještě přerovnávám tabulky a řadím si je podle důležitosti, sepsal jsem pravidla nebo spíš zjištění, které si z Perugie odvážím. A nejde přitom o to, jak ovládat některé programy a který z nich funguje nejlépe (což jsem se opravdu naučil), jako spíš o to hlavní, co z celého kurzu vyplynulo.
1. Data rozhodují
Vyjděte teď hned z domu na ulici a přemýšlejte. Taxi, které kolem vás projelo, musí mít licenci. Restauraci naproti určitě někdy někdo kontroloval, jak ta kontrola dopadla? Silnici, po které jdete, nedávno někdo opravil, kde na to vzal peníze? A ta paní naproti s tím velkým psem za něj určitě platí městu nějaké poplatky.
Všude kolem nás jsou čísla, tisíce nebo spíš miliony čísel uložených do databází. Je jich ohromující množství a dají se v nich najít neuvěřitelné příběhy. Právě schopnost hledat nová témata, kauzy a náměty na články v datech bude pro vývoj novin v příštích letech nejdůležitější. Novému oboru, který se tímhle zabývá, se říká datová žurnalistika.
I proto měla v Perugii hlavní slovo první Škola datové žurnalistiky. Pět dní na ní ti nejinovativnější novináři současnosti přednášeli, školili a vysvětlovali, proč a jak se noviny v posledních letech mění a jak by se změnit měli novináři v nich.
„Význam datové žurnalistiky jsem pochopil, když jsem viděl infografiku New York Times o Raphaelu Nadalovi. Rozebrali jeho forhend tak, že vám dojde, proč je prakticky neporazitelný.
Mirko Lorenz, grafik v Deutsche Welle
„Úplně první článek založený čistě na datech jsem udělal z databáze psů,“ vyprávěl v Perugii na jednom z workshopů novinář Steve Doig, držitel Pulitzerovy ceny za analýzu dat a jejich zpracování. Bylo to v osmdesátých letech a pracoval tehdy v americkém deníku The Miami Herald. „Viděl jsem venku běhat psy, tak mě napadlo si říct o jejich záznamy v databázích celého státu. Pak už jsem jen hledal v číslech, adresách a rasách. Byl z toho článek o tom, které psy mají lidé nejraději, kolik za ně utrácejí a jak rychle jich přibývá,“ popisoval Doig. Od té doby se datům věnuje a datovou žurnalistiku přednáší na univerzitě v Arizoně.
Díky bádání ve velkých datech objeví novináři věci, ke kterým by se standardní cestou nedostali. „Význam datové žurnalistiky jsem pochopil v okamžiku, kdy jsem viděl infografiku New York Times o Raphaelu Nadalovi. Je to asi dvouminutové video, ve kterém rozeberou Nadalův forhend tak, že vám dojde, proč je prakticky neporazitelný,“ vysvětluje další ze školitelů Mirko Lorenz, který se stará o interaktivní grafiky v Deutsche Welle. Kdyby se stejná data vzala a sepsala do klasického článku, patrně by to nikdo neotiskl, protože by se to nedalo číst.
Na workshopech se podrobně rozebíralo zpracování dat z Evropské unie. Pustily se do ní Financial Times ve spolupráci s Evropským investigativním centrem. Jejich cílem bylo najít, kam jdou peníze ze strukturálních fondů, na jaké konkrétní projekty se používají. A tak vyšlo najevo, že peníze šly například na účet firmám, které v té době vyšetřovala policie nebo byly prokazatelně napojené na mafii. Miliony eur tekly na výstavbu hotelů v chráněných přírodních oblastech na Kanárských ostrovech. Analýza dat tak ukázala věci, na které by novináři při běžném zkoumání nepřišli. Celou databázi včetně českých firem, které v uplynulých sedmi letech dostaly dotaci, najdete na adrese ft.com/eufunds.
2. Experimenty s počítačovou analýzou
Hlavními „hvězdami“ festivalu byli Simon Rogers, editor Datablogu britského deníku The Guardian, a Aron Pilhofer, šéf oddělení interaktivních zpráv The New York Times. Jsou tak trochu protipóly datové žurnalistiky.
Rogers, který získal loni cenu pro Nejinovativnějšího novináře současnosti, prosazuje ve zpracování dat rychlost. Pilhofer, který se sám nepovažuje za novináře, ale spíš za počítačového odborníka, se naopak zajímá hlavně o data a způsob jejich zpracování.
Oba se však shodnou, že každé noviny, které se chtějí vyvíjet, musejí mít vlastní datové oddělení. Liší se v tom, jak má být velké a k čemu se výsledek jejich práce použije. V obou případech jsou finální vizualizace úžasné. „Je nás v týmu čtrnáct a nikdo z nás není novinář. Všichni jsme spíš informatici,“ popisoval situaci v New York Times Pilhofer. „Ale to rozhodně nevadí. Novináři se k nám přidají v okamžiku, kdy v datech najdeme příběh. Jsme pro píšící redaktory úplně nový zdroj informací,“ vysvětloval.
Data jeho tým vyhledává, analyzuje, vizualizuje. Často vytvoří webovou aplikaci, která slouží jako zdroj informací několik let. „To, co děláme, byla ještě před pár lety sci-fi. A teď je to naprostá samozřejmost,“ dodal.
Simon Rogers se zabývá daty trochu jinak. Ukázal to na příkladu loňských nepokojů v Londýně a v dalších velkých městech. „Během několika hodin a dní se dělo hrozně moc věcí. Kolovaly nejrůznější fámy, nikdo pořádně nevěděl, co se stalo. Tak jsme vytvořili na Google Docs dokument, kam nám lidé psali, kde jsou, co tam viděli, co se tam právě děje,“ popisoval Rogers. Pak využili další z nástrojů Google Fusion Tables a veškerá data zanesli do mapy. Získali tak přehled a mohli začít psát zprávy. „Během chvíle si naši mapu zobrazilo přes sedm set tisíc lidí. Spousta z nich se divila, jak jsme něco takového mohli tak rychle udělat. Přitom to dokáže vytvořit každý za pár minut, opravdu jen minut, nikoli desítek minut,“ pokračoval Rogers.
„Pak začalo zatýkaní a my jsme samozřejmě chtěli vědět, co to je za lidi, odkud pocházejí, jestli jsou to muži nebo ženy, jestli už byli někdy zatčeni. Bohužel státní správě trvá velmi dlouho, než vám něco takového poskytne, jenže tohle jsou veřejná data, takže nám je museli vydat,“ vysvětlil další postup. Údaje o tisících zatčených rychle analyzovali a spojili místa zatčení s tím, jak bohatá ta která čtvrť je. A najednou bylo vše jasné. V té době totiž úřady oficiálně tvrdily, že nepokoje nesouvisejí s majetkem, s chudobou a bohatstvím. „Ale z naší mapy vyplynul pravý opak,“ dodal Rogers. Nepokoje byly jen v chudých čtvrtích.
Způsob zpracování londýnských nepokojů se stal vzorem datové žurnalistiky. Jeho podrobný rozbor včetně detailního rozebrání jednotlivých kroků pak popsal Rogers v Příručce datové žurnalistiky, kterou v Perugii slavnostně představili. Její podstatná část je na webu zdarma, stačí zajít na adresu: www.datajournalismhandbook.com.
Cílem datové žurnalistiky je jít mnohem víc do hloubky tématu. Hledá metody, které analyzují jevy a ukážou to, co není vidět na první pohled. „Dokážeme najít metody, které nikdy nikoho nenapadlo použít v žurnalistice. Tyto nové metody vezmete (jako třeba analýza textu), experimentujete s počítačovou analýzou a hledáte příběhy, jejich vývoj, kam věci směřují,“ doplnila Rogerse Sarah Cohenová, další žurnalistka ověnčená Pulitzerovou cenou, která vede datové oddělení amerického deníku Washington Post.
3. Tým pro moderní zpravodajství: novinář, grafik a počítačový odborník
Skoro na všechno už existují nástroje. Datová žurnalistika je úplně nový obor, který se ale rozvíjí tak strašně rychle, že to nikdo nečekal. Nástroje, které se nyní používají, už za pět let budou k ničemu, nahradí je nové, lepší, uživatelsky přívětivější. Navíc opravdu denně vzniká nějaký nový.
Informace o nich byly ostatně v Perugii nejčastějším námětem diskusí. Potřebujete nahrát video, nastříhat ho, doplnit ho o hudbu, fotky a ještě k němu psát texty? A nejlépe když to celé bude zadarmo a bude na tom moct pracovat několik lidí na různých místech světa naráz? Během pár minut se programů, které to umožňují, našlo hned několik. Některé dokonce přímo pro mobily.
Datová žurnalistika změnila i definici webového zpravodajství. „Je velký rozdíl mezi žurnalistikou, která je on-line, a on-line žurnalistikou. S datovou žurnalistikou se konečně začne rozlišovat, kdo píše zprávy na webu a kdo je doopravdy on-line novinář,“ tvrdí Aron Pilhofer.
Zpracovávání dat je budoucnost novin. Nejrůznějších dat je v redakcích i v současnosti přehršel. Většinou se ale používají jen jako doplněk k článkům, třeba jako tabulka. Podle Pilhofera je v současnosti nepochopitelné a neexistuje žádná omluva pro novináře, který denně nepoužívá nástroje a programy, jako je Excel nebo Google Fusion Tables. „Je to nutnost, povinnost. Bez těchto nástrojů nemůžete dělat seriózní žurnalistiku,“ říká s tím, že pokud se to novináři nenaučí, proteče jim mezi prsty spousta důležitých a překvapivých informací, aniž by si jich vůbec všimli. „Jsou redaktoři, kteří se asi dat bojí, a pak jsou tu ti, kteří věří v klasickou žurnalistiku,“ jinak si Pilhofer neumí vysvětlit, proč databáze nepoužívají. Nechápou, že smyslem datové analýzy je pomáhat vytvářet zprávy: je to jen další zdroj informací, ale lze na něm postavit celý článek. Může pomoci v práci, ale závěry musí vyvodit novináři.
Éra samostatných novinářů skončila, na řadě jsou týmy. „Na každé kauze ve Washington Post pracují minimálně tři lidé: novinář plus další specialisté. Jeden z nich musí velmi dobře rozumět tématu, jeden by měl být grafik a jeden počítačový odborník. Čas, kdy mohl pracovat jeden člověk na tématu, skončil,“ říká Sarah Cohenová.
Název jedné z diskusí zněl: Zachrání datová žurnalistika noviny? Všichni přítomní se nechápavě podivovali. Ne, analýza dat může jen podpořit noviny, ukázat jim novou cestu. Některé věci nejdou popsat a vysvětlit jinak než analýzou dat a jejich vizualizací. Tak jako to udělal Steve Doig v době, kdy analyzoval škody, které napáchal hurikán Andrew. Propojil dvě databáze: mapu, do níž zanesl, v jakých částech města bylo zničeno kolik budov a do ní zanesl sílu větru. Tím ukázal, kde za škody doopravdy může ničivý hurikán a kde špatně postavené budovy. Za to pak získal v roce 1993 Pulitzerovu cenu.
Podle Mirko Lorenze se část novin časem přetvoří v datový servis: „Lidé v nich budou hledat důvěryhodná data, základní servis pro své rozhodování.“ Ideálním příkladem takové práce je interaktivní vizualizace New York Times Koupit, nebo najmout byt?. V ní na první pohled vidíte, která z variant se vám vyplatí, případně za jak dlouho. Další příklad využití datové žurnalistiky pro servis: deník Los Angeles Sun stvořil sérii infografik „Do no harm“ () o nekvalitní péči v nemocnicích. Z oficiálních statistik získal počty zemřelých i důvody, kvůli kterým lidé umírají na omyly při operacích, zranění, infekce a nedbalé ošetřování způsobené v nemocnicích. Každý si teď může zjistit, do které nemocnice má či nemá raději chodit.
Datům a jejich zpracováním se logicky nebudou věnovat jen novináři, natož jen v obrovských médiích. V rámci festivalu se vyhlašovaly i nominace na nejlepší infografiku a článek založený na datech. Mezi padesáti osmi příklady tu najdete i výtvory z Ugandy, Keni, Afghánistánu. Celý seznam si můžete prohlédnout na www.ihned.cz/data. Z České republiky nebyl projekt žádný.
Britský deník The Guardian pomocí analýzy dat vyvrátil prohlášení policie, že se účastníci londýnských nepokojů svolávají na místa pomocí sociální sítě Twitter. Jak je vidět z grafů, o místech, kde se něco dramatického stalo, si na Twitteru psali lidé až po události. Jediný případ, kdy se hromadně svolali, bylo uklízení ulic po skončení zatýkání (černá křivka vpravo). Grafiku kliknutím zvětšíte