Bardzo często wykresy dotyczące zachorowań na koronawirusa w poszczególnych krajach są błędnie interpretowane. Polski Instytut Ekonomiczny, publiczny think tank, napisał przejrzystą instrukcję, jak robić to dobrze.
Od chwili, gdy epidemia SARS-CoV-2 zaczęła rozprzestrzeniać się również poza Chinami, furorę w internecie i wszelkich opracowaniach czy wizualizacjach danych koronawirusowych zaczęły robić wykresy skumulowanej liczby przypadków na względnej osi czasu. Mowa tutaj o popularnych wykresach, w których kraje startują zazwyczaj od liczby 100 potwierdzonych przypadków.
Wykresy te są często komentowane i omawiane w prasie oraz mediach społecznościowych. Jednak zadziwiająco często są one interpretowane po prostu błędnie, również przez osoby z przysłowiowego świecznika.
Dlatego też, w nadziei, że przynajmniej część tych mylnych interpretacji uda się wyeliminować, przedstawiamy instrukcję, punkt po punkcie, jak takie wykresy należy czytać i jakie wnioski można z nich wyciągać.
Względna i bezwzględna oś czasu
Oś pozioma: W najbardziej popularnej wersji omawianych wykresów czas na osi poziomej jest względny (zazwyczaj od pierwszego dnia od potwierdzenia 100 przypadków); inną możliwością jest odłożenie na osi poziomej czasu w jednostkach bezwzględnych.
W przypadku tych pierwszych każdy punkt na osi poziomej należy rozumieć jako n-ty dzień epidemii, niezależnie od momentu, w którym dokładnie zaczęła się ona w danym kraju.
W przypadku tych drugich każdemu punktowi na osi poziomej odpowiada konkretna, kalendarzowa data. Porównanie tych dwóch typów wykresów na przykładzie wybranych europejskich krajów przedstawiono na wykresie 8.
Bezwzględna oś czasu pozwala w łatwy sposób stwierdzić, w których krajach epidemia rozpoczęła się wcześniej. Wykres 8a pokazuje na przykład, że przyrost zachorowań we Włoszech nastąpił wcześniej niż w innych krajach.
Z drugiej strony, względna oś czasu pozwala zauważyć, w których krajach epidemia rozwija się szybciej. Widzimy na przykład, że w Hiszpanii to tempo jest wyższe niż w innych krajach, a np. Włochy i Niemcy podążają praktycznie tą samą ścieżką liczby przypadków, a różnica w dzisiejszej, bezwzględnej liczbie wynika z tego, że we Włoszech epidemia rozpoczęła się po prostu wcześniej.
Motywacją do przedstawiania przebiegu epidemii na względnej osi czasu jest fakt, że na początku, gdy koronawirus dopiero zaczynał „wojaże międzynarodowe”, w wielu krajach notowane były odosobnione, pojedyncze przypadki. Byli to zarażeni przybywający zza granicy, a choroba nie była jeszcze endemiczna (czyli nie byłaby w stanie rozprzestrzeniać się bez przypadków z zewnątrz).
Dla przykładu, we Francji pierwszy przypadek potwierdzono już 24 stycznia, ale miesiąc później przypadków było raptem kilkanaście. Sto przypadków to liczba umowna, jednak patrząc na oficjalne dane dobra granica, przy której epidemia w konkretnym kraju stawała się endemiczna, a liczba nowych przypadków zaczynała rosnąć wykładniczo, zgodnie z teorią znaną z modeli epidemiologicznych (przynajmniej przez kilkanaście początkowych dni).
Drugą motywacją dla zastosowania względnej osi czasu jest fakt, że epidemia w niektórych krajach rozpoczynała się wcześniej, a w innych trochę później. Dla przykładu, we Włoszech próg 100 przypadków przekroczono 23 lutego, podczas gdy w Polsce dopiero 14 marca.
Względna oś czasu pozwala nam zatem porównywać rozwój COVID-19 między krajami licząc od początku epidemii, niezależnie od tego, kiedy się ona w danym kraju zaczęła.
>>> Czytaj też: Prosty sposób na to, jak pomóc polskim firmom w kryzysie i dać zarobić drobnym inwestorom
Skala logarytmiczna
Oś pionowa, skala: Na początku, gdy liczba zachorowań w poszczególnych krajach była względnie niska, powszechnie wykorzystywano skalę liniową. Jednak wraz ze wzrostem liczby przypadków, coraz bardziej popularna stawała się wersja logarytmiczna.
Zawsze przy analizie wykresów należy zatem patrzeć na oznaczenia osi pionowej. Jeśli odległości między wartościami są proporcjonalne, mamy do czynienia ze skalą liniową. Jeśli kolejnym setkom czy tysiącom zachorowań odpowiadają coraz krótsze odcinki, wykres jest w skali logarytmicznej.
Zaobserwować to można na wykresie 9. Obrazuje on, że skala logarytmiczna, w odróżnieniu od skali liniowej, pozwala jednocześnie porównywać kraje o dużej i małej skumulowanej liczbie przypadków.
Wykresy w skali logarytmicznej mogą być jednak mylące, gdyż ich wypłaszczanie z czasem (jak na wykresie 9b) bywa interpretowane jako spadek liczby zachorowań, a że nie jest to prawdą dobitnie pokazuje przecież wykres 9a. Wypłaszczanie krzywej zachorowań na skali logarytmicznej oznacza tyle, że codzienne przyrosty procentowe zaczynają maleć, a liczba nowych przypadków przestaje rosnąć w sposób wykładniczy. Nie oznacza to jednak, że bezwzględna liczba codziennie diagnozowanych nowych chorych również zaczyna maleć. Ta co do zasady wciąż rośnie w praktycznie wszystkich europejskich krajach.
Skumulowana liczba przypadków
Oś pionowa, wartości: Zdecydowana większość wykresów skumulowanej liczby przypadków, niezależnie od tego, czy na względnej, czy bezwzględnej osi czasu oraz niezależnie, czy w skali liniowej, czy logarytmicznej odnosi się do bezwzględnej liczby przypadków, bez uwzględnienia wielkości populacji.
Niby oczywistym wydaje się, że porównywanie na przykład 10-milionowej Szwecji z prawie 40-milionową Polską pod względem bezwzględnej liczby przypadków jest dość problematyczne. A jednak powszechną opinią wygłaszaną ostatnio na podstawie wykresów podobnych do wykresu 9b było, że Polska podąża tą samą ścieżką rozwoju epidemii co Szwecja.
Nie jest to najszczęśliwsza interpretacja, gdyż choć mamy ze Szwedami podobną skumulowaną liczbę potwierdzonych przypadków, to względnie licząc problem jest cztery razy mniejszy.
Wyraźnie to widać, jeśli zamiast skumulowanej liczby przypadków porównamy skumulowane zapadalności (na względnej osi czasu od pierwszego dnia, w którym skumulowana zapadalność przekroczyła 2,5 na milion mieszkańców, co w przybliżeniu odpowiada 100 przypadkom w Polsce (wykres 10).
Widać, że trajektoria Polski dużo bardziej przypomina trajektorię grecką niż szwedzką, a porównywanie Polski i Szwecji na tym etapie epidemii chyba nie jest zasadne. Ogólnie jeśli chcemy porównywać między sobą kraje znacznie różniące się liczbą ludności, należałoby to robić na podstawie współczynników zapadalności, a nie bezwzględnej liczby przypadków.
Mała liczba testów, nieufność społeczeństwa do systemu ochrony zdrowia, niska liczba lekarzy i pielęgniarek i tym podobne czynniki mogą sprawiać, że rozbieżność między rzeczywistą liczbą przypadków a oficjalną będzie wysoka. Wciąż jednak dane oficjalne są jedynymi, które mamy i co do zasady jedynymi, które analizujemy.
>>> Czytaj też: Dane z Google pokazują, czego obawiają się dziś Polacy. 5 wykresów typowych dla czasu epidemii