Wizualizacja danych - czy na pewno wszystko jest jasne?

Wizualizacja danychWizualizacja danych to obecnie jeden z dynamiczniej rozwijających się trendów w zakresie ich prezentacji - i trudno się temu dziwić. Dotyczy on każdej rzeczywistości czerpiącej ze statystyki - firmowej, instytucjonalnej czy edukacyjnej. Dobrze zrealizowana wizualizacja potrafi znacznie skrócić czas efektywnego (twórczego) wnioskowania, gorzej jednak, gdy dajemy się ponieść wyobraźni i przedstawione przez nas zestawienia danych są mylące i nieczytelne.

Co zrobić, żeby nie wpaść w taką pułapkę? Nawet, jeśli wykonaliśmy już setki projektów, zawsze warto pamiętać o podstawowych zasadach, które pozwolą zracjonalizować model wizualizacyjny - począwszy od wyboru wykresu, po jego finalizację. Na każdym etapie projektu możemy wprowadzić niepotrzebny element, który będzie negatywnie rzutował na ostateczną klarowność jego wersji końcowej.

Uwaga ta wydaje się oczywista, jednak nawet pobieżny przegląd różnych wizualizacji pokazuje, że dość często gubimy się w realizacji projektów, przede wszystkim ulegając pokusie dodawania zbędnych ozdobników albo przez niedbałość i brak precyzji.

Zakładamy, że twórca wizualizacji chce, aby była ona prosta, przejrzysta oraz przekonująca (i co nie mniej ważne - interesująca). Zwróćmy zatem uwagę na to, o czym powinien pamiętać, a czego się wystrzegać.

Wizualizacja à la… Coco Chanel

Dokładnie tak - udana wizualizacja danych powinna być elegancka, a elegancja to przede wszystkim prostota. Tworząc wizualizację nie pomylimy się biorąc sobie do serca cenną radę słynnej kreatorki mody - "zanim wyjdziesz z domu, stań przed lustrem i zdejmij jedną rzecz". Wtedy będziemy mieć pewność, że żaden zbyteczny element nie zniweczy harmonii całej stylizacji (wizualizacji).

To niewiarygodne jak często o tym zapominamy, szczególnie wtedy, gdy przedmiotem naszej pracy jest projekt, który korzysta zarówno ze ściśle określonych wzorów i modeli, jak i (z mniejszej lub większej) dozy kreatywności.

Trudno nie zgodzić się z Edwardem Tufte (i nie chodzi tu jedynie o to, że jego koncepcje dotyczące prezentacji i analizy danych dały podwaliny pod ceniony przez biznes system QlikView). Nie mniej znane są jego wskazówki dotyczące dobrych praktyk w prezentacji danych.

W skrócie - wszystko zmierza do prostoty przekazu: przykładowo - optymalny wykres powinien zawierać maksimum informacji, zaprezentowanych w sposób najłatwiejszy do ich przyswojenia, w jak najkrótszym czasie. Aby było to możliwe, dane powinny być zapisane w jak najprostszej formie, bez mnożenia dodatkowych elementów. Między częściami wykresu zawsze powinna być zachowana hierarchia.

Wizualizacja danych w formie wykresu musi skupiać myśl, nie ją rozpraszać. To, co w każdej wizualizacji i następnie analizie danych najistotniejsze - informacja - nie może (w wyniku chaosu tworzących wykres elementów) ginąć pośród nich.

Nawet najładniej prezentujący się wykres, jeśli nie będzie przekaźnikiem istotnej dla projektu treści, stanie się tym, co Tufte nazywa "chartjunk" - wykresem śmieciowym.

Wykres. Twórca. Odbiorca

Twórcy projektów wizualizacyjnych zapominają o następnej oczywistej prawdzie - wizualizacja nie może być celem samym w sobie, nie spełni również swoich zadań, jeśli będzie czytelna tylko dla twórcy. Konieczne jest, by przy tworzeniu określonego projektu, miał realną świadomość tego, czy przekaz i użyte do realizacji projektu środki będą odpowiednio odebrane przez drugą stronę.

Chodzi przede wszystkim o abstrakcyjność symboliki, ale również o tak istotne elementy jak np. kolor użyty do podkreślenia jakiejś wartości lub zależności.

Jeśli nie mamy pewności, czy wykres zostanie prawidłowo odczytany przez odbiorcę - warto dodać do niego legendę, objaśniającą znaczenie różnych jego elementów (np. wielkości użytych znaków i ich kolorystyki).

Główne błędy w wizualizowaniu danych

Wizualizacja informacji niemal zawsze sprzyja lepszemu przyswojeniu komunikatów tekstowych - dlatego różnego rodzaju wykresy stały się nieodłączną częścią wszelkiego rodzaju prezentacji.

Rzeczywiście - mogą ułatwić percepcję danych, o ile same nie staną się źródłem błędnej interpretacji

Nader często twórcy wykresów popełniają takie błędy, jak np.: stosowanie nieczytelnych osi, dodawanie perspektywy rozmazującej prezentację danych, brak precyzji w prezentowaniu poszczególnych części wykresu (np. nanoszenie pewnych wartości począwszy od punktu zerowego, a kolejnych bez dbałości o to, by również znajdowały swój początek w tym punkcie - trudno w takim przypadku mówić o jakiejkolwiek wartości porównawczej obu elementów).

Chcąc zaprezentować zależności wielkościowe między dwoma obszarami danych często stosuje się różne symbole - np. jeden element mniejszy, drugi - większy. Taka wizualizacja bywa dla odbiorcy nieczytelna - zamiast zwiększać pole elementu, lepiej pokazać różnice wielkościowe za pomocą zwiększenia liczby takich samych elementów.

Na koniec słowo o budzących kontrowersje wykresach kołowych - niespecjalnie cenionych przez teoretyków prezentacji i analizy danych.

Koła są coraz powszechniej używane, szczególnie w wizualizacjach tworzonych na potrzeby mediów i masowego odbiorcy. Ich atutem jest atrakcyjny wygląd i… mała wizualna precyzja. Jeśli chce się osiągnąć określony cel "propagandowy" - łatwo posłużyć się właśnie takim wykresem.

Dane zaprezentowane przez określone pola w obrębie koła nie są dla odbiorcy zbyt klarowne - dodatkowo, jeśli zastosuje się odpowiednie kolory takich pól - będzie to dodatkowo mylący element. Kolory jasne mają to do siebie, że wizualnie odbierane są jako większe, ciemniejsze - jako mniejsze.

Warto zaznaczyć, że stosowanie wykresów kołowych prezentujących tylko dwie wartości (podzielonych jedynie na dwie części), jest błędna i wręcz niedopuszczalna z metodologicznego punktu widzenia.

Każda nieregularność kształtu działa również na niekorzyść prawidłowego odbioru wykresu.

O jakiej wizualizacji można z całą pewnością powiedzieć, że jest udana? Decyduje o tym jej zawartość: maksimum treści, minimum środków "wyrazu" i kompatybilność.

Artykuł powstał we współpracy ze specjalistami z firmy Datalab.

Komentarze


Interfejsy użytkownika w przemyśleAutomatyka jest dzisiaj nieodłącznym elementem przemysłu,


Inteligentny domLodówka, która sama wie, czego nam brakuje, drzwi, które doskonale wiedzą, kiedy mają si


Bootcampy onlineBootcampy online zyskują coraz większą liczbą zwolenników na całym świecie. To dos


Symulacja komputerowa Pojęcie symulacji zapożyczono do nauki z języka tradycyjnego. "Sy