Praktyka umieszczania informacji w kontekście wizualnym, takim jak mapa lub wykres, aby ułatwić ludzkiemu mózgowi przyswojenie i wydobycie z nich pomysłów.
Głównym celem Dataviz jest ułatwienie identyfikacji wzorców, trendów i wartości odstających w ogromnych zbiorach danych. Wyrażenie to jest często używane zamiennie z innymi terminami, takimi jak grafika informacyjna, wizualizacja informacji i grafika statystyczna.
Dataviz, co to właściwie jest?
Dataviz to jeden z procesów nauki o danych, który stwierdza, że dane należy wizualizować po ich zebraniu, przetworzeniu i modelowaniu, aby można było wyciągnąć wnioski. Wizualizacja danych jest także elementem szerszej dziedziny architektury prezentacji danych (DPA), która stara się odkrywać, wydobywać, modyfikować, formatować i przesyłać dane w najbardziej odpowiedni sposób.
Wizualizacja danych jest niezbędna praktycznie w każdym zawodzie. Nauczyciele mogą go używać do wyświetlania wyników testów uczniów, specjaliści IT mogą go używać do ulepszania sztucznej inteligencji (AI), a kadra kierownicza może używać go do udostępniania informacji interesariuszom. Jest to również bardzo ważne w przypadku dużych projektów danych. Firmy potrzebowały sposobu na szybkie i łatwe uzyskanie wglądu w swoje dane, gdy gromadziły ich duże ilości we wczesnych latach trendu big data. Użycie narzędzi wizualizacyjnych przyszło naturalnie.
Z podobnych powodów wizualizacja jest niezbędna w zaawansowanej analityce. Kiedy analityk danych opracowuje złożone algorytmy analizy predykcyjnej lub uczenia maszynowego, istotne jest wyświetlenie wyników w celu monitorowania wyników i potwierdzenia, że modele działają zgodnie z oczekiwaniami. Dzieje się tak dlatego, że reprezentacje złożonych algorytmów są często łatwiejsze do zrozumienia niż wyniki numeryczne.
Dlaczego Dataviz jest ważny?
Wizualizacja danych to szybkie i skuteczne podejście do uniwersalnej prezentacji informacji poprzez wykorzystanie danych wizualnych.
Metoda ta może również pomóc firmom określić, które aspekty wpływają na zachowanie klientów, zidentyfikować obszary, którymi należy się zająć lub poświęcić więcej uwagi, sprawić, że dane będą lepiej zapamiętywane dla interesariuszy, zrozumieć, kiedy i gdzie wdrożyć określone produkty oraz prognozować wielkość sprzedaży.
Oto kilka dodatkowych korzyści Dataviz:
- umiejętność szybkiego trawienia informacji, rozwijania pomysłów i szybszego podejmowania decyzji; lepsza wiedza na temat kolejnych kroków, które należy podjąć, aby ulepszyć biznes; oraz lepszą zdolność do utrzymywania zainteresowania odbiorców informacjami, które są w stanie zrozumieć.
- prosta dystrybucja informacji, która zwiększa potencjał wszystkich uczestników w zakresie wnoszenia pomysłów;
- badacze danych nie są już potrzebni, ponieważ dane są bardziej dostępne i zrozumiałe; istnieje także większa możliwość szybkiego reagowania na wyniki, a co za tym idzie, osiągania sukcesu z większą szybkością i mniejszą liczbą błędów.
Dataviz i duże zbiory danych
Rosnąca popularność inicjatyw związanych z dużymi zbiorami danych i analizą danych sprawiła, że potrzeba wizualizacji jest silniejsza niż kiedykolwiek. Firmy szybko wykorzystują uczenie maszynowe do gromadzenia ogromnych ilości danych, których sortowanie, interpretowanie i wyjaśnianie może być trudne i czasochłonne. Wizualizacja zapewnia mechanizm przyspieszający ten proces i przekazujący informacje właścicielom firm i interesariuszom w sposób dla nich zrozumiały.
Wizualizacja dużych zbiorów danych często wykracza poza tradycyjne podejścia do wizualizacji, takie jak wykresy kołowe, histogramy i wykresy biznesowe. Wykorzystuje bardziej złożone narzędzia wizualne, takie jak mapy ciepła i wykresy gorączki. Wizualizacja dużych zbiorów danych wymaga użycia wydajnych systemów obliczeniowych do gromadzenia surowych danych, przetwarzania ich i przekształcania w graficzną reprezentację, na podstawie której ludzie mogą szybko wyciągać wnioski.
Chociaż wizualizacja dużych zbiorów danych może być korzystna, może również wiązać się z szeregiem wad dla firm. Jako przykład, oto kilka:
- Aby w pełni wykorzystać technologie wizualizacji dużych zbiorów danych, musisz zatrudnić specjalistę od wizualizacji.
Specjalista ten powinien być w stanie określić optymalne zbiory danych i metody wizualizacji, aby zapewnić firmom maksymalne wykorzystanie swoich danych. - Ponieważ wizualizacja dużych zbiorów danych wymaga wydajnego sprzętu komputerowego, wydajnych systemów przechowywania i ewentualnego przejścia do chmury, działy IT i kierownictwo często angażują się w inicjatywy związane z wizualizacją dużych zbiorów danych.
- Wizualizacja Big Data nie jest w stanie dostarczyć informacji tak dokładnych, jak prezentowane dane.
Dlatego istotne jest posiadanie ludzi i systemów do nadzorowania i kontrolowania jakości danych, metadanych i źródeł danych firmy.
Kilka przykładów Dataviz
Początkowo najpopularniejszą strategią wizualizacji było użycie arkusza kalkulacyjnego Microsoft Excel do przełożenia informacji na tabelę, wykres słupkowy lub wykres kołowy. Chociaż podstawowe podejścia do wizualizacji są nadal szeroko stosowane, dostępne są również bardziej złożone techniki, takie jak poniższe:
- infografiki
- chmury bąbelkowe
- wykresy punktorowe
- Mapy ciepła
- wykresy gorączki
- wykresy szeregów czasowych
Inne popularne techniki obejmują następujące.
Wykresy liniowe
Jest to jedna z najbardziej podstawowych i często stosowanych procedur.
Wykresy liniowe pokazują, jak zmienne zmieniają się w czasie.
Wykresy obszarowe.
Jest to odmiana wykresu liniowego, który wyświetla wiele wartości w szeregu czasowym – czyli sekwencję danych zebranych w kolejnych okresach i równomiernie rozmieszczonych w czasie.
Wykresy z dyspersją.
Metoda ta pozwala wykazać związek pomiędzy dwiema zmiennymi.
Wykres punktowy ma oś x i oś y z punktami reprezentującymi punkty danych.
Mapy drzew.
Takie podejście umożliwia wyświetlanie danych hierarchicznych w sposób zagnieżdżony.
Rozmiar prostokąta każdej kategorii jest proporcjonalny do jego procentu całości.
Mapy drzew sprawdzają się dobrze, gdy istnieje wiele kategorii, a celem jest porównanie różnych aspektów całości.
Piramidy populacyjne
Technika ta wykorzystuje skumulowany wykres słupkowy, aby pokazać złożoną narrację społeczną populacji.
Jest to szczególnie przydatne przy opisywaniu rozmieszczenia populacji.
Typowe przypadki użycia wizualizacji danych
Przykłady typowych przypadków użycia wizualizacji danych obejmują:
Marketing i sprzedaż.
Według badań Magna do 2020 roku 50% wszystkich światowych wydatków na reklamę zostanie wydane w Internecie.
Dlatego zespoły marketingowe muszą zwracać szczególną uwagę na źródła ruchu w sieci i pieniądze generowane przez ich domeny internetowe.
Wizualizacja danych ułatwia dostrzeżenie trendów ruchu wynikających z działań marketingowych w czasie.
Polityka.
Mapa geograficzna pokazująca, na którą partię głosował każdy stan lub okręg, jest typowym zastosowaniem wizualizacji danych w polityce.
Zdrowie.
Choroplety są powszechnie używane przez pracowników służby zdrowia do zilustrowania ważnych danych zdrowotnych.
Kartogram przedstawia obszary lub regiony geograficzne, które zostały oznaczone kolorami na podstawie wartości liczbowej.
Specjaliści mogą korzystać z kartogramów, aby zobaczyć, jak zmienna, np. współczynnik śmiertelności z powodu chorób serca, zmienia się na różnych terytoriach.
Naukowcy.
Wizualizacja naukowa, w skrócie SciVis, pozwala naukowcom i badaczom zrozumieć dane eksperymentalne lepiej niż kiedykolwiek wcześniej.
Finanse.
Podejmując decyzję o zakupie lub sprzedaży składnika aktywów, specjaliści finansowi muszą monitorować realizację swoich decyzji inwestycyjnych.
Wykresy świecowe są wykorzystywane jako narzędzia handlowe, pomagające specjalistom finansowym analizować zmiany cen w czasie i wyświetlające istotne informacje, takie jak papiery wartościowe, instrumenty pochodne, waluty, akcje, obligacje i surowce.
Analitycy danych i eksperci finansowi mogą wykrywać trendy, oceniając zmiany cen w czasie.
Logistyka.
Firmy spedycyjne mogą używać narzędzi wizualizacyjnych do odkrywania optymalnych tras żeglugi na całym świecie.
Badacze i badacze danych
Analitycy danych często tworzą wizualizacje na własny użytek lub w celu rozpowszechniania informacji wśród małej grupy osób.
Reprezentacje wizualne tworzone są przy użyciu pakietów wizualizacji z języków programowania i wybranych przez nich narzędzi.
Analitycy i badacze danych zazwyczaj korzystają z języków programowania typu open source, takich jak Python, lub zastrzeżonych narzędzi do analizy danych.
Ci naukowcy i badacze korzystają z wizualizacji danych, aby lepiej analizować zbiory danych i znajdować wzorce i trendy, które w przeciwnym razie nie zostałyby zgłoszone.
Nauka Dataviz
Zrozumienie, w jaki sposób ludzie zbierają i interpretują informacje, jest podstawą nauki o wizualizacji danych.
Amos Tversky i Daniel Kahn pracowali nad badaniami, które uwypukliły dwa różne podejścia do pozyskiwania i analizowania informacji.
System 1 dotyczy szybkiego, automatycznego, nieświadomego przetwarzania mentalnego.
Strategia ta jest powszechnie stosowana w życiu codziennym i pozwala osiągnąć następujące cele:
- Przeczytaj język znaku
- rozwiązywać podstawowe problemy matematyczne, takie jak 1+1,
- zidentyfikować źródło dźwięku
- jeździć na rowerze
- określić różnicę między kolorami.
System 2 koncentruje się na przetwarzaniu poznawczym, które jest powolne, racjonalne, wyrachowane i rzadkie.
Podejście to stosuje się w dowolnej z następujących sytuacji:
- zapamiętaj numer telefonu
- wykonuj skomplikowane zadania matematyczne, takie jak 132 x 154
- rozróżnić znaczenie kilku znaków umieszczonych obok siebie
- rozumieć złożone sygnały społeczne.
https://www.youtube.com/watch?v=DlG7ZzRaJLc
Narzędzia i dostawcy Dataviz
Narzędzia do wizualizacji danych można wykorzystywać na wiele sposobów.
Obecnie najbardziej rozpowszechnionym zastosowaniem jest narzędzie raportowania Business Intelligence (BI).
Użytkownicy mogą konfigurować narzędzia wizualizacyjne w celu tworzenia automatycznych pulpitów nawigacyjnych, które graficznie śledzą i oceniają wyniki biznesowe w oparciu o kluczowe wskaźniki wydajności (KPI). Utworzone obrazy mogą mieć także funkcje interaktywne, dzięki czemu użytkownicy mogą je modyfikować lub głębiej zagłębiać się w dane w celu badań i analiz. Można również uwzględnić wskaźniki ostrzegające użytkowników o aktualizacji danych lub spełnieniu z góry określonych warunków.
Do monitorowania własnych inicjatyw kilka działów firmy korzysta z oprogramowania do wizualizacji danych. Na przykład zespół marketingowy może używać programu do śledzenia skuteczności kampanii e-mailowej i śledzenia danych, takich jak współczynnik otwarć, współczynnik klikalności i współczynnik konwersji.
W miarę jak firmy zajmujące się wizualizacją danych rozszerzają funkcjonalność swoich produktów, są one coraz częściej wykorzystywane jako interfejsy dla bardziej wyrafinowanych środowisk Big Data. W tym kontekście oprogramowanie do wizualizacji danych pomaga inżynierom i naukowcom śledzić źródła danych i przeprowadzać podstawowe badania eksploracyjne na zbiorach danych przed lub po dalszych badaniach.
Microsoft, IBM, SAP i SAS to jedne z najbardziej znanych nazw na rynku narzędzi Big Data.
Inni producenci oferują wyspecjalizowane narzędzia do wizualizacji dużych zbiorów danych, a najbardziej znane nazwy w tej branży to Tableau, Qlik i Tibco. Chociaż Microsoft Excel pozostaje popularną aplikacją do wizualizacji danych, pojawiły się inne, które oferują bardziej zaawansowane możliwości:
- IBM Cognos Analytics
- Qlik Sense i QlikView
- Microsoft PowerBI
- Analizator wizualny Oracle
- SAP Lumira
- Analiza wizualna SAS
- Ogień Tibco
- Analityka Zoho
- D3.js
- Jowisz
- Mikrostrategia
- Wykresy Google