인간의 두뇌가 아이디어를 더 쉽게 흡수하고 추출할 수 있도록 지도나 그래프와 같은 시각적 맥락에 정보를 배치하는 행위입니다.
Dataviz의 주요 목표는 대규모 데이터 세트에서 패턴, 추세 및 이상값을 더 쉽게 식별할 수 있도록 하는 것입니다. 이 문구는 정보 그래픽, 정보 시각화, 통계 그래픽 등 다른 용어와 같은 의미로 사용되는 경우가 많습니다.
Dataviz, 정확히 무엇인가요?
Dataviz는 결론을 도출할 수 있도록 데이터를 수집, 처리 및 모델링한 후 시각화해야 함을 명시하는 데이터 과학 프로세스 중 하나입니다. 데이터 시각화는 가능한 한 효율적인 방식으로 데이터를 검색, 추출, 수정, 형식화 및 전송하기 위해 노력하는 광범위한 데이터 프레젠테이션 아키텍처(DPA) 분야의 구성 요소이기도 합니다.
데이터 시각화는 거의 모든 직업에 필수적입니다. 교사는 학생의 시험 점수를 표시하는 데 사용할 수 있고, IT 전문가는 인공지능(AI)을 개선하는 데 사용할 수 있으며, 경영진은 이해관계자와 정보를 공유하는 데 사용할 수 있습니다. 이는 대규모 데이터 프로젝트에서도 매우 중요합니다. 기업은 빅 데이터 트렌드 초기에 대량으로 축적된 데이터에 대한 통찰력을 빠르고 쉽게 얻을 수 있는 방법이 필요했습니다. 시각화 도구의 사용은 자연스럽게 이루어졌습니다.
비슷한 이유로 고급 분석에서는 시각화가 필수적입니다. 데이터 과학자가 복잡한 예측 분석 또는 기계 학습 알고리즘을 개발하는 경우 결과를 모니터링하고 모델이 예상대로 작동하는지 확인하기 위해 결과를 표시하는 것이 필수적입니다. 이는 복잡한 알고리즘의 표현이 수치 출력보다 이해하기 쉬운 경우가 많기 때문입니다.
Dataviz가 왜 중요한가요?
데이터 시각화는 시각적 데이터를 사용하여 정보를 보편적으로 표현하는 빠르고 효과적인 접근 방식입니다.
이 방법은 또한 기업이 고객 행동에 영향을 미치는 측면을 결정하고, 해결해야 하거나 더 많은 주의를 기울여야 하는 영역을 식별하고, 이해관계자가 데이터를 더 기억에 남도록 만들고, 특정 제품을 언제 어디서 배포해야 하는지 이해하고 판매량을 예측하는 데 도움이 될 수 있습니다.
Dataviz의 추가 이점은 다음과 같습니다.
- 정보를 신속하게 소화하고, 아이디어를 개발하고, 보다 신속하게 결정을 내리는 능력; 비즈니스 개선을 위해 취해야 할 다음 단계에 대한 더 나은 지식 청중이 이해할 수 있는 정보로 관심을 유지하는 더 나은 능력.
- 모든 참가자의 아이디어 기여 가능성을 높이는 간단한 정보 배포;
- 데이터에 더 쉽게 접근하고 이해하기 쉽기 때문에 데이터 과학자는 더 이상 필요하지 않습니다. 결과에 따라 신속하게 조치를 취할 수 있는 능력이 향상되어 더 빠른 속도와 더 적은 오류로 성공을 달성할 수 있습니다.
Dataviz와 빅데이터
빅데이터 및 데이터 분석 이니셔티브의 인기가 높아지면서 시각화에 대한 필요성이 그 어느 때보다 강력해졌습니다. 기계 학습은 정렬, 해석 및 설명이 어렵고 시간이 많이 소요될 수 있는 방대한 양의 데이터를 수집하기 위해 기업에서 빠르게 사용되고 있습니다. 시각화는 이 프로세스를 가속화하고 비즈니스 소유자 및 이해관계자가 이해할 수 있는 방식으로 정보를 전달하는 메커니즘을 제공합니다.
빅 데이터 시각화는 원형 차트, 히스토그램, 비즈니스 그래프와 같은 전통적인 시각화 접근 방식을 뛰어넘는 경우가 많습니다. 히트 맵 및 발열 차트와 같은 보다 복잡한 시각적 도구를 사용합니다. 빅 데이터 시각화를 위해서는 강력한 컴퓨팅 시스템을 사용하여 원시 데이터를 수집하고 처리한 후 인간이 신속하게 결론을 도출하는 데 사용할 수 있는 그래픽 표현으로 변환해야 합니다.
빅데이터 시각화는 이점이 있을 수 있지만 기업에는 여러 가지 단점이 있을 수도 있습니다. 예를 들면 다음과 같습니다.
- 빅데이터 시각화 기술을 최대한 활용하려면 시각화 전문가를 고용해야 합니다.
이 전문가는 기업이 데이터 활용을 극대화할 수 있도록 최적의 데이터 세트와 시각화 방법을 결정할 수 있어야 합니다. - 빅 데이터 시각화에는 강력한 컴퓨팅 하드웨어, 효율적인 스토리지 시스템 및 클라우드로의 전환이 필요하기 때문에 IT 및 경영진이 빅 데이터 시각화 이니셔티브에 참여하는 경우가 많습니다.
- 빅데이터 시각화는 제시된 데이터만큼 정확한 정보를 제공할 수 없습니다.
따라서 회사의 데이터, 메타데이터 및 데이터 소스의 품질을 감독하고 제어할 수 있는 인력과 시스템을 갖추는 것이 필수적입니다.
Dataviz의 몇 가지 예
처음에 가장 일반적인 시각화 전략은 Microsoft Excel 스프레드시트를 사용하여 정보를 테이블, 막대 그래프 또는 원형 차트로 변환하는 것이었습니다. 기본 시각화 접근 방식이 여전히 널리 사용되고 있지만 다음과 같은 보다 복잡한 기술도 사용할 수 있습니다.
- 인포그래픽
- 거품 구름
- 글머리 기호 그래프
- 히트맵
- 발열 차트
- 시계열 차트
다른 인기 있는 기술은 다음과 같습니다.
꺾은선형 차트
이것은 가장 기본적이고 자주 사용되는 절차 중 하나입니다.
선 차트는 시간에 따른 변수의 변화를 보여줍니다.
영역 그래프.
이는 시계열의 많은 값을 표시하는 꺾은선형 차트의 변형입니다. 즉, 연속된 기간에 동일한 간격으로 수집된 일련의 데이터를 표시하는 것입니다.
분산이 있는 그래프.
이 방법을 사용하면 두 변수 사이의 연관성을 보여줄 수 있습니다.
분산형 차트에는 데이터 포인트를 나타내는 포인트가 포함된 x축과 y축이 있습니다.
나무 지도.
이 접근 방식을 사용하면 계층적 데이터를 중첩된 방식으로 표시할 수 있습니다.
각 범주의 직사각형 크기는 전체에서 차지하는 비율에 비례합니다.
트리 맵은 여러 범주가 있고 전체의 다양한 측면을 비교하는 것이 목표일 때 잘 작동합니다.
인구 피라미드
이 기술은 누적 막대 차트를 사용하여 인구의 복잡한 사회적 서술을 보여줍니다.
이는 인구 분포를 설명할 때 특히 유용합니다.
일반적인 데이터 시각화 사용 사례
데이터 시각화에 대한 일반적인 사용 사례의 예는 다음과 같습니다.
마케팅과 판매.
Magna 연구에 따르면 2020년까지 전 세계 광고비의 50%가 온라인에 지출될 것입니다.
따라서 마케팅 팀은 웹 트래픽 소스와 웹 도메인에서 창출되는 수익에 세심한 주의를 기울여야 합니다.
데이터 시각화를 사용하면 시간 경과에 따른 마케팅 활동으로 인한 트래픽 추세를 쉽게 확인할 수 있습니다.
정책.
각 주나 지역구가 어느 정당에 투표했는지 보여주는 지리 지도는 정치에서 데이터 시각화를 활용하는 일반적인 방법입니다.
건강.
등치 맵은 의료 전문가가 중요한 건강 데이터를 설명하기 위해 일반적으로 사용합니다.
등치 지도는 숫자 값을 기준으로 색상으로 구분된 지리적 영역을 나타냅니다.
전문가들은 등치 맵을 사용하여 심장병 사망률과 같은 변수가 다양한 지역에서 어떻게 변하는지 확인할 수 있습니다.
과학자들.
SciVis로 축약되는 과학적 시각화를 통해 과학자와 연구자는 이전보다 실험 데이터를 더 잘 이해할 수 있습니다.
재원.
자산 구매 또는 판매 여부를 결정할 때 금융 전문가는 투자 결정의 성과를 모니터링해야 합니다.
캔들스틱 차트는 거래 도구로 사용되어 금융 전문가가 시간에 따른 가격 변동을 분석하고 증권, 파생상품, 통화, 주식, 채권 및 원자재와 같은 필수 정보를 표시하는 데 도움을 줍니다.
데이터 분석가와 금융 전문가는 시간이 지남에 따라 가격이 어떻게 변했는지 평가하여 추세를 파악할 수 있습니다.
물류.
시각화 도구는 운송 회사가 전 세계 최적의 운송 경로를 찾는 데 사용할 수 있습니다.
연구원 및 데이터 과학자
데이터 과학자는 종종 자신이 사용하거나 소규모 그룹의 사람들에게 정보를 전파하기 위해 시각화를 만듭니다.
시각적 표현은 선택한 프로그래밍 언어 및 도구의 시각화 패키지를 사용하여 생성됩니다.
데이터 과학자와 연구자는 일반적으로 Python과 같은 오픈 소스 프로그래밍 언어나 독점 데이터 분석 도구를 사용합니다.
이러한 과학자와 연구자들은 데이터 시각화를 사용하여 데이터 세트를 더 잘 분석하고 보고되지 않은 패턴과 추세를 찾습니다.
Dataviz의 과학
인간이 정보를 수집하고 해석하는 방법을 이해하는 것은 데이터 시각화 과학의 기초입니다.
Amos Tversky와 Daniel Kahn은 정보 수집 및 분석에 대한 두 가지 서로 다른 접근 방식을 강조하는 연구에 참여했습니다.
시스템 1 신속하고 자동적이며 무의식적인 정신 처리에 관한 것입니다.
이 전략은 일상생활에서 일반적으로 사용되며 다음과 같은 목표를 달성합니다.
- 기호의 언어를 읽으세요
- 1+1과 같은 초등 수학 문제를 해결하고,
- 소리의 근원을 알아내다
- 자전거를 타다
- 색상의 차이를 결정합니다.
시스템 2 느리고 합리적이며 계산적이며 희박한 인지 처리에 중점을 둡니다.
이 접근 방식은 다음과 같은 상황에서 사용됩니다.
- 전화번호 기억해 줘
- 132 x 154와 같은 복잡한 수학 문제를 수행합니다.
- 나란히 놓인 여러 기호의 의미를 구별합니다.
- 복잡한 사회적 단서를 이해합니다.
https://www.youtube.com/watch?v=DlG7ZzRaJLc
Dataviz 도구 및 공급자
데이터 시각화 도구는 다양한 방법으로 사용될 수 있습니다.
오늘날 가장 널리 사용되는 애플리케이션은 비즈니스 인텔리전스(BI) 보고 도구입니다.
사용자는 시각화 도구를 구성하여 핵심 성과 지표(KPI)를 기반으로 비즈니스 성과를 그래픽으로 추적하고 평가하는 자동 대시보드를 만들 수 있습니다. 생성된 이미지에는 대화형 기능이 있어 사용자가 이를 수정하거나 연구 및 분석을 위해 데이터를 더 깊이 파고들 수 있습니다. 데이터가 업데이트되거나 미리 결정된 조건이 충족될 때 사용자에게 경고하는 표시기도 포함될 수 있습니다.
자체 계획을 모니터링하기 위해 회사 내 여러 부서에서는 데이터 시각화 소프트웨어를 사용합니다. 예를 들어 마케팅 팀은 이 프로그램을 사용하여 이메일 캠페인의 성과를 추적하고 공개율, 클릭률 및 전환율과 같은 데이터를 추적할 수 있습니다.
데이터 시각화 기업이 제품의 기능을 확장함에 따라 보다 정교한 빅데이터 환경을 위한 인터페이스로 사용되는 경우가 늘어나고 있습니다. 이러한 맥락에서 데이터 시각화 소프트웨어는 엔지니어와 과학자가 데이터 소스를 추적하고 추가 연구 전후에 데이터 세트에 대한 기본적인 탐색 연구를 수행하는 데 도움이 됩니다.
Microsoft, IBM, SAP 및 SAS는 빅 데이터 도구 시장에서 가장 잘 알려진 이름 중 일부입니다.
다른 제조업체에서는 전문적인 빅 데이터 시각화 도구를 제공하며 이 분야에서 가장 잘 알려진 이름은 Tableau, Qlik 및 Tibco입니다. Microsoft Excel은 데이터 시각화를 위한 널리 사용되는 응용 프로그램으로 남아 있지만 보다 정교한 기능을 제공하는 다른 응용 프로그램도 등장했습니다.
- IBM 코그노스 분석
- Qlik Sense 및 QlikView
- 마이크로소프트 파워 BI
- 오라클 비주얼 분석기
- SAP 루미라
- SAS 비주얼 분석
- 팁코 스팟파이어
- 조호애널리틱스
- D3.js
- 주피터
- 마이크로스트레티지
- 구글 차트