Die Praxis, Informationen in einen visuellen Kontext wie eine Karte oder ein Diagramm zu stellen, um es dem menschlichen Gehirn zu erleichtern, Ideen daraus aufzunehmen und daraus zu extrahieren.
Das Hauptziel von Dataviz besteht darin, die Erkennung von Mustern, Trends und Ausreißern in großen Datensätzen zu erleichtern. Der Ausdruck wird häufig synonym mit anderen Begriffen wie Informationsgrafiken, Informationsvisualisierung und statistischen Grafiken verwendet.
Dataviz, was genau ist das?
Dataviz ist einer der Prozesse der Datenwissenschaft, der besagt, dass Daten nach ihrer Erfassung, Verarbeitung und Modellierung visualisiert werden sollen, damit Schlussfolgerungen gezogen werden können. Datenvisualisierung ist auch ein Bestandteil der umfassenderen Disziplin der Datenpräsentationsarchitektur (DPA), die darauf abzielt, Daten so effizient wie möglich zu entdecken, zu extrahieren, zu ändern, zu formatieren und zu übertragen.
Datenvisualisierung ist in praktisch jedem Beruf unerlässlich. Lehrer können damit die Testergebnisse ihrer Schüler anzeigen, IT-Experten können damit die künstliche Intelligenz (KI) verbessern und Führungskräfte können damit Informationen mit Stakeholdern teilen. Dies ist auch bei großen Datenprojekten sehr wichtig. Unternehmen brauchten eine Möglichkeit, schnell und einfach Einblick in ihre Daten zu gewinnen, als sie in den Anfangsjahren des Big-Data-Trends große Datenmengen anhäuften. Der Einsatz von Visualisierungstools war selbstverständlich.
Aus ähnlichen Gründen ist die Visualisierung in der erweiterten Analyse unerlässlich. Wenn ein Datenwissenschaftler komplexe prädiktive Analysen oder Algorithmen für maschinelles Lernen entwickelt, ist es wichtig, die Ergebnisse anzuzeigen, um die Ergebnisse zu überwachen und zu bestätigen, dass die Modelle wie erwartet funktionieren. Dies liegt daran, dass Darstellungen komplexer Algorithmen oft leichter zu verstehen sind als numerische Ausgaben.
Warum ist Dataviz wichtig?
Datenvisualisierung ist ein schneller und effektiver Ansatz zur universellen Darstellung von Informationen mithilfe visueller Daten.
Diese Methode kann Unternehmen auch dabei helfen, festzustellen, welche Aspekte das Kundenverhalten beeinflussen, Bereiche zu identifizieren, die angesprochen oder denen mehr Aufmerksamkeit geschenkt werden muss, Daten für Stakeholder einprägsamer zu machen, zu verstehen, wann und wo bestimmte Produkte eingesetzt werden müssen, und Verkaufsmengen zu prognostizieren.
Hier sind einige zusätzliche Vorteile von Dataviz:
- die Fähigkeit, Informationen schnell zu verarbeiten, Ideen zu entwickeln und Entscheidungen schneller zu treffen; bessere Kenntnis der nächsten Schritte zur Verbesserung des Geschäfts; und eine bessere Fähigkeit, das Interesse des Publikums mit verständlichen Informationen aufrechtzuerhalten.
- einfache Informationsverteilung, die das Potenzial aller Beteiligten erhöht, Ideen einzubringen;
- Datenwissenschaftler sind nicht mehr erforderlich, da die Daten zugänglicher und verständlicher sind; und es besteht eine größere Fähigkeit, schnell auf Ergebnisse zu reagieren und somit schneller und mit weniger Fehlern Erfolge zu erzielen.
Dataviz und Big Data
Die wachsende Beliebtheit von Big-Data- und Datenanalyseinitiativen hat den Bedarf an Visualisierung größer denn je gemacht. Maschinelles Lernen wird von Unternehmen zunehmend genutzt, um riesige Datenmengen zu sammeln, deren Sortierung, Interpretation und Erklärung schwierig und zeitaufwändig sein kann. Die Visualisierung bietet einen Mechanismus, um diesen Prozess zu beschleunigen und den Geschäftsinhabern und Stakeholdern Informationen auf eine für sie verständliche Weise zu vermitteln.
Die Visualisierung von Big Data geht oft über herkömmliche Visualisierungsansätze wie Kreisdiagramme, Histogramme und Geschäftsdiagramme hinaus. Es verwendet komplexere visuelle Tools wie Wärmekarten und Fieberdiagramme. Die Big-Data-Visualisierung erfordert den Einsatz leistungsstarker Computersysteme, um Rohdaten zu sammeln, zu verarbeiten und in grafische Darstellungen umzuwandeln, anhand derer der Mensch schnell Schlussfolgerungen ziehen kann.
Während die Visualisierung großer Datenmengen von Vorteil sein kann, kann sie für Unternehmen auch eine Reihe von Nachteilen mit sich bringen. Als Beispiel hier einige:
- Sie müssen einen Visualisierungsspezialisten engagieren, um die Big-Data-Visualisierungstechnologien optimal nutzen zu können.
Dieser Fachmann sollte in der Lage sein, die optimalen Datensätze und Visualisierungsmethoden zu bestimmen, um sicherzustellen, dass Unternehmen ihre Daten optimal nutzen. - Da die Big-Data-Visualisierung leistungsstarke Computerhardware, effiziente Speichersysteme und möglicherweise einen Wechsel in die Cloud erfordert, sind IT und Management häufig an Initiativen zur Big-Data-Visualisierung beteiligt.
- Die Big-Data-Visualisierung kann keine so genauen Informationen liefern wie die präsentierten Daten.
Daher ist es wichtig, dass Menschen und Systeme vorhanden sind, um die Qualität der Daten, Metadaten und Datenquellen des Unternehmens zu überwachen und zu kontrollieren.
Einige Beispiele für Dataviz
Ursprünglich bestand die gängigste Visualisierungsstrategie darin, eine Microsoft Excel-Tabelle zu verwenden, um die Informationen in eine Tabelle, ein Balkendiagramm oder ein Kreisdiagramm zu übersetzen. Während grundlegende Visualisierungsansätze immer noch weit verbreitet sind, stehen auch komplexere Techniken wie die folgenden zur Verfügung:
- Infografiken
- Blasenwolken
- Bullet-Diagramme
- Wärmekarten
- Fieberdiagramme
- Zeitreihendiagramme
Zu den weiteren beliebten Techniken gehören die folgenden.
Liniendiagramme
Dies ist eines der grundlegendsten und am häufigsten verwendeten Verfahren.
Liniendiagramme zeigen, wie sich Variablen im Laufe der Zeit ändern.
Flächendiagramme.
Dies ist eine Variation eines Liniendiagramms, das viele Werte in einer Zeitreihe anzeigt – oder eine Abfolge von Daten, die in aufeinanderfolgenden Zeiträumen und in gleichen zeitlichen Abständen gesammelt wurden.
Diagramme mit Streuung.
Mit dieser Methode ist es möglich, den Zusammenhang zwischen zwei Variablen aufzuzeigen.
Ein Streudiagramm hat eine x-Achse und eine y-Achse mit Punkten, die Datenpunkte darstellen.
Baumkarten.
Dieser Ansatz ermöglicht die verschachtelte Darstellung hierarchischer Daten.
Die Größe des Rechtecks jeder Kategorie ist proportional zu ihrem prozentualen Anteil an der Gesamtsumme.
Baumkarten funktionieren gut, wenn es mehrere Kategorien gibt und das Ziel darin besteht, verschiedene Aspekte eines Ganzen zu vergleichen.
Bevölkerungspyramiden
Bei dieser Technik wird ein gestapeltes Balkendiagramm verwendet, um die komplexe soziale Erzählung einer Bevölkerung darzustellen.
Dies ist besonders nützlich, wenn die Verteilung einer Population beschrieben wird.
Häufige Anwendungsfälle für die Datenvisualisierung
Beispiele für häufige Anwendungsfälle für die Datenvisualisierung sind:
Marketing und Vertrieb.
Laut Magna-Studien werden bis 2020 50 % aller weltweiten Werbeausgaben online ausgegeben.
Daher müssen Marketingteams genau auf ihre Web-Traffic-Quellen und die mit ihren Web-Domains generierten Einnahmen achten.
Die Datenvisualisierung macht es einfach, Verkehrstrends zu erkennen, die sich aus Marketingbemühungen im Laufe der Zeit ergeben.
Politik.
Eine geografische Karte, die zeigt, für welche Partei jeder Staat oder Bezirk gestimmt hat, ist eine typische Verwendung der Datenvisualisierung in der Politik.
Gesundheit.
Choropleth-Karten werden häufig von medizinischem Fachpersonal verwendet, um wichtige Gesundheitsdaten zu veranschaulichen.
Eine Choroplethenkarte stellt geografische Gebiete oder Regionen dar, die anhand eines numerischen Werts farblich gekennzeichnet wurden.
Fachleute können Choroplethenkarten verwenden, um zu sehen, wie sich eine Variable, beispielsweise die Sterblichkeitsrate bei Herzerkrankungen, in verschiedenen Gebieten verändert.
Die Wissenschaftler.
Wissenschaftliche Visualisierung, abgekürzt SciVis, ermöglicht es Wissenschaftlern und Forschern, ihre experimentellen Daten besser als je zuvor zu verstehen.
Finanzen.
Bei der Entscheidung, ob ein Vermögenswert gekauft oder verkauft werden soll, müssen Finanzexperten die Leistung ihrer Anlageentscheidungen überwachen.
Candlestick-Charts werden als Handelsinstrumente verwendet und helfen Finanzfachleuten dabei, Preisbewegungen im Zeitverlauf zu analysieren und wichtige Informationen wie Wertpapiere, Derivate, Währungen, Aktien, Anleihen und Rohstoffe anzuzeigen.
Datenanalysten und Finanzexperten können Trends erkennen, indem sie bewerten, wie sich Preise im Laufe der Zeit verändert haben.
Logistik.
Mithilfe von Visualisierungstools können Reedereien weltweit optimale Versandrouten entdecken.
Forscher und Datenwissenschaftler
Datenwissenschaftler erstellen häufig Visualisierungen für den eigenen Gebrauch oder um Informationen an eine kleine Gruppe von Menschen weiterzugeben.
Visuelle Darstellungen werden mithilfe von Visualisierungspaketen aus Programmiersprachen und Tools ihrer Wahl erstellt.
Datenwissenschaftler und -forscher verwenden in der Regel Open-Source-Programmiersprachen wie Python oder proprietäre Datenanalysetools.
Diese Wissenschaftler und Forscher nutzen die Datenvisualisierung, um Datensätze besser zu analysieren und Muster und Trends zu finden, über die sonst nicht berichtet würde.
Die Wissenschaft von Dataviz
Das Verständnis, wie Menschen Informationen sammeln und interpretieren, ist die Grundlage der Datenvisualisierungswissenschaft.
Amos Tversky und Daniel Kahn arbeiteten an einer Forschung, die zwei unterschiedliche Ansätze zur Informationsbeschaffung und -analyse hervorhob.
System 1 betrifft die schnelle, automatische, unbewusste mentale Verarbeitung.
Diese Strategie wird häufig im täglichen Leben angewendet und erreicht folgende Ziele:
- Lesen Sie die Sprache eines Zeichens
- Lösen Sie elementare mathematische Probleme wie 1+1,
- die Quelle eines Geräusches identifizieren
- Fahrrad fahren
- Bestimmen Sie den Unterschied zwischen Farben.
System 2 konzentriert sich auf kognitive Verarbeitung, die langsam, rational, berechnend und spärlich ist.
Dieser Ansatz wird in den folgenden Fällen verwendet:
- Merken Sie sich eine Telefonnummer
- Führen Sie komplizierte mathematische Aufgaben aus, z. B. 132 x 154
- die Bedeutung mehrerer nebeneinander platzierter Zeichen unterscheiden
- komplexe soziale Signale verstehen.
https://www.youtube.com/watch?v=DlG7ZzRaJLc
Dataviz-Tools und -Anbieter
Datenvisualisierungstools können auf vielfältige Weise eingesetzt werden.
Die am weitesten verbreitete Anwendung ist heute die Verwendung als Business Intelligence (BI)-Berichtstool.
Benutzer können Visualisierungstools konfigurieren, um automatische Dashboards zu erstellen, die die Geschäftsleistung anhand von Key Performance Indicators (KPIs) grafisch verfolgen und bewerten. Die erstellten Bilder können auch über interaktive Funktionen verfügen, sodass Benutzer sie ändern oder für Forschungs- und Analysezwecke tiefer in die Daten eintauchen können. Es können auch Indikatoren enthalten sein, die Benutzer warnen, wenn Daten aktualisiert werden oder vorgegebene Bedingungen erfüllt sind.
Um ihre eigenen Initiativen zu überwachen, nutzen mehrere Abteilungen im Unternehmen Datenvisualisierungssoftware. Ein Marketingteam kann das Programm beispielsweise verwenden, um die Leistung einer E-Mail-Kampagne zu verfolgen und dabei Daten wie Öffnungsrate, Klickrate und Konversionsrate zu verfolgen.
Da Datenvisualisierungsunternehmen die Funktionalität ihrer Produkte erweitern, werden diese zunehmend als Schnittstellen für anspruchsvollere Big-Data-Umgebungen verwendet. In diesem Zusammenhang hilft Datenvisualisierungssoftware Ingenieuren und Wissenschaftlern dabei, Datenquellen zu verfolgen und vor oder nach weiterer Forschung grundlegende explorative Untersuchungen an Datensätzen durchzuführen.
Microsoft, IBM, SAP und SAS gehören zu den bekanntesten Namen auf dem Markt für Big-Data-Tools.
Andere Hersteller bieten spezialisierte Big-Data-Visualisierungstools an, wobei die bekanntesten Namen in diesem Bereich Tableau, Qlik und Tibco sind. Während Microsoft Excel nach wie vor eine beliebte Anwendung zur Datenvisualisierung ist, sind andere entstanden, die anspruchsvollere Funktionen bieten:
- IBM Cognos Analytics
- Qlik Sense und QlikView
- Microsoft Power BI
- Oracle Visual Analyzer
- SAP Lumira
- SAS Visual Analytics
- Tibco Spotfire
- Zoho Analytics
- D3.js
- Jupyter
- Mikrostrategie
- Google Charts