datamining

Data-Mining-Definition

In einer Zeit, in der alles bekannt ist, kann Data Mining ein Wachstumshebel für ein Unternehmen sein. Viele Marken haben ihre Marketingstrategie auf diesem Zweig der Datenwissenschaft aufgebaut. Big-Data-Analysen stellen mehr als nur Statistiken dar und sind der Ursprung der besten Vorhersagen. Dieser Artikel erklärt Ihnen alles.

Data Mining oder Data Mining

Bevor wir zum Kern der Sache kommen, lohnt es sich vielleicht, über die Terminologie zu sprechen. Der Ausdruck Data Mining lässt sich mit Data Mining übersetzen. Diese französische Version kommt der englischen Bedeutung nahe, bleibt aber unklar. Tatsächlich geht es vielmehr um die Analyse von Informationsblöcken, die aus Geheimdienstsilos extrahiert werden. Die Person, die diesen Beruf ausübt, würde eher wie ein Wissenschaftler im weißen Kittel aussehen als wie ein mit Kohle beschmierter Bergmann.

Data Mining ist in allen Bereichen anwendbar und nicht nur IT-Fachleuten und Marketingmanagern vorbehalten. Jeder kann lernen, Rohdaten zu analysieren und sie in nützliche Informationen umzuwandeln. Es ist auch möglich, Trends zu erkennen oder sogar Regeln oder Muster festzulegen. Viele Unternehmen nutzen daher die Datenerhebung, um daraus Rückschlüsse zu ziehen und ihren Umsatz zu steigern.

Eine Reihe von Technologien für unterschiedliche Ziele

Vor nicht allzu langer Zeit gibt es Data Mining, seit die Menschheit wusste, wie man Forschung betreibt. Allerdings haben die derzeit verfügbaren Algorithmen und Computerressourcen die Aufgabe der Person, die für die Analyse von Masseninformationen verantwortlich ist, erheblich erleichtert. Maschinelles Lernen und künstliche Intelligenz liegen heute in den Händen von Spezialisten. Diese Experten können sich stets auf angewandte Statistiken verlassen.

Jede Entität hat beim Data Mining ihr eigenes Ziel. Einige Unternehmen streben eine Senkung der Betriebskosten an. Gute Datenkenntnisse ermöglichen es, die Logistik im E-Commerce besser zu organisieren. Andere Unternehmen möchten mit Kurven und Diagrammen die Produktivität steigern. Es gibt auch diejenigen, die dem Markt einen Schritt voraus sein und das Verbraucherverhalten antizipieren wollen.

Dieser Bereich basiert auf einigen Hauptelementen

Die Entwicklung des Data Mining hängt von der der digitalen Technologie ab. Das Aufkommen von Datenbanken und leistungsstarken Servern erleichtert den Zugriff auf Rohinformationen. Dann wurden die Analysetools dank einer unvorstellbaren Berechnungsgeschwindigkeit effizient. Dieser ganze technologische Wettlauf ist Teil eines ganzen Kreislaufs, dessen Hauptfunktionen sind:

  • Die Daten werden in Data Warehouses gespeichert und verdichten sich mit der Zeit.
  • Datenwissenschaftler extrahieren die benötigten Blöcke von den Servern.
  • Die mehrdimensionale Analyse betrifft hauptsächlich Transaktionen.
  • Zahlen und Informationen werden in Tabellen oder Grafiken zusammengefasst.
  • Prägnante Präsentationen fassen die wochenlange Datenerfassung zusammen.

Beim Mining handelt es sich um die Analyse enormer Informationsmengen

Data-Mining-Experten nutzen verschiedene Analysetools. Dabei handelt es sich um maßgeschneiderte Software und Algorithmen. Allerdings ist das menschliche Gehirn auch für die Kategorisierung und Zusammenfassung von Informationen unerlässlich. Die Informationen sind hauptsächlich relational, aber Data Mining ist nicht auf den Marketingbereich beschränkt. Gesundheit, Politik und viele andere Tätigkeitsbereiche werden von Knowledge Discovery in Data profitieren können.

Zum besseren Verständnis sind hier die Aufgaben aufgeführt, die analytische Algorithmen ausführen:

  • Bei der Assoziation werden identische Informationen gruppiert, um eine mathematische Logik abzuleiten.
  • Die Sequenzanalyse stellt die Ursache-Wirkungs-Beziehung zwischen zwei Ereignissen her
  • Klassifizierung: Die Idee besteht darin, heterogene Informationen zu organisieren und darauf zu warten, eine Korrelation zwischen ihnen zu finden.
  • Clustering: Hierbei handelt es sich hauptsächlich um Marktsegmentierung.
  • Vorhersage- und Data-Mining-Experten sind die Wetterherren der Wirtschaft.

Wissenschaft, die Daten in nützliche Informationen und Wissen umwandelt

Ein Datenwissenschaftler verbringt seine Tage damit, Daten zu sammeln. Sein Interesse gilt potenziell verwertbaren Fakten, Zahlen und Texten. Alle Formate werden akzeptiert. Diejenigen, die noch nicht erforscht werden können, warten geduldig auf das Erscheinen einer Technologie, die sie in nützliche Informationen umwandeln kann. Bei den Daten handelt es sich in erster Linie um Transaktions- oder Betriebsdaten. Einige liefern Informationen zu Verkäufen, während andere sich auf die analytische Buchhaltung beziehen.

Zusammenstellungen von Zahlen, Schlüsselwörtern oder Fakten sind bis zur Analyse bedeutungslos. Der Experte bedient sich technischer Mittel, um sie zu bewältigen. Ihre Aufgabe ist es, zu assoziieren, zu klassifizieren und zu ordnen, um verständliche Informationen zu erhalten. Quittungen können beispielsweise Informationen zu Bestsellern und Produkten liefern, die einer Kommunikation bedürfen. Data Mining führt zu Schlussfolgerungen. Dabei handelt es sich um Muster oder Trends, die wesentliches Wissen für die Zukunft darstellen.

Informationsberge

Vor der Analyse werden die Daten in Data Warehouses gespeichert. Dabei handelt es sich um virtuelle Hangars, in denen Zahlen, Fakten und Abläufe roh gespeichert sind. Ihre Sammlung erforderte bereits erhebliche technologische Ressourcen. Barcodes und QR-Codes sind in der Liste enthalten. Allerdings versorgen sowohl die Formulare als auch die von den Verbrauchern selbst vorgenommenen Registrierungen die Datensilos.

Um Prognosen zu erstellen, müssen Unternehmen kein Data Warehouse einrichten. Sie können von anderen zusammengestellte Daten nutzen. Neben anderen Unternehmen speichern auch soziale Netzwerke und Suchmaschinen die kleinste Geste von Internetnutzern. Analysten können gegen Zahlung einer finanziellen Gebühr auf Informationen zu einem bestimmten Ziel zugreifen. Bei den am Eingang von Websites angebotenen Cookies handelt es sich um Roboter, die Daten sammeln.

Vielfältige Verwendungsmöglichkeiten für diese Wissenschaft

Obwohl die kommerzielle Anwendung nach wie vor am weitesten verbreitet ist, beschränkt sich Data Mining nicht auf Marketing und Massenverbreitung.

  • Hochschulforscher nutzen es täglich. Wissenschaftler nutzen manchmal auch analytische Anwendungen, um Genetik und Chemie besser zu verstehen.
  • Derzeit zieht die WHO Schlussfolgerungen zu Anti-Covid19-Impfstoffen, indem sie tägliche Berichte von Gesundheitspersonal über vernetzte Tablets zusammenstellt.
  • Für diejenigen, die mit der Website-Veröffentlichung beginnen möchten, ist Web Mining genau das Richtige. Ziel ist es, anhand der Analyse der Interaktionen mit Besuchern Verhaltensmuster zu erkennen. Es ist sogar möglich, die Bemerkungen zu quantifizieren.
  • Die Personalabteilung kann Daten untersuchen, um zu versuchen, die Mitarbeiter zu verstehen. Statistiken ermöglichen eine bessere Karrieresteuerung.
  • Große E-Commerce-Unternehmen verlassen sich auf Data Mining, um ihre gezielten Werbeaktionen zu verwalten. Sie passen auch ihren Marketing-Mix an: Preis, Kommunikation, Vertrieb und das Produkt selbst.

Die Datenanalyse ermöglicht ein besseres Verständnis des Verbrauchs

Im Einzelhandel vertrauen viele amerikanische Lebensmittelketten auf Oracle. Letzteres bietet Analysetools, um Verbraucherbedürfnisse anhand von Käufen zu klären. Die Einkaufsabteilung weiß genau, welche Produkte an welche Filialen versendet werden müssen. Die Software zeigt, dass der Bier- und Windelverkauf in einigen Städten im Mittleren Westen der USA donnerstags und samstags sprunghaft ansteigt.

Die Händler kamen zu folgendem Schluss:

  • Unter der Woche füllt die Bevölkerung ihren Getränkevorrat auf, so dass es am Wochenende sehr kalt ist.
  • Wir müssen den Bier- und Babywindelbereich näher zusammenbringen, um es den Verbrauchern einfacher zu machen.

Bessere Zusammenarbeit durch transparente Transaktionsdaten

Eine gewisse Datentransparenz ermöglichte es WalMart, seine Lagerbestände besser zu planen. Der Einzelhandelsriese verließ sich bei der Verwaltung der Beziehungen zu seinen Lieferanten auf dieses Prinzip. Rund 3.500 von ihnen konnten auf ein Data Warehouse zugreifen. Dank der von Teradata entwickelten Software konnten sie den Lagerbestand in 2.900 Filialen in 6 Ländern in Echtzeit überwachen.

  • Lieferanten passen ihre Lieferung an, indem sie die Kaufgewohnheiten der Kunden in jedem Supermarkt berücksichtigen.
  • Die Gesamtanalyse ermöglichte es ihnen, Bedürfnisse zu identifizieren und führte zur Einführung neuer Produkte.
  • WalMart ist ein Pionier im Data Mining, da seine Computer bereits 1995 in der Lage waren, bis zu einer Million komplexer Abfragen zu verarbeiten.
A lire également  SSO-Definition

Ein Beispiel aus dem assoziativen Bereich

Auch die National Basketball Association (NBA) betreibt Data Mining. Der Spielleiter der Mannschaft analysiert Videoaufzeichnungen von Spielen. Es verwendet Advanced Scout, eine Software, die Spielerbewegungen verfolgt. Die Trainer der verschiedenen Mannschaften haben Zugriff auf die daraus resultierenden Informationen. Dies hilft ihnen, Strategien vor Ort besser zu orchestrieren.

Das Spiel zwischen den New York Knicks und den Cleveland Cavaliers im Jahr 1995 ermöglichte den mathematischen Nachweis, dass John Williams mehr Körbe schießt, wenn Mark Price in der Defensive spielte. Advanced Scout, ein Pionier in der Sportstatistik, schätzt, dass die Cavaliers 51 % der Schüsse verfehlen. Diese Art der quantifizierten Schlussfolgerung erspart Trainern und Teams das Ansehen stundenlanger Videos.

Mit dem Aufkommen des Internets änderte sich die Situation

Das Aufkommen von Web 2.0 bringt Data Mining in eine völlig andere Dimension als einfache Statistiken. Noch komplizierter wird es bei sozialen Netzwerken und vernetzten Objekten. Es werden astronomische Datenmengen gesammelt und analysiert. Unternehmen beobachten die Verbraucher genau. Sie achten darauf, was sie auf Plattformen posten, liken und teilen.

Wer seinen digitalen Fußabdruck begrenzen möchte, kann auf Facebook-Posts verzichten. Es ist auch möglich, Ihren Webbrowser-Verlauf zu löschen. Auf der anderen Seite ist es weniger einfach, sich Aufzeichnungen von Kreditkartenkäufen oder Auftritten bei der Videoüberwachung zu entziehen. Die politischen Entscheidungsträger mussten sogar Gesetze dazu erlassen. Seit 2018 kann Google auf einfache Anfrage des Interessenten Namen oder Inhalte aus seiner Datenbank entfernen.

Ein noch umstrittenes Datendiktat

Bei der Datenspeicherung hat Google keine Vormachtstellung. Andere Firmen nutzen die Ader aus. Sämtliche Server werden zum Nutzen professioneller Anwender und Privatpersonen aus der Cloud verlagert. Unternehmen speichern dort Rohinformationen, um ihre Zielkunden besser zu verstehen. Einige von ihnen verkaufen sie an andere Unternehmen weiter. Viele Regierungen helfen sich auch selbst. All dies geschieht ohne Zustimmung der Betroffenen. Jetzt bieten Unternehmen Verbrauchern die Möglichkeit, die Kontrolle über ihren digitalen Fußabdruck zu behalten.

Marktführer in seinem Bereich ist Digi.me, das seit 2009 aktiv ist. Dieses Startup bietet Einzelpersonen die Möglichkeit, ihre eigenen Informationen mithilfe spezieller Tools zu verwalten. Sie können sie zu ihren eigenen Bedingungen sammeln und weitergeben. Das „My Internet“-Konzept ermöglicht es Ihnen, Ihre Daten selbst zu verkaufen. Digi.me stellt mit Hilfe von Toshiba und Lenovo individualisierte Server bereit. Zu den treuesten Kunden zählen die Branchen Krankenversicherung, Finanzen und Pharmaindustrie.

Die Nutzung der Daten zu Verwaltungszwecken oder zur Personalbeschaffung

Die indische Regierung nutzt Data Mining, um Steuerhinterziehung aufzuspüren. Die Kommunalverwaltung bietet den Bürgern vereinfachte Zahlungsmethoden an. Steuerzahler, die nicht sehr sauber sind, werden es etwas schwieriger haben, das System zu umgehen. Auch Frankreich setzt ein ähnliches System ein. Zu den DGFIP-Teams gehören Statistiker, deren Aufgabe es ist, Mehrwertsteuerbetrug aufzudecken. Die Zahlen und Prozentsätze verdeutlichen die Manöver in bestimmten Tätigkeitsbereichen.

Data-Mining-Anwendungen stehen auch Personalvermittlern zur Verfügung. Sie nutzen digitale Tools, um die talentiertesten Mitarbeiter zu finden. Irische Unternehmen verlassen sich auf diesen Ansatz, um wertvolle Kandidaten zu finden. Sie analysieren Zusammenstellungen von Informationen, um nach jungen Absolventen mit den besten Noten oder den produktivsten Arbeitskräften zu suchen. LinkedIn nutzt diesen Trend, indem es 200 Vollzeitmitarbeiter beschäftigt.

Ganz einfach zu verstehende Bedienung

Die Hauptaufgabe von Data Mining besteht darin, die Verbindung zwischen relationalen Daten und Transaktionsinformationen sicherzustellen. Das heißt, es werden Informationen über Kunden, aber auch über die Funktionsweise eines Unternehmens analysiert. Es ist eine große Menge statistikbasierter Software entstanden. Hinzu kommen maschinelles Lernen und neuronale Netze. Erläuterungen:

  • Die gespeicherten Daten ermöglichen die Bildung vorgegebener Gruppen. Beispiel: Eine Fast-Food-Kette analysiert die Verbrauchergewohnheiten, um Menüs anzubieten.
  • Die in Clustern organisierten Daten werden gruppiert, um Rückschlüsse auf die Kundenpräferenzen zu ziehen. Aus diesen Informationen ergeben sich Marktsegmente bzw. Affinitäten.
  • Manchmal werden Produkte durch Data Mining verknüpft. Dies ist bei Bier- und Babywindeln der Fall.
  • Sequentielle Muster ermöglichen es Ihnen, Trends zu antizipieren. Beispiel: Wer einen Schlafsack kauft, kann auch in Wanderschuhe investieren.

5 Hauptwerkzeuge in den Händen von Datenwissenschaftlern

Datenwissenschaft

Derzeit in Mode sind neuronale Netze Programme, die nichtlineare Analysen durchführen können. Diese Form der künstlichen Intelligenz ermöglicht Vorhersagen, die den menschlichen Intuitionen nahe kommen.

Beliebt sind auch Entscheidungsbäume. Die Richtungen, die ein Unternehmen einschlagen kann, sind komplex. Am bekanntesten sind die Modelle Classification and Regression (CART) oder Chi Square Automatic Interaction Detection (CHAID).

Die Nearest Neighbor-Methode wird ebenfalls untersucht. Dabei geht es darum, aus ähnlichen Verhaltensweisen Rückschlüsse auf Trends zu ziehen. In der Rechtswissenschaft nennt man das Jurisprudenz.

„Wenn-dann“-Regeln basieren auf einer einfachen Programmierung auf der Grundlage statistischer Signifikanz. Dies gilt auch für die Visualisierung komplexer Zusammenhänge. Mehrdimensionale Informationen werden so dargestellt, dass jeder sie verstehen kann.

Genetische Algorithmen kamen auf den Markt, als sich die Welt plötzlich für medizinische Wissenschaften interessierte. Auch Datenwissenschaftler leisten ihren Beitrag zur Bekämpfung der Covid19-Pandemie. Sie manipulieren Kombinationen, Mutationen sowie natürliche Selektion.

3 Schritte, die fast gleich bleiben

Die Form des Data Mining ändert sich für jeden Tätigkeitsbereich. Andererseits sind die zu befolgenden Schritte fast gleich.

  1. Unternehmen stellen Data Warehouses auf unterschiedliche Weise bereit. Die Daten werden auf lokalen Servern oder in der Cloud gespeichert.
  2. Wirtschaftsanalysten übernehmen die Aufgabe, indem sie nach der Logik des Verbraucherverhaltens suchen. Sie modellieren auch Betriebsdaten, um Geschäftspartnern bessere Organisationen zu bieten.
  3. Alle Informationen liegen in Form einer Grafik oder einer anderen Zusammenfassung vor, die Manager bei ihrer Entscheidungsfindung verwenden können.

Dem Data Mining sind drei Haupteigenschaften eigen

Die Mustererkennung erfolgt automatisch. Algorithmen sind das Ergebnis harter Arbeit von Programmierern und wissen, wie man Logik für das Verbraucherverhalten erstellt. Berücksichtigt werden alle Datenformate, Anwendungsentwickler bevorzugen jedoch insbesondere ein Scoring-System.

Die Ergebnisvorhersage ist ein weiterer Zweig für sich. Es beschränkt sich nicht nur auf kommerzielle Fakten. Algorithmen sind in der Lage, das Kaufverhalten anhand der Bildung oder des geografischen Standorts zu bestimmen. Dies ermöglicht es Unternehmen, sich in bestimmten Stadtteilen anzusiedeln.

Der Nutzen von Data Mining wird erst dann in Frage gestellt, wenn die gewonnenen Informationen auch in Zukunft nicht mehr nutzbar sind. Die modernsten Städte verfügen über Teams, die in der Lage sind, demografische Bewegungen vorherzusehen. Diese Informatiker oder Statistiker sind die Beamten, die für die Steuerung der auf kommunaler Ebene durchzuführenden Maßnahmen verantwortlich sind.

Data-Mining-Technologien sind zugänglicher als je zuvor

Wer sich mit den Grundlagen der Statistik auskennt, kann mit dem Data Mining beginnen. Derzeit ermöglichen mobile Anwendungen und SaaS-artige Online-Tools Benutzern aller Art die Analyse von Daten. Einige davon sind kostenlos. Andere haben Preise zwischen einigen Tausend und einer Million Euro. Die Abrechnung erfolgt pro genutztem Terabyte. NCR kann beispielsweise bis zu 100 Milliarden Milliarden Bytes verarbeiten.

Für ein Unternehmen wäre eine Anwendung, die einen 50-Gigabit-Datenblock zerlegen kann, ein guter Anfang. Alles wird in einem einzigen Computer gespeichert. Dann brauchen wir eine Infrastruktur zur Analyse größerer Informationsbestände. Auch die Komplexität der Abfrage spielt eine Rolle. Darüber hinaus sind Programmierkenntnisse auf diesem Niveau hilfreich. Investitionen in digitale Strukturen wie Massiely Parallel Processors (MPP) werden für multinationale Unternehmen immer wichtiger.

Die Data-Mining-Software ist in verschiedenen Formen erhältlich und richtet sich an KMU. Neben Händlern haben auch viele Restaurants und Bibliotheken Geld für den Erwerb dieser Werkzeuge bezahlt. Außerdem gibt es Open-Source-Programme. Weka, RapidMiner und Tanagra gehören zu den am häufigsten genannten, aber auch andere stehen kurz vor der Entwicklung. Sie basieren auf Assoziationen und sequentiellen Mustern.

Was kann ich noch zum Thema Data Mining sagen?

Unternehmen, die den Umgang mit Daten perfekt beherrschen, werden in naher Zukunft ein gewisses Wachstum verzeichnen. Andererseits werden sich Verbraucher zunehmend beobachtet fühlen. Es ist fast unmöglich, eine Website zu besuchen, ohne dass der Herausgeber ein Cookie anbietet. Kein Wunder, dass Fettleibigkeit weltweit zur häufigsten Todesursache wird …

Liste der Unternehmen, die Data Mining zur Festlegung ihrer Strategien nutzen.

  • Große Daten
  • Frankreich
  • Google
  • Data-Mining
  • Luftschleuse
  • Spss
  • Microsoft
  • IBM
  • Weka
  • Erp
  • Orakel
  • Amazon-Webdienste
  • Netflix
  • Kdd
  • Paris
  • Microsoft-Analysedienste
  • NCR