Deep Learning ist eine Technik des maschinellen Lernens, die künstliche neuronale Netze aufbaut, um die Struktur und Funktion des menschlichen Gehirns nachzuahmen. In der Praxis nutzt Deep Learning, auch bekannt als Deep Structured Learning oder hierarchisches Lernen, eine große Anzahl verborgener Schichten – normalerweise mehr als sechs, aber oft viel mehr – der nichtlinearen Verarbeitung, um Merkmale aus Daten zu extrahieren und die Daten in verschiedene Abstraktionsebenen umzuwandeln (Darstellungen).
Angenommen, die Eingabedaten sind ein Array von Pixeln. Die erste Ebene extrahiert normalerweise Pixel und erkennt die Kanten von Bildelementen. Die nächste Ebene kann aus den Kanten einfache Elemente wie Blätter und Zweige bilden. Die nächste Ebene könnte dann einen Baum usw. erkennen. Der Datentransfer von einer Ebene zur anderen wird als Transformation betrachtet, bei der die Ausgabe einer Ebene in die Eingabe für die nächste umgewandelt wird. Jede Schicht entspricht einer anderen Abstraktionsebene und die Maschine kann selbst lernen, welche Datenmerkmale in welcher Schicht/Ebene platziert werden sollen. Deep Learning unterscheidet sich vom traditionellen „Shallow Learning“, weil es viel tiefere Ebenen der Abstraktion und hierarchischen Darstellung erlernt.
Warum ist Deep Learning wichtig?
Diese Lerntechnik ist ein revolutionäres Werkzeug für die Verarbeitung großer Datenmengen, da sich die Leistung der Maschine verbessert, je mehr Daten sie analysiert. Mit zunehmender Datenmenge wird die Maschine besser in der Lage, Muster – auch versteckte – in den Daten zu erkennen. Da die Maschine auch aus den verarbeiteten Daten lernt, ist sie in der Lage, die Merkmalsextraktion und -abstraktion automatisch aus den Rohdaten durchzuführen, ohne dass ein menschlicher Eingriff erforderlich ist.
Praktische Anwendungen von Deep Learning
Automatische Spracherkennung – Alle großen kommerziellen Spracherkennungssysteme (denken Sie an Ihren Smartphone-Assistenten) verwenden eine Deep-Learning-Technik, wobei rekurrente neuronale Netze derzeit am beliebtesten sind.
Computer Vision – Bilder werden verwendet, um der Maschine beizubringen, Merkmale zu erkennen, und jetzt zeigen Maschinen eine „übermenschliche“ Genauigkeit bei der Bilderkennung.
Verarbeitung natürlicher Sprache – Moderne Deep-Learning-Techniken haben die Übersetzung und Sprachmodellierung verbessert. Google Translate verwendet Deep-Learning-Techniken, um Übersetzungen basierend auf der Semantik eines gesamten Satzes zu übersetzen, anstatt sich nur Übersetzungen von Satz zu Satz zu merken.