logo du language de programmation python

Python: eine Sprache, die für maschinelles Lernen entwickelt wurde

Python wurde Anfang der 90er Jahre geboren und ist eine der beliebtesten Programmiersprachen unter Anwendungsentwicklern. Als es erstellt wurde, war es möglich, bestimmte wiederkehrende Skriptaufgaben zu automatisieren. Ergänzt wird die Zeitersparnis durch die Möglichkeit, eine große Menge an Informationen flexibel zu verwalten. Was Webmaster großer Websites mit mehreren Funktionalitäten begeistert. Allerdings werden vor allem Spezialisten für maschinelles Lernen und Big Data bedient.

Hast du Python gesagt?

Python wurde 1991 aus der Fantasie von Guido van Rossum geboren. Dieser Programmierer ließ sich von einer damaligen Fernsehunterhaltungssendung inspirieren, seinem Projekt einen Namen zu geben. Im Gegensatz zu anderen Programmiersprachen ist keine Kompilierung erforderlich, um zu funktionieren. Sie benötigen lediglich eine native Interpretersoftware, um die Codes auf einem einfachen Computer auszuführen. Diese Besonderheit macht es für möglichst viele Menschen zugänglich, auch wenn Geschwindigkeit und Leistung manchmal zu wünschen übrig lassen.

Bei Python konzentrieren sich Programmierer auf das, was sie tun müssen, und nicht darauf, wie sie die Aufgabe erledigen. Sie verwenden objektorientierte Software. Mit anderen Worten: Die Erstellungsarbeit wird so einfach wie möglich gestaltet, sodass der Anwendungsprototyp schnell das Licht der Welt erblickt. Darüber hinaus ist es ein Open-Source-Tool schlechthin für diejenigen, die das Programmieren ohne großen Aufwand erlernen möchten. Kurse sind auf OpenClassrooms verfügbar. Die Lernenden erlernen Möglichkeiten, das Programmieren sowohl auf der Seite des Entwicklers als auch als normaler Benutzer zu beherrschen. Ein besseres Verständnis der Werkzeugbibliotheken ermöglicht Ihnen außerdem schnelle Fortschritte.

Welche Vorteile hat das Erlernen dieser Programmiersprache?

  • Die Python-Sprache kommt sowohl Anfängern als auch Experten zugute. Das Tool ist vereinfacht, um es dem Benutzer zu ermöglichen, schnell das zu finden, was er sucht, nämlich die Entwicklung einer Anwendung. Die Syntax ist nicht nur direkt, sondern auch lesbar.
  • Diese Open-Source-Software hat den Vorteil, dass sie mit den meisten Betriebssystemen kompatibel ist. Seine Vielseitigkeit, vor allem aber seine Universalität, gleicht seine relative Langsamkeit gut aus.
  • Die ältere Generation von Entwicklern nutzte es sowohl für die Skripterstellung als auch für die Automatisierung von Rechenaufgaben. Derzeit ermöglicht diese Sprache auch die Erstellung professioneller Qualitätssoftware. NASA, EDF und YouTube nutzen es.
  • Viele Online-Anwendungen und -Dienste werden in Python entwickelt und verwaltet. Zu den bekanntesten zählen BitTorrent (Download), Blender (3D), Miro (Internet-TV) und Battlefield 2 (Videospiele).
  • Mit dem Titel der Programmiersprache Nummer eins im Jahr 2021 ist Python ein Muss für Entwickler aller Niveaus. Es zu ignorieren wäre ein Fehler. Allerdings bleiben auch Grundlagen wie JavaScript und Herausforderer wie Rust und Ruby unerlässlich.
  • Eine starke Gemeinschaft von Programmierern aus allen Gesellschaftsschichten unterstützt die Stiftung, die dieses kostenlose Tool verwaltet. Die Zahl der Neulinge, die sich für diese Software interessieren, ist innerhalb eines Jahres um 27 % gestiegen. Zum Vergleich: C++ verzeichnete im Jahr 2020 ein Wachstum von 10 %.
  • Die „Low-Code“-Schnittstelle ermöglicht Ihnen das Programmieren, ohne ein erfahrener Programmierer zu sein. Im Buchladen gibt es viele intuitive Grafiktools. Dies schließt hochkompetente Entwickler nicht aus, die die Python-Bibliothek jederzeit erweitern können.

Wie viele Updates gibt es für dieses Programm?

Python wird dieses Jahr 2021 30 Jahre alt und befindet sich derzeit in der dritten Generation. Es stehen zwei Versionen zur Verfügung, Entwickler sind jedoch eingeladen, mit Version 3.8 und höher an ihrer Anwendung zu arbeiten. Die 2.X-Edition wird zwar unterstützt, ist aber seit 2020 eine inoffizielle Version.

Mit Python 3.X profitieren Anwender von ebenso innovativen wie nützlichen Funktionen. Zu diesem Programm wurden ein besserer Interpreter und ein Parallelitätscontroller hinzugefügt. Die von Dritten bereitgestellte Bibliothek soll bereichert werden. Kompatibilitätsprobleme wurden von der Python Software Foundation und ihren Unterstützern auf der ganzen Welt gelöst.

Python 3.8.0 ist seit Oktober 2019 verfügbar und führt den Morsecode-Operator ein. Diese Salve beinhaltet verschiedene Verbesserungen, einschließlich Variablen vom Typ „if“ oder „while“ in der Codierung. Mehrere Szenarien und ständig erweiterte Funktionalitäten belasten die entwickelten Anwendungen nicht. Das Debuggen von Zeichenfolgen ist ebenfalls enthalten. Ein einziges Standardmodell ist äußerst einfach und lädt zu einer reibungslosen Installation ein.

Version 3.9.1 der Programmiersprache ist mit Mac OS 11 kompatibel. Sie unterstützt Apples M1-Prozessor, der die ARM-Struktur nutzt. Mit dem begleitenden experimentellen Installationsprogramm können Sie Universal 2.X-Binärcodes verwalten. Mit anderen Worten: Die anspruchsvollsten Benutzer, in diesem Fall Data Scientists, verfügen endlich über ein Tool, das an ihre Herausforderungen angepasst ist.

Allerdings handelt es sich nicht um eine perfekte Programmiersprache. Im Jahr 2021 war die Schwachstelle „CVE-2021-3177“ ein echtes Problem für Anwendungsentwickler. Da es möglich war, die Codes aus der Ferne auszuführen, fanden Hacker eine offene Tür für einen echten DDoS-Angriff. Die Python-Versionen 3.8.8 und 3.9.2 haben die Lücken geschlossen.

Welchen Beitrag für maschinelles Lernen und Big Data?

Skripterstellung und Automatisierung in Python funktionieren gut für Webbrowser oder mobile Anwendungen. Diese Sprache ist auch für Spieler des maschinellen Lernens unerlässlich. Dank einer gut ausgestatteten Codebibliothek können sie die verschiedenen Möglichkeiten des Tools nutzen. Viele Robotikunternehmen setzen auf dieses dreißigjährige Programm, um ihre Produkte „intelligenter“ zu machen. Dies ist der Fall von Aldebaran. Diese Softbank-Marke hat sich für eine leicht zugängliche Plattform entschieden, damit Heimwerker schnell an ihren Robotern basteln können. Darüber hinaus ist es ein Tool, das mit den meisten bekannten Betriebssystemen kompatibel ist. Entwickler unter Windows, Mac OS, Linux und UNIX verwenden es täglich. Dann umfasst das Open-Source-Programm nicht nur eine, sondern mehrere Framework-Bibliotheken.

Derzeit ist Python nach wie vor die am häufigsten verwendete Programmiersprache in der Datenwissenschaft. Die Einfachheit der Schnittstelle, die Lesbarkeit ihrer Syntax und vor allem ihre große Flexibilität sind Eigenschaften, die von Datenverwaltungsexperten geschätzt werden. Bohren, Klassifizieren und Analysieren können einfach programmiert werden. Mit Tensor Flow, Scipy und Numpy wird es möglich, unendlich viele Aufgaben auszuführen. Diese Tools sind für ein breites Publikum zugänglich, auch für Personen ohne Hintergrund in Softwareentwicklung oder Ingenieurwesen. Für Datenwissenschaftler empfehlen sich Scrapy und Beautiful Soup zum Extrahieren von Informationen aus dem Internet. Seaborn und Matplotlib sind für ihre Visualisierung konzipiert. Für die Entwicklung von Modellen vom Typ Deep Learning müssen Sie sich auf Theano und Khera verlassen. Wenn Sie unbedingt über Algorithmen für künstliche Intelligenz verfügen müssen, müssen Sie sich an Scikit-Learn wenden.

Was ist mit den in der Bibliothek verfügbaren Toolboxen?

Datenwissenschaft ist ein beliebtes Fachgebiet für Programmierer mit Python-Kenntnissen. Sie profitieren von einer großen Auswahl an Frameworks, die es ihnen ermöglichen, die Daten zu nutzen.

  • Pandas müssen Anwendungsentwicklern in R und Python nicht mehr vorgestellt werden. Es startet zuverlässige wissenschaftliche Analysen auf einer Datenbank. Seine Funktionen sind vielfältig, einschließlich der Möglichkeit, Antworten auf eine bestimmte Anfrage zu erhalten. Es ist sogar möglich, grafische Visualisierungen zu generieren und diese in eine Excel-Arbeitsmappe zu übertragen.
  • Agate befasst sich mit den Problemen, die bei der Analyse aggregierter Daten auftreten. Es schlägt eine einfache Schnittstelle mit aussagekräftigen Statistiken vor. Die verschlüsselten Informationen können in eine Bürotabelle kopiert werden.
  • Bokeh nutzt die Datenbankvisualisierung zusätzlich. Es ist mit Agate und Panda kompatibel und wird häufig mit Python verwendet. Der Benutzer muss nicht einmal eine Codezeile schreiben.
  • NumPy ist ein Python-Rechner. Es ist das Werkzeug für diejenigen, die Daten anhand algebraischer Formeln verstehen möchten. Es richtet sich an Einsteiger, die problemlos mehrere Datenbanken zusammenstellen möchten.
  • Scipy ist ein technischer Taschenrechner. Diese Toolbox umfasst mehrere Module zur Durchführung von Big-Data-Engineering- und -Nutzungsaufgaben. Dies ist ein Programm für Interpolation, FFT und Signalverarbeitung.
  • PyBrain oder Python-Based Reinforcement Learning, Artificial Intelligence, and Neural Network Library vereint eine Armee von Algorithmen, die speziell für maschinelles Lernen entwickelt wurden.
  • Die Python-Bibliothek umfasst immer noch unendlich viele Programme. Entwickler können Cython, den C-Code-Übersetzer, und PyMySQL, den Connector zur MySQL-Umgebung, ausprobieren. BeautifulSoup liest Daten in XML und HTML.
  • Schließlich ist Google Atheris ein Open-Source-Tool zur Diagnose von Python-Fehlern. Dasselbe machte das Team von Larry Page mit Anwendungen in C oder C++.

Python: Alles, was Sie über die beliebteste Programmiersprache für Big Data und maschinelles Lernen wissen müssen.

Python-Sprache

Python ist die beliebteste Programmiersprache in den Bereichen maschinelles Lernen, Big Data und Data Science.

Erfahren Sie alles, was Sie darüber wissen müssen, einschließlich Definition, Vorteile und Anwendungsfälle.

Die Programmiersprache Python entstand 1991 als Technik zur Automatisierung der mühsamsten Aspekte des Schreibens von Skripten oder des schnellen Prototypings von Anwendungen.

Allerdings hat sich diese Programmiersprache in den letzten Jahren zu einer der am häufigsten verwendeten in der Softwareentwicklung, dem Infrastrukturmanagement und der Datenanalyse entwickelt.

Es ist eine der treibenden Kräfte hinter der Explosion von Big Data.

Was ist die Programmiersprache Python?

Guido van Rossum, ein Programmierer, entwickelte Python 1991 als Open-Source-Programmiersprache.

Der Name geht auf den fliegenden Zirkus von Monty Python zurück. Da es sich um eine interpretierte Programmiersprache handelt, ist keine Kompilierung erforderlich, um zu funktionieren.

Sie können Python-Code mit einer „Interpreter“-Anwendung auf jedem Computer ausführen.

Dadurch können Sie schnell die Auswirkungen einer Codeänderung erkennen.

Andererseits verlangsamt es die Sprache im Vergleich zu einer kompilierten Sprache wie C.

Als Programmiersprache auf hohem Niveau ermöglicht Python es Programmierern, sich auf das zu konzentrieren, was sie tun, und nicht darauf, wie sie es tun.

Daher nimmt das Schreiben von Anwendungen in Python weniger Zeit in Anspruch als in jeder anderen Sprache. Es ist eine ausgezeichnete Muttersprache.

Was sind die Hauptvorteile der Programmiersprache Python?

Der Erfolg von Python ist auf eine Reihe von Vorteilen zurückzuführen, die sowohl Anfängern als auch Experten helfen. Erstens ist es einfach zu erlernen und anzuwenden.

Die Funktionalität ist begrenzt, sodass Sie schnell und einfach Programme schreiben können. Darüber hinaus ist die Syntax lesbar und einfach gestaltet. Ein weiterer Vorteil ist die Beliebtheit von Python.

Diese Sprache ist mit allen wichtigen Betriebssystemen und Computerplattformen kompatibel. Auch wenn es sicherlich nicht die schnellste Sprache ist, gleicht ihre Vielfältigkeit ihre Langsamkeit aus. Obwohl diese Sprache hauptsächlich für die Skripterstellung und Automatisierung verwendet wird, wird sie auch zum Erstellen professioneller Anwendungen verwendet.

Python wird von einer großen Anzahl von Entwicklern zum Erstellen von Software verwendet, die von Anwendungen bis hin zu Webdiensten reicht.

Was sind die Unterschiede zwischen Python 2 und Python 3?

Python gibt es in zwei Versionen: Python 2 und Python 3. Es gibt viele Unterschiede zwischen diesen beiden Versionen.

Python 2.x ist die Vorgängerversion, die bis 2020 unterstützt wird und offizielle Updates erhält. Sie wird höchstwahrscheinlich nach diesem Datum informell weiter existieren.

Python 3.x ist die aktuelle Version der Sprache. Es enthält eine Reihe äußerst nützlicher neuer Funktionen, wie z. B. eine bessere Parallelitätskontrolle und einen effizienteren Interpreter. Der Mangel an unterstützenden Bibliotheken von Drittanbietern hat die Einführung von Python 3 jedoch lange verzögert.

Viele davon waren nur mit Python 2 kompatibel, was den Umstieg erschwerte. Dieses Problem ist jedoch fast gelöst und es gibt nur wenige zwingende Gründe, Python 2 weiterhin zu verwenden.

Python ist eine Programmiersprache, die für Big Data und maschinelles Lernen verwendet wird.

Python-Logo

Die Hauptanwendungen von Python sind Skripterstellung und Automatisierung.

Tatsächlich ermöglicht diese Sprache die Automatisierung von Interaktionen mit Online-Browsern oder grafischen Anwendungsoberflächen.

Allerdings sind Skripterstellung und Automatisierung bei weitem nicht die einzigen Anwendungen dieser Sprache.

Es wird auch für die Anwendungsprogrammierung, Webservice- oder REST-API-Entwicklung, Metaprogrammierung und Codeerstellung verwendet. Darüber hinaus wird diese Sprache in der Datenwissenschaft und im maschinellen Lernen eingesetzt.

Mit dem Aufkommen der Datenanalyse in allen Branchen ist sie zu einer ihrer wichtigsten Anwendungen geworden.

Die überwiegende Mehrheit der Bibliotheken für Datenwissenschaft und maschinelles Lernen integriert Python-Schnittstellen.

Infolgedessen hat sich diese Sprache zur am weitesten verbreiteten High-Level-Befehlsschnittstelle für Bibliotheken für maschinelles Lernen und andere numerische Methoden entwickelt. Im Internet sind viele Einführungsbücher verfügbar.

Schließlich verwenden Robotikunternehmen wie Aldebaran diese Sprache, um ihre Roboter zu programmieren.

Diese Programmiersprache wurde von dem von Softbank übernommenen Unternehmen übernommen, um das Design von Anwendungen durch Drittunternehmen und Amateure zu vereinfachen.

Warum verwenden Datenwissenschaftler Python?

Python ist die am weitesten verbreitete Programmiersprache für die Datenwissenschaft.

Es ist einfach, lesbar, sauber, anpassungsfähig und plattformunabhängig.

Seine zahlreichen Bibliotheken, darunter TensorFlow, Scipy und Numpy, ermöglichen Ihnen die Durchführung vielfältiger Arbeiten.

Laut einer O’Reilly-Umfrage aus dem Jahr 2013 nutzen 40 % der Datenwissenschaftler Python täglich. Dank seiner einfachen Syntax kann es auch von Personen verwendet werden, die nicht unbedingt über Erfahrung im Ingenieurwesen verfügen.

Es ermöglicht schnelles Prototyping und der Code kann überall ausgeführt werden: Windows, macOS, UNIX, Linux … Dank seiner Flexibilität können Modelle für maschinelles Lernen, Datenexploration, Klassifizierung und viele andere Aufgaben schneller erstellt werden als mit anderen Sprachen.

Mit den Bibliotheken Scrapy und BeautifulSoup können Sie Daten aus dem Internet extrahieren, während Seaborn und Matplotlib die Datenvisualisierung erleichtern.

Tensorflow, Keras und Theano helfen bei der Erstellung von Deep-Learning-Modellen, während Scikit-Learn die einfache Erstellung von Algorithmen für maschinelles Lernen erleichtert.

Top-Python- und Big-Data-Bibliotheken und -Pakete

Python-Programmierung

Dank seiner zahlreichen Data-Science-Pakete und -Tools konnte sich Python als ideale Programmiersprache für Big Data etablieren.

Hier sind einige der beliebtesten.

Pandas

Eine der am häufigsten genutzten Data-Science-Bibliotheken ist Pandas.

Es wurde von Datenwissenschaftlern entwickelt, die mit R und Python vertraut waren, und wird heute von einer großen Anzahl von Wissenschaftlern und Analysten verwendet.

Es verfügt über viele sehr praktische native Funktionen.

Es ist beispielsweise möglich, Daten aus mehreren Quellen zu lesen, große Datenrahmen aus diesen Quellen zu generieren und aggregierte Analysen basierend auf den Fragen durchzuführen, die Sie beantworten möchten.

A lire également  Neuralink: Elon Musk erschafft ein kybernetisches Schwein

Eine der am häufigsten genutzten Data-Science-Bibliotheken ist Pandas.

Es wurde von Datenwissenschaftlern entwickelt, die mit R und Python vertraut waren, und wird heute von einer großen Anzahl von Wissenschaftlern und Analysten verwendet. Es verfügt über viele sehr praktische native Funktionen.

Es ist beispielsweise möglich, Daten aus mehreren Quellen zu lesen, große Datenrahmen aus diesen Quellen zu generieren und aggregierte Analysen basierend auf den Fragen durchzuführen, die Sie beantworten möchten.

Sie können aus den Analyseergebnissen auch Diagramme erstellen oder diese mithilfe der Visualisierungsfunktionen nach Excel exportieren.

Es ist auch in der Lage, numerische Tabellen und Zeitdaten zu manipulieren. Sie können aus den Analyseergebnissen auch Diagramme erstellen oder diese mithilfe der Visualisierungsfunktionen nach Excel exportieren. Es ist auch in der Lage, numerische Tabellen und Zeitdaten zu manipulieren.

Achat

Agate, ein neueres Python-Paket als Pandas, zielt ebenfalls darauf ab, Herausforderungen bei der Datenanalyse zu lösen.

Es ermöglicht Ihnen, Excel-Tabellen zu überprüfen und zu vergleichen sowie statistische Berechnungen in einer Datenbank durchzuführen. Insgesamt ist Achat einfacher zu erlernen als Pandas.

Darüber hinaus erleichtern die Datenvisualisierungsfunktionen die Anzeige der Analyseergebnisse.

Bokeh

Bokeh ist ein großartiges Werkzeug zur Datenvisualisierung.

Es ist mit Agate, Pandas und anderen Datenanalysebibliotheken kompatibel. Es kann auch mit reinem Python kombiniert werden.

Mit dieser Anwendung können Sie hochwertige Diagramme und Visualisierungen erstellen, ohne dass Code erforderlich ist.

NumPy

NumPy ist ein Python-Modul zur Durchführung wissenschaftlicher Berechnungen.

Es ist nützlich für lineare Algebra, Fourier-Transformationen und Zufallszahlenberechnungen. Es handelt sich um einen generischen mehrdimensionalen Datencontainer. Darüber hinaus lässt es sich problemlos in eine Vielzahl von Datenbanken integrieren.

Scipy

Scipy ist eine technische und wissenschaftliche Computerbibliothek.

Es verfügt über Module für datenwissenschaftliche und technische Aktivitäten wie Algebra, Interpolation, FFT sowie Signal- und Bildverarbeitung.

Scikit-lernen

Scikit-learn ist äußerst nützlich für Klassifizierungs-, Regressions- und Clustering-Methoden, die Entscheidungsbaumwälder, Gradient Boosting und K-Means integrieren.

Diese Python-Bibliothek für maschinelles Lernen funktioniert in Verbindung mit anderen Python-Bibliotheken wie NumPy und SciPy.

PyBrain

Python-Based Reinforcement Learning, Artificial Intelligence und Neural Network Library sind allesamt Akronyme für PyBrain.

Wie der Name schon sagt, handelt es sich um eine Bibliothek, die grundlegende, aber leistungsstarke Algorithmen für maschinelle Lernaufgaben bereitstellt. Es kann auch zum Testen und Vergleichen von Algorithmen in einer Vielzahl vordefinierter Szenarien verwendet werden.

TensorFlow

TensorFlow ist eine von Google Brain erstellte Bibliothek für maschinelles Lernen.

Seine Datenflussgrafiken und die flexible Architektur ermöglichen die Durchführung von Vorgängen und Berechnungen auf mehreren CPUs oder GPUs von einem PC, Server oder sogar mobilen Gerät über eine einzige API.

Cython ist eine weitere Python-Bibliothek, die es ermöglicht, Code so umzuwandeln, dass er in einer C-Umgebung ausgeführt werden kann, um die Ausführungszeit zu minimieren.

Mit PyMySQL hingegen können Sie eine Verbindung zu einer MySQL-Datenbank herstellen, Daten abrufen und Abfragen ausführen.

BeautifulSoup unterstützt das Lesen von XML- und HTML-Daten.

Endlich ist interaktives Programmieren mit dem iPython-Notebook möglich.

Lernen Sie Python mit OpenClassrooms

Wenn Sie Python schrittweise und kostenlos erlernen möchten, ist der Einführungskurs von OpenClassrooms eine gute Option für Anfänger.

Dieser Kurs ist in fünf Abschnitte unterteilt.

Nach einer ausführlichen Einführung in Python lernen Sie die objektorientierte Programmierung zu verstehen, sowohl von der Benutzerseite als auch von der Entwicklerseite.

Anschließend wird die Standardbibliothek entdeckt und der Kurs endet mit einigen zusätzlichen Anhängen.

Die OpenClassrooms-Lösung hat den Vorteil, dass sie kostenlos und für Anfänger zugänglich ist und Sie in Ihrem eigenen Tempo Fortschritte machen können.

Wenn Sie im Anschluss an das Programm die Prüfungsübungen bestehen, können Sie darüber hinaus eine von Fachleuten anerkannte Zertifizierung erwerben.

Einige Ressourcen, die Ihnen helfen, Python selbst zu erlernen.

Mehrere Personen haben PDFs oder Videos von Python-Tutorials für Neulinge geteilt.

Diese Materialien können nützlich sein, wenn Sie Autodidakt sind. Dominique Liard hat auf YouTube eine Reihe von Python-Lernvideos für diejenigen erstellt, die das Videoformat bevorzugen.

Version 3.9.7 verfügbar seit August 2021

Die gleichnamige Python-Sprache wurde von der Python Software Foundation auf Version 3.9.7 aktualisiert. Dies ist die sechste Wartung seit dem großen Upgrade auf Version 3.9 im Oktober 2020.

Python ist nativ kompatibel mit macOS 11 auf dem Apple M1.

Python-Kernentwickler haben im Dezember 2020 Version 3.9.1 der Python-Sprache veröffentlicht.

Dies ist die erste Version von macOS 11 Big Sur, die nativ mit Apples neuem Arm-basierten M1-Prozessor kompatibel ist.

Die Core Python-Teams haben macos11.0 erstellt, eine experimentelle Installation.

Mit Xcode 11 ist es möglich, Universal 2-Binärdateien zu entwickeln, die auf Apple Silicon-Prozessoren laufen.

Binärdateien können auf aktuellen Versionen von macOS erstellt und auf früheren Versionen des Betriebssystems bereitgestellt werden. Nach der Entscheidung von Apple, die Architektur zu ändern, ist dies eine Erleichterung für Datenwissenschaftler.

Google Atheris ist ein kostenloses Open-Source-Tool zum Auffinden von Python-Problemen.

Das Atheris-Tool wurde von Google-Sicherheitsspezialisten „frei verfügbar gemacht“.

Es hilft auch, Sicherheitsmängel und Schwachstellen im Python-Code zu erkennen und zu beheben, bevor es zu spät ist.

In diesem Dienstprogramm wird die „Fuzzing“-Technik verwendet.

Bei dieser Technik werden große Mengen zufälliger Daten an eine Anwendung übermittelt und die Ergebnisse analysiert, um potenzielle Ausfälle oder Anomalien zu erkennen. Entwickler können dann nach Fehlern im Anwendungscode suchen.

Dieses neue Tool reiht sich in eine lange Liste von Open-Source-„Fuzzern“ ein, die Google seit 2013 eingeführt hat: OSS-Fuzz, Syzkaller, ClusterFuzz, Fuzzilli und BrokenType.

Diese früheren Lösungen wurden hingegen verwendet, um Fehler in Software in C oder C++ zu finden.

Während Python laut TIOBE Index derzeit die drittbeliebteste Sprache ist, kommt Google mit Atheris der wachsenden Nachfrage nach.

Das Tool, das während eines internen Hackathons im Oktober 2020 erstellt wurde, ermöglicht das Fuzzen von Python 2.7- und 3.3+-Programmen sowie nativen Erweiterungen, die mit CPython erstellt wurden.

Es wird jedoch empfohlen, es mit Python 3.8 oder höherem Code zu verwenden, da die neuen Funktionen der Sprache es Atheris ermöglichen, mehr Probleme zu identifizieren. Atheris-Code finden Sie auf GitHub oder PyPi.

Python ist die beliebteste Programmiersprache

Tabelle der besten Programmiersprachen

Die Zahl der Programmiersprachen nimmt so stark zu, dass Entwickler Schwierigkeiten haben, herauszufinden, welche sie beherrschen sollen, um ihre Karriere voranzutreiben.

O’Reillys neue Analyse „Where Programming, Ops, AI, and the Cloud are Headed in 2021“ sagt voraus, welche Sprachen im Jahr 2021 am beliebtesten sein werden.

Die von den Analysten verwendeten Daten stammen aus O’Reilly-Onlineschulungen, Partnerschulungen und virtuellen Veranstaltungen.

Auch in diesem Jahr bleibt Python die beliebteste Programmiersprache. Das Interesse der Entwickler stieg im Vergleich zum Vorjahr um 27 %.

Wir können beobachten, dass diese Aufregung hauptsächlich mit den Vorteilen von Python für maschinelles Lernen zusammenhängt.

Tatsächlich stieg die Nutzung der Scikit-Learn-Bibliothek um 11 %.

Das PyTorch-Framework, das für Deep Learning verwendet wird, verzeichnet einen Popularitätszuwachs von 159 %.

Allerdings erfreuen sich auch andere Sprachen zunehmender Beliebtheit.

Im Vergleich zu 2020 stieg die Nutzung von JavaScript um 40 %, von C um 12 % und von C++ um 10 %.

Andere weniger bekannte Programmiersprachen wie Go, Rust, Ruby und Dart erfreuen sich wachsender Beliebtheit.

Rust könnte zur Sprache der Wahl für die Systemprogrammierung werden, beispielsweise für die Entwicklung neuer Betriebssysteme und Tools für den Cloud-Betrieb.

Ebenso hat sich Go als führende konkurrierende Programmiersprache etabliert.

O’Reilly betonte auch die Akzeptanz der „Low-Code“- oder „No-Code“-Programmierung, die es Menschen ohne Computer-Programmierkenntnisse ermöglicht, Anwendungen mit einfachen, einfachen grafischen Schnittstellen zu erstellen.

Professionelle Entwickler laufen hingegen nicht Gefahr, ihren Arbeitsplatz zu verlieren.

Neue Sprachen, Bibliotheken und Tools für diese Art der Programmierung erfordern immer die Erstellung und Wartung durch erfahrene Entwickler.

Auch künstliche Intelligenz und maschinelles Lernen erfreuen sich zunehmender Beliebtheit.

Das Interesse der Entwickler an KI stieg um 64 %, verglichen mit 14 % für ML.

Gleichzeitig stieg die Verarbeitung natürlicher Sprache um 21 %.

TensorFlow ist die beliebteste Plattform für maschinelles Lernen, deren Interesse bis 2020 voraussichtlich um 6 % steigen wird.

Immer mehr Entwickler möchten lernen, wie sie die Vorteile von Cloud Computing nutzen können.

Innerhalb eines Jahres stieg das Interesse an AWS um 5 %.

Am beliebtesten bleibt die Cloud von Amazon, das Interesse an Microsoft Azure stieg jedoch um 136 %. Bei Google Cloud beträgt der Anstieg 84 %.

Dieser Trend deutet darauf hin, dass immer mehr Unternehmen ihre Daten und Anwendungen in die Cloud migrieren. Schließlich stieg die Akzeptanz des Online-Lernens um 96 %.

Dies ist kaum verwunderlich, da der COVID-19-Ausbruch eine Präsenzschulung verhindert.

Die Nutzung von Lehrbüchern stieg um 11 %, während Lehrfilme um 24 % zunahmen…

Python: FSP hat zwei Schwachstellen behoben, die eine Remote-Codeausführung ermöglichen.

IT Sicherheit

Anfang 2021 wurden zwei Schwachstellen entdeckt, die aktuelle Versionen von Python betreffen.

Die Schwachstelle „CVE-2021-3177“ betraf den Puffer und könnte zur Remote-Codeausführung in Python-Programmen führen.

Glücklicherweise stellt PSF in einem Blogbeitrag klar, dass die Remotecodeausführung eine Reihe von Bedingungen erfordert.

Dieser Fehler ermöglicht jedoch DDoS-Angriffe. Um ein Programm zum Absturz zu bringen, könnte ein Cyber-Angreifer den Puffer überlasten. Die zweite Schwachstelle, CVE-2021-23336, ermöglicht eine Vergiftung des Webcaches.

Nachdem diese Probleme entdeckt wurden, hat die Python Foundation beide Fehler mit der Veröffentlichung von Python 3.8.8 und 3.9.2 behoben. Daher ist es wichtig, Ihre Python-Version zu aktualisieren, um dieses Sicherheitsrisiko zu beseitigen.

Zum ersten Mal wird Python Java und C im TIOBE-Index überholen.

TIOBE präsentiert monatlich ein Ranking der beliebtesten Programmiersprachen.

Dieses monatliche Ranking hilft uns, Veränderungen im Codierungsbereich im Laufe der Zeit einzuschätzen.

Das prozentuale Bewertungssystem basiert auf dem Suchvolumen für jede Programmiersprache auf Bing, Amazon, YouTube, Wikipedia, Google, Yahoo und Baidu.

Im Juni 2021 belegt die Sprache C mit einer Punktzahl von 12,54 % den ersten Platz. Dieser Wert spiegelt jedoch einen Rückgang von 4,65 % im Vergleich zum Juni 2020 wider.

Die Sprache Python wiederum belegt mit einem Wert von 11,84 % den zweiten Platz. Daher beträgt der Unterschied zwischen diesen beiden Sprachen nur 0,7 %. Die Punktzahl von Python stieg im letzten Jahr um 3,48 %.

An dritter Stelle folgt Java mit einem Wert von 11,54 %, das sind 4,56 % weniger als im Juni 2020. Damals lag Java auf dem zweiten Platz.

Laut Paul Jansen, CEO von TIOBE Software, wird Python bald den Spitzenplatz in der Rangliste einnehmen. Dieser Anstieg ist im Juli 2021 möglich, wenn der TIOBE-Index sein 20-jähriges Jubiläum feiert.

Nur C und Java belegten in den letzten zwei Jahrzehnten den Spitzenplatz. Die Vormachtstellung von Python wäre daher ein entscheidender Moment in der Geschichte der Informatik …

C++, C#, Visual Basic, JavaScript und PHP blieben seit Juni 2020 im Ranking von Platz vier bis neun. Assembly liegt mit einem Wert von 2,05 Prozent auf Platz acht.

Dies stellt einen Zuwachs von 1,09 Prozent im Vergleich zum Juni 2020 dar, wo diese Sprache auf Platz 14 lag.

SQL komplettiert mit einem Wert von 1,88 % die Top 10. Dies entspricht einer Steigerung von 0,15 % im Vergleich zum Juni 2020.

Außerhalb der Top 10 stieg Visual Basic Classic innerhalb eines Jahres um acht Plätze.

Groovy rückte auf Platz 12 um 19 Plätze vor, während Fortran auf Platz 17 um 20 Plätze vorrückte.

R und Swift hingegen fielen jeweils um fünf Plätze zurück und erreichten den 14. bzw. 16. Platz. MATLAB, das um vier Plätze zurückfiel, und Go, das um acht zurückfiel, runden die Top 20 ab.

Dart, Kotlin, Julia, Rust, TypeScript und Elixir sind einige der vielversprechenden Sprachen für die Zukunft.

Diese neuen Sprachen sind vorerst noch weit von der Spitze entfernt und haben sich im vergangenen Jahr in der Rangliste nicht wesentlich verändert.

Laut SlashData haben Python und JavaScript die größten Entwickler-Communitys.

Die globale Entwicklergemeinschaft verzeichnete in den ersten sechs Monaten des Jahres 2021 ein rasantes Wachstum. Dies geht aus einem von SlashData veröffentlichten Bericht hervor.

Der Umfrage zufolge gab es im ersten Quartal 2021 weltweit 24,3 Millionen Entwickler. Dies entspricht einem Anstieg von 14 % im Vergleich zu den 21,3 Millionen im Oktober 2020.

JavaScript hat in sechs Monaten rund 1,4 Millionen neue Entwickler angezogen. Diese Sprache hat mit 13,8 Millionen Entwicklern die größte Entwicklergemeinschaft.

Mit 4,5 Millionen neuen Entwicklern, die zwischen dem vierten Quartal 2017 und dem ersten Quartal 2021 hinzukamen, verzeichnete es auch das schnellste Wachstum.

Selbst in Bereichen, in denen es nicht die bevorzugte Sprache ist, wie etwa in der Datenwissenschaft, verwendet etwa ein Viertel der Ingenieure JavaScript.

Diagramm der Entwicklergemeinschaften

An zweiter Stelle steht Python mit einer Entwicklungsgemeinschaft von 10,1 Millionen Menschen.

Diese Community wächst mit einer Rate von 20 %, was die schnellste Wachstumsrate unter allen Programmiersprachen darstellt.

Die Popularität von Python ist der Studie zufolge vor allem auf den Aufstieg der Datenwissenschaft und des maschinellen Lernens zurückzuführen.

Tatsächlich wird Python von etwa 70 % der Datenwissenschaftler und Ingenieure für maschinelles Lernen verwendet.

Im Vergleich dazu verwenden nur 17 % der Menschen R. Java liegt mit 9,4 Millionen Entwicklern an zweiter Stelle, gefolgt von C/C++ mit 7,3 Millionen und C# mit 6,5 Millionen.

Mit 2,6 Millionen bzw. 2,5 Millionen Entwicklern liegt die Kotlin-Sprache von Android leicht vor Swift von iOS.

Laut seinem Entwickler wird Python 4.0 möglicherweise nie das Licht der Welt erblicken.

Guido Van Rossum

Python-Gründer Guido Van Rossum sagte, dass Version 4 der Sprache möglicherweise nie das Licht der Welt erblicken werde. Dies ist vor allem auf die vielen Herausforderungen zurückzuführen, die beim Übergang von Python 2.0 zu Python 3.0 im Jahr 2008 aufgetreten sind.

In einem Interview mit Microsoft Reactor stellte Van Rossum fest, dass sich weder er noch das Kernteam der Python-Entwickler aufgrund der vielen Hindernisse, die während des vorherigen großen Updates aufgetreten sind, motiviert fühlen, eine Version 4.0 zu erstellen.

Da Python 3 nicht mit Python kompatibel ist, konnten Entwickler, die Abhängigkeiten von Python 2-Softwarebibliotheken erstellten, diese nicht auf Python aktualisieren.

Es folgte eine lange Migrationsphase, die mehrere Jahre dauerte und beim Initiator der Sprache eine schmerzliche Erinnerung hinterließ. Zur Erinnerung: Der Lebenszyklus von Python 2 endete im April 2020 mit Version 2.7.18.

Der einzige Grund, warum Python 4.0 das Licht der Welt erblicken würde, wäre eine wesentliche Änderung in Bezug auf die C-Kompatibilität. Das Update wäre dann notwendig. Ansonsten wird sich Python weiterhin an einen strengen jährlichen Veröffentlichungsplan halten.

Die Versionen 3.x werden bis 3.99 beibehalten, dann wird bei Bedarf eine weitere Ziffer nach dem Komma hinzugefügt.

Python wird in etwa 5 Jahren fünfmal schneller werden

Geschwindigkeit

Die Langsamkeit von Python ist trotz seiner vielen Stärken einer seiner grundlegenden Mängel.

Diese mit einem hohen Abstraktionsgrad interpretierte Sprache ist viel langsamer als C++ oder Java. Dies könnte sich jedoch in zukünftigen Ausgaben ändern.

Guido Van Rossum, der Sprachdesigner, sagte auf dem Python Language Summit, dass die Geschwindigkeit mit der im Oktober 2022 erscheinenden Version 3.11 verdoppelt wird.

Und das ist erst der Anfang.

Jedes Jahr wird eine neue Ausgabe erscheinen, und das derzeitige Tempo wird sich voraussichtlich innerhalb von fünf Jahren verfünffachen.

  1. Van Rossum erklärt in einer auf GitHub geteilten Präsentation, wie er dieses Kunststück vollbringen will.

Zu den untersuchten Ansätzen gehören ein adaptiver Interpreter, Frame-Stack-Optimierung und Overhead-freie Ausnahmeunterstützung.

Weitere Verbesserungen, wie ein Application Binary Interface (ABI) oder ein eigenständiger Codegenerator, sollen Python weiter beschleunigen. Daher scheint Geschwindigkeit das Hauptanliegen der Python-Designer zu sein.