Nutzen Sie die kombinierte Leistung von Python und Spark in diesem Intensivkurs zu PySpark. Tauchen Sie tief in die Verarbeitung von Big Data, maschinelles Lernen und fortgeschrittene Analysen ein, zugeschnitten auf Entwickler, IT-Experten und Datenwissenschaftler.
Nutzen Sie die kombinierte Leistung von Python und Spark in diesem Intensivkurs zu PySpark. Tauchen Sie tief in die Verarbeitung von Big Data, maschinelles Lernen und fortgeschrittene Analysen ein, zugeschnitten auf Entwickler, IT-Experten und Datenwissenschaftler. Am Ende des Kurses werden die Teilnehmer PySpark sicher für eine Vielzahl von Big-Data-Herausforderungen einsetzen können.
Während des Kurses werden die Teilnehmer:
• Beherrschung der Grundlagen: Grundlegende Kenntnisse über die Python-Programmierung und die Kernfunktionen von Spark erwerben.
• Praxisnahes Lernen: Teilnahme an praktischen Übungen, die reale Szenarien widerspiegeln.
• Fortgeschrittene Analytik: Vertiefen Sie sich in maschinelles Lernen mit MLlib, Regressionen und Clustering.
• Streaming & NLP: Erfahren Sie mehr über Spark-Streaming und natürliche Sprachverarbeitung.
Allgemeine Programmierkenntnisse und idealerweise Kenntnisse in Python.
*Wir wissen, dass jedes Team eigene Bedürfnisse und Spezifikationen hat. Deshalb können wir die Schulungsübersicht nach Bedarf anpassen.
können wir das Schulungskonzept je nach Bedarf anpassen.
<strong >Einführung in Big-Data-Technologien
• Verstehen von Big Data
• Einführung in Spark, Python und PySpark
<strong >Verteilen von Daten und Berechnungen
• Erforschung des Resilient Distributed Datasets Framework
• Erfassen der Spark-API-Operatoren
<strong >Einrichten Ihrer Umgebung
• Integration von Python mit Spark und PySpark-Einrichtung
• Nutzung von AWS EC2-Instanzen für Spark und Databricks
• AWS EMR-Cluster-Initialisierung
<strong >Grundlagen der Python-Programmierung
• Einführung in Python über Jupyter Notebook
• Zentrale Python-Konzepte: Variablen, Datentypen, Listen, Schleifen, Funktionen und Klassen
• Umgang mit Dateien, Ausnahmen und Integration mit Daten und APIs
<strong >Spark DataFrame-Grundlagen
• Kennenlernen von Spark-DataFrames
• Grundlegende Operationen, Groupby, Aggregate, Zeitstempel und Datumsverarbeitung
• Praktische Übung zum Spark DataFrame-Projekt
Maschinelles Lernen mit MLlib
Natürliche Sprachverarbeitung
Spark Streaming auf Python
Praxisnahes Lernen mit erfahrenen Trainern an Ihrem Standort für Organisationen.
Neue Fähigkeiten erlernen, angeleitet von erfahrenen Trainern von überall.