Katalog
/
Programmierung
/
Python und Spark für Big Data (PySpark)

Python und Spark für Big Data (PySpark)

Nutzen Sie die kombinierte Leistung von Python und Spark in diesem Intensivkurs zu PySpark. Tauchen Sie tief in die Verarbeitung von Big Data, maschinelles Lernen und fortgeschrittene Analysen ein, zugeschnitten auf Entwickler, IT-Experten und Datenwissenschaftler.

Was werden Sie lernen?

Nutzen Sie die kombinierte Leistung von Python und Spark in diesem Intensivkurs zu PySpark. Tauchen Sie tief in die Verarbeitung von Big Data, maschinelles Lernen und fortgeschrittene Analysen ein, zugeschnitten auf Entwickler, IT-Experten und Datenwissenschaftler. Am Ende des Kurses werden die Teilnehmer PySpark sicher für eine Vielzahl von Big-Data-Herausforderungen einsetzen können.

Während des Kurses werden die Teilnehmer:

• Beherrschung der Grundlagen: Grundlegende Kenntnisse über die Python-Programmierung und die Kernfunktionen von Spark erwerben.

• Praxisnahes Lernen: Teilnahme an praktischen Übungen, die reale Szenarien widerspiegeln.

• Fortgeschrittene Analytik: Vertiefen Sie sich in maschinelles Lernen mit MLlib, Regressionen und Clustering.

• Streaming & NLP: Erfahren Sie mehr über Spark-Streaming und natürliche Sprachverarbeitung.

Voraussetzungen:

Allgemeine Programmierkenntnisse und idealerweise Kenntnisse in Python.

Kursübersicht*:

*Wir wissen, dass jedes Team eigene Bedürfnisse und Spezifikationen hat. Deshalb können wir die Schulungsübersicht nach Bedarf anpassen.

können wir das Schulungskonzept je nach Bedarf anpassen.

<strong >Einführung in Big-Data-Technologien

• Verstehen von Big Data

• Einführung in Spark, Python und PySpark

<strong >Verteilen von Daten und Berechnungen

• Erforschung des Resilient Distributed Datasets Framework

• Erfassen der Spark-API-Operatoren

<strong >Einrichten Ihrer Umgebung

• Integration von Python mit Spark und PySpark-Einrichtung

• Nutzung von AWS EC2-Instanzen für Spark und Databricks

• AWS EMR-Cluster-Initialisierung

<strong >Grundlagen der Python-Programmierung

• Einführung in Python über Jupyter Notebook

• Zentrale Python-Konzepte: Variablen, Datentypen, Listen, Schleifen, Funktionen und Klassen

• Umgang mit Dateien, Ausnahmen und Integration mit Daten und APIs

<strong >Spark DataFrame-Grundlagen

• Kennenlernen von Spark-DataFrames

• Grundlegende Operationen, Groupby, Aggregate, Zeitstempel und Datumsverarbeitung

• Praktische Übung zum Spark DataFrame-Projekt

Maschinelles Lernen mit MLlib

  • Einführung in Regressionen: Lineare und logistische Theorien
  • Praktische Übungen zu linearer Regression, logistischer Regression
  • Vertiefung in Baummethoden: Zufallsforste, Entscheidungsbäume
  • Clustering mit K-means und seine praktische Anwendung

Natürliche Sprachverarbeitung

  • Grundlagen des NLP und seine Toolsets
  • Praktische NLP-Übung

Spark Streaming auf Python

  • Verstehen von Spark Streaming
  • Praktische Spark-Streaming-Übung

Praxisnahes Lernen mit erfahrenen Trainern an Ihrem Standort für Organisationen.

4.347€*
Graph Icon - Education X Webflow Template
Niveau:
intermediate
Clock Icon - Education X Webflow Template
Dauer:
21
Stunden (Tage:
3
)
Camera Icon - Education X Webflow Template
Training angepasst an Ihre Bedürfnisse
Star Icon - Education X Webflow Template
Intensive praktische Erfahrung in einer speziellen Umgebung
*Der Preis kann je nach Teilnehmerzahl, Änderung des Programms, Standort usw. variieren.

Neue Fähigkeiten erlernen, angeleitet von erfahrenen Trainern von überall.

3.012€*
Graph Icon - Education X Webflow Template
Niveau:
intermediate
Clock Icon - Education X Webflow Template
Dauer:
21
Stunden (Tage:
3
)
Camera Icon - Education X Webflow Template
Training angepasst an Ihre Bedürfnisse
Star Icon - Education X Webflow Template
Reduzierte Schulungskosten
*Der Preis kann je nach Teilnehmerzahl, Änderung des Programms, Standort usw. variieren.