Curso desde
INTERMEDIO
Estudiantes y profesionales que deseen aprender PySpark para trabajar en proyectos de Machine Learning.
Precio regular: S/ 250 ó $75
SESIONES
ASINCRÓNICAS
32 horas académicas
6 sesiones
MÓDULO 1: Conociendo PySpark
1.1. Acerca de Pyspark
• Instalación Pyspark en Google colab
• Importando archive de datos y adaptando a format Spark
• Data Wrangling / Manipulación de datos con Pyspark
• Lectura, Formato, Agrupamiento
1.2. RDD vs DataFrame en Spark
• Paralelización de operaciones
1.3. EDA / Análisis exploratorio de datos
• Identificación de valores Nulos
• Identificación y Tratamiento de Outliers
• Etapas de modelamiento de datos en Colab con Pyspark
MÓDULO 2: Machine Learning en PySpark
2.1. Ingeniería de características en Machine Learning
• Selección de variables,
• Tratamiento de data desbalanceada
• OneHotEncoderEstimator
• StandardScaler
• MinMaxScaler
• Rformula
• ChiSqSelector
2.2. Esquema de aprendizaje de la Regresión Logística
• Métricas de evaluación
• Modelo Logístico: binomial-multinomial
• Matriz de confusión, Curva ROC
2.3. Caso de negocio
MÓDULO 3: Algoritmos avanzados de Machine Learning en clasificación predictiva en PySpark
3.1. Árboles de clasificación
• Support Vector Machines (SVM)
• Stochastic Gradient Boosting
• Redes neuronales
3.2. Caso de negocio
MÓDULO 4: Clustering
4.1. Algoritmos de agrupación en clústeres
• K-means.
• Bisecting K-means.
• Gaussian Mixture Model (GMM)
4.2. Caso de negocio
MÓDULO 5: Modelo de sistema de recomendación de PySpark
5.1. Algoritmos de recomendación
5.2. Caso de negocio
Paga con tarjetas de crédito BBVA, BCP y DINNERS CLUB y obtén hasta 06 cuotas sin intereses (válido para Perú).
Para estudiantes del extranjero, paga de forma rápida y segura desde cualquier país.
(31/12/2021) El instructor explicó muy bien todo, lo recomiendo me gusto mucho todo el aprendizaje.
(15/12/2021) Recomiendo el curso porque el aprendizajes es bueno y sus cursos son completos.
(14/12/2021) La clase está bien organizada, el docente es una persona muy preparada en la materia.
📩 E-mail: info@datayanalytics.com
🏢RUC: 20600323441
Dirección fiscal: Av. Paseo de la República 6941, Lima - Perú
Esta página web utiliza cookies. Al seguir utilizando esta página, aceptas nuestro uso de cookies.