info@datayanalytics.com - (+51) 916 591 245 - (+51) 976 760 803
info@datayanalytics.com - (+51) 916 591 245 - (+51) 976 760 803
Muy importante para trabajar en Ciencia de Datos
Curso desde
INTERMEDIO
Estudiantes y profesionales que deseen aprender PySpark para trabajar en proyectos de Machine Learning.
Precio regular: S/ 250 ó $75
SESIONES
ASINCRÓNNICAS
32 horas académicas
6 sesiones
Válido para todas las personas naturales que realicen una compra en tres (3) o seis (6) cuotas.
MÓDULO 1: Conociendo PySpark
1.1. Acerca de Pyspark
• Instalación Pyspark en Google colab
• Importando archive de datos y adaptando a format Spark
• Data Wrangling / Manipulación de datos con Pyspark
• Lectura, Formato, Agrupamiento
1.2. RDD vs DataFrame en Spark
• Paralelización de operaciones
1.3. EDA / Análisis exploratorio de datos
• Identificación de valores Nulos
• Identificación y Tratamiento de Outliers
• Etapas de modelamiento de datos en Colab con Pyspark
MÓDULO 2: Machine Learning en PySpark
2.1. Ingeniería de características en Machine Learning
• Selección de variables,
• Tratamiento de data desbalanceada
• OneHotEncoderEstimator
• StandardScaler
• MinMaxScaler
• Rformula
• ChiSqSelector
2.2. Esquema de aprendizaje de la Regresión Logística
• Métricas de evaluación
• Modelo Logístico: binomial-multinomial
• Matriz de confusión, Curva ROC
2.3. Caso de negocio
MÓDULO 3: Algoritmos avanzados de Machine Learning en clasificación predictiva en PySpark
3.1. Árboles de clasificación
• Support Vector Machines (SVM)
• Stochastic Gradient Boosting
• Redes neuronales
3.2. Caso de negocio
MÓDULO 4: Clustering
4.1. Algoritmos de agrupación en clústeres
• K-means.
• Bisecting K-means.
• Gaussian Mixture Model (GMM)
4.2. Caso de negocio
MÓDULO 5: Modelo de sistema de recomendación de PySpark
5.1. Algoritmos de recomendación
5.2. Caso de negocio
Machine Learning, es una disciplina de ciencias informáticas directamente relacionada con la Inteligencia Artificial, basada en la idea de que los sistemas pueden aprender de datos. El conocimiento de Machine Learning en las distintas ramas de la ciencia tiene una alta demanda a nivel mundial, es por ello que su aprendizaje es muy importante.
(31/12/2021) El instructor explicó muy bien todo, lo recomiendo me gusto mucho todo el aprendizaje.
(15/12/2021) Recomiendo el curso porque el aprendizajes es bueno y sus cursos son completos.
(14/12/2021) La clase está bien organizada, el docente es una persona muy preparada en la materia.
📩 Contacto: info@datayanalytics.com
📱(+51) 916 591 245 | (+51) 976 760 803 | (+51) 967 992 194
🏢RUC: 20600323441
📍Av. Paseo de la República 6941, Lima - Perú
© Data & Analytics 2020
Esta página web utiliza cookies. Al seguir utilizando esta página, aceptas nuestro uso de cookies.