Certificación
Este curso incluye:
-
Idioma - Español
-
PC, tablet o móvil
-
Modo: Presencial/Online
-
Descripción curso
El examen AWS Certified Machine Learning - Specialty (MLS-C01) está dirigido a personas que desempeñan roles de desarrollo de inteligencia artificial o machine learning (IA/ML) o ciencia de datos.
El examen certifica la capacidad de un candidato para diseñar, crear, implementar, optimizar, entrenar, ajustar y mantener soluciones de ML para determinados problemas empresariales mediante la nube de AWS.
-
Temario curso
Sección 1: Ingeniería de datos
1.1: Crear repositorios de datos para machine learning- Identificar orígenes de datos (p. ej., el contenido y la ubicación, las fuentes principales, como los datos de los usuarios).
- Determinar los medios de almacenamiento (p. ej., base de datos, lago de datos, S3, Elastic File System, EBS).
1.2: Identificar e implementar una solución de ingesta de datos- Estilos y tipos de trabajos de datos (carga por lotes, streaming).
- Canalizaciones de ingesta de datos (cargas de trabajo de ML basadas en lotes y cargas de trabajo de ML basadas en streaming).
- Programación de trabajos.
1.3: Identificar e implementar una solución de transformación de datos- Transformación del tránsito de datos (ETL: Glue, EMR, AWS Batch).
- Gestionar datos específicos de ML mediante MapReduce (Hadoop, Spark, Hive).
Sección 2: Análisis exploratorio de datos
2.1: Limpiar y preparar los datos para el modelado- Identificar y gestionar los datos faltantes, los datos dañados, las palabras vacías, etc.
- Formatear, normalizar, aumentar y escalar datos.
- Datos etiquetados (reconocer cuándo tiene suficientes datos etiquetados e identificar las estrategias de mitigación [herramientas de etiquetado de datos (Mechanical Turk, trabajo manual)]).
2.2: Realizar la ingeniería de funciones- Identificar y extraer funciones de conjuntos de datos, incluso de orígenes de datos como texto, voz, imágenes, conjuntos de datos públicos, etc.
- Analizar o evaluar los conceptos de ingeniería de funciones (agrupación, tokenización, valores atípicos, funciones sintéticas, codificación one-hot, reducción de la dimensión de los datos).
2.3: Analizar y visualizar datos para machine learning- Representación gráfica (diagrama de dispersión, series temporales, histograma, diagrama de caja).
- Interpretación de estadísticas descriptivas (correlación, estadísticas de resumen, valor p).
- Agrupamiento (jerárquico, diagnóstico, diagrama de codos, tamaño del clúster).
Sección 3: Modelado
3.1: Enmarcar los problemas empresariales como problemas de machine learning- Determinar cuándo utilizar ML y cuándo no.
- Conocer la diferencia entre el aprendizaje supervisado y el no supervisado.
- Seleccionar entre clasificación, regresión, pronóstico, agrupamiento, recomendación, etc.
3.2: Seleccionar los modelos adecuados para un problema de machine learning determinado- Xgboost, regresión logística, K-means, regresión lineal, árboles de decisión, bosques aleatorios, Recurrent Neural Network (RNN, red neuronal recurrente), Convolutional Neural Network (CNN, red neuronal convolucional), conjuntos, aprendizaje por transferencia.
- Expresar la intuición detrás de los modelos.
3.3: Entrenar modelos de machine learning- Entrenar la validación de pruebas dividida y la validación cruzada.
- Optimizador, descenso de gradiente, funciones de pérdida, mínimos locales, convergencia, lotes, probabilidad, etc.
- Elección de cómputos (GPU frente a CPU, distribuida frente a no distribuida, plataforma [Spark frente a no Spark]).
- Actualizaciones y reentrenamiento de modelos.
3.4: Realizar la optimización de hiperparámetros- Regularización.
- Validación cruzada.
- Inicialización de modelos.
- Arquitectura de redes neuronales (capas/nodos), tasa de aprendizaje, funciones de activación.
- Modelos basados en árboles (número de árboles, número de niveles).
- Modelos lineales (tasa de aprendizaje).
3.5: Evaluar los modelos de machine learning- Evitar el sobreajuste o el ajuste insuficiente (detectar y gestionar el sesgo y la diferencia).
- Métricas (Area under the ROC curve (AUC-ROC, área bajo la curva ROC), exactitud, precisión, exhaustividad, Root Mean Square Error [RMSE, raíz del error cuadrático medio], puntuación F1).
- Matriz de confusión.
- Evaluación de modelos sin conexión y en línea, pruebas A/B.
- Comparar modelos mediante métricas (tiempo de entrenamiento de un modelo, calidad del modelo, costos de ingeniería).
- Validación cruzada.
Sección 4: Implementación y operaciones de machine learning
4.1: Crear soluciones de machine learning para el rendimiento, la disponibilidad, la escalabilidad, la resiliencia y la tolerancia a errores- Registro y supervisión del entorno de AWS.
- Varias regiones, varias availability zones (AZ, zonas de disponibilidad).
- AMI/imagen dorada.
- Contenedores de Docker.
- Grupos de Auto Scaling.
- Dimensionamiento correcto.
- Balanceo de carga.
- Prácticas recomendadas de AWS.
4.2: Recomendar e implementar los servicios y funciones de machine learning adecuados para un problema determinado- ML en AWS (servicios de aplicaciones).
- Límites de servicio de AWS.
- Crear su propio modelo frente a algoritmos integrados de SageMaker.
- Infraestructura: (spot, tipos de instancias), consideraciones de costos.
4.3: Aplicar las prácticas de seguridad básicas de AWS a las soluciones de machine learning- IAM.
- Políticas de bucket de S3.
- Grupos de seguridad.
- VPC.
- Cifrado/anonimización.
4.4: Implementar y poner en práctica soluciones de machine learning- Exponer los puntos de enlace e interactuar con ellos.
- Control de versiones de modelos de ML.
- Pruebas A/B.
- Reentrenar canalizaciones.
- Depurar y solucionar problemas de ML.