Curso de Certificación:
AWS Certified Machine Learning - Specialty

crd-image

Certificación

Este curso incluye:

  • Idioma - EspañolIdioma - Español
  • PC, tablet o móvilPC, tablet o móvil
  • Modo: Presencial/OnlineModo: Presencial/Online

 

  • Descripción curso

    El examen AWS Certified Machine Learning - Specialty (MLS-C01) está dirigido a personas que desempeñan roles de desarrollo de inteligencia artificial o machine learning (IA/ML) o ciencia de datos.

    El examen certifica la capacidad de un candidato para diseñar, crear, implementar, optimizar, entrenar, ajustar y mantener soluciones de ML para determinados problemas empresariales mediante la nube de AWS.

  • Temario curso

     

    Sección 1: Ingeniería de datos

    1.1: Crear repositorios de datos para machine learning
    • Identificar orígenes de datos (p. ej., el contenido y la ubicación, las fuentes principales, como los datos de los usuarios).
    • Determinar los medios de almacenamiento (p. ej., base de datos, lago de datos, S3, Elastic File System, EBS).

     

    1.2: Identificar e implementar una solución de ingesta de datos
    • Estilos y tipos de trabajos de datos (carga por lotes, streaming).
    • Canalizaciones de ingesta de datos (cargas de trabajo de ML basadas en lotes y cargas de trabajo de ML basadas en streaming).
    • Programación de trabajos.

     

    1.3: Identificar e implementar una solución de transformación de datos
    • Transformación del tránsito de datos (ETL: Glue, EMR, AWS Batch).
    • Gestionar datos específicos de ML mediante MapReduce (Hadoop, Spark, Hive).

     

    Sección 2: Análisis exploratorio de datos

    2.1: Limpiar y preparar los datos para el modelado
    • Identificar y gestionar los datos faltantes, los datos dañados, las palabras vacías, etc.
    • Formatear, normalizar, aumentar y escalar datos.
    • Datos etiquetados (reconocer cuándo tiene suficientes datos etiquetados e identificar las estrategias de mitigación [herramientas de etiquetado de datos (Mechanical Turk, trabajo manual)]).

     

    2.2: Realizar la ingeniería de funciones
    • Identificar y extraer funciones de conjuntos de datos, incluso de orígenes de datos como texto, voz, imágenes, conjuntos de datos públicos, etc.
    • Analizar o evaluar los conceptos de ingeniería de funciones (agrupación, tokenización, valores atípicos, funciones sintéticas, codificación one-hot, reducción de la dimensión de los datos).

     

    2.3: Analizar y visualizar datos para machine learning
    • Representación gráfica (diagrama de dispersión, series temporales, histograma, diagrama de caja).
    • Interpretación de estadísticas descriptivas (correlación, estadísticas de resumen, valor p).
    • Agrupamiento (jerárquico, diagnóstico, diagrama de codos, tamaño del clúster).

     

    Sección 3: Modelado

    3.1: Enmarcar los problemas empresariales como problemas de machine learning
    • Determinar cuándo utilizar ML y cuándo no.
    • Conocer la diferencia entre el aprendizaje supervisado y el no supervisado.
    • Seleccionar entre clasificación, regresión, pronóstico, agrupamiento, recomendación, etc.

     

    3.2: Seleccionar los modelos adecuados para un problema de machine learning determinado
    • Xgboost, regresión logística, K-means, regresión lineal, árboles de decisión, bosques aleatorios, Recurrent Neural Network (RNN, red neuronal recurrente), Convolutional Neural Network (CNN, red neuronal convolucional), conjuntos, aprendizaje por transferencia.
    • Expresar la intuición detrás de los modelos.

     

    3.3: Entrenar modelos de machine learning
    • Entrenar la validación de pruebas dividida y la validación cruzada.
    • Optimizador, descenso de gradiente, funciones de pérdida, mínimos locales, convergencia, lotes, probabilidad, etc.
    • Elección de cómputos (GPU frente a CPU, distribuida frente a no distribuida, plataforma [Spark frente a no Spark]).
    • Actualizaciones y reentrenamiento de modelos.

     

    3.4: Realizar la optimización de hiperparámetros
    • Regularización.
    • Validación cruzada.
    • Inicialización de modelos.
    • Arquitectura de redes neuronales (capas/nodos), tasa de aprendizaje, funciones de activación.
    • Modelos basados en árboles (número de árboles, número de niveles).
    • Modelos lineales (tasa de aprendizaje).

     

    3.5: Evaluar los modelos de machine learning
    • Evitar el sobreajuste o el ajuste insuficiente (detectar y gestionar el sesgo y la diferencia).
    • Métricas (Area under the ROC curve (AUC-ROC, área bajo la curva ROC), exactitud, precisión, exhaustividad, Root Mean Square Error [RMSE, raíz del error cuadrático medio], puntuación F1).
    • Matriz de confusión.
    • Evaluación de modelos sin conexión y en línea, pruebas A/B.
    • Comparar modelos mediante métricas (tiempo de entrenamiento de un modelo, calidad del modelo, costos de ingeniería).
    • Validación cruzada.

     

    Sección 4: Implementación y operaciones de machine learning

    4.1: Crear soluciones de machine learning para el rendimiento, la disponibilidad, la escalabilidad, la resiliencia y la tolerancia a errores
    • Registro y supervisión del entorno de AWS.
    • Varias regiones, varias availability zones (AZ, zonas de disponibilidad).
    • AMI/imagen dorada.
    • Contenedores de Docker.
    • Grupos de Auto Scaling.
    • Dimensionamiento correcto.
    • Balanceo de carga.
    • Prácticas recomendadas de AWS.

     

    4.2: Recomendar e implementar los servicios y funciones de machine learning adecuados para un problema determinado
    • ML en AWS (servicios de aplicaciones).
    • Límites de servicio de AWS.
    • Crear su propio modelo frente a algoritmos integrados de SageMaker.
    • Infraestructura: (spot, tipos de instancias), consideraciones de costos.

     

    4.3: Aplicar las prácticas de seguridad básicas de AWS a las soluciones de machine learning
    • IAM.
    • Políticas de bucket de S3.
    • Grupos de seguridad.
    • VPC.
    • Cifrado/anonimización.

     

    4.4: Implementar y poner en práctica soluciones de machine learning
    • Exponer los puntos de enlace e interactuar con ellos.
    • Control de versiones de modelos de ML.
    • Pruebas A/B.
    • Reentrenar canalizaciones.
    • Depurar y solucionar problemas de ML.