Unidad 3

APRENDIZAJE POR REFUERZO

Descripción de la unidad

Ingresa a la descripción de la unidad 2 para que visualices ¿qué vas a aprender? y ¿qué necesitas para realizar este trabajo?

Lección 1:  Conceptos del Aprendizaje por Refuerzo

En esta sesión, los estudiantes serán introducidos al emocionante mundo del Aprendizaje por Refuerzo (RL), un área de la inteligencia artificial que se centra en que los agentes aprendan a tomar decisiones óptimas a través de la interacción con su entorno.

Exploraremos los conceptos fundamentales del RL, incluyendo los elementos básicos del agente, el entorno, las acciones, los estados y las recompensas, así como los principios subyacentes del Proceso de Decisión de Markov (MDP) y los algoritmos más comunes utilizados en RL, como Q-Learning, Sarsa y la Política de Gradiente de Montecarlo.

Descripción de la Lección

En este documento encuentras a detalle la descripción de la lección.

ACTIVIDADES DE APRENDIZAJE

Actividad 1. Introducción

En la actividad de Introducción al Aprendizaje por Refuerzo, los estudiantes serán introducidos al concepto fundamental del Aprendizaje por Refuerzo (RL).

Actividad 2. Proceso de Decisión de Markov (MDP)

El Proceso de Decisión de Markov (MDP) es un modelo matemático fundamental en el aprendizaje por refuerzo (RL).

Actividad 3. Algoritmos de Aprendizaje por Refuerzo

El módulo de Algoritmos de Aprendizaje por Refuerzo introduce a los estudiantes a los conceptos fundamentales de la Inteligencia Artificial orientada a la toma de decisiones. 

Actividad 4. Ejemplos y Aplicaciones 

En la actividad de Ejemplos y Aplicaciones, los estudiantes explorarán ejemplos prácticos de Aprendizaje por Refuerzo (RL).

¡Haz culminado la unidad 3!

Puedes volver a repasar esta unidad o avanzar a la siguiente cuando se encuentre habilitada.

Make a website with Mobirise