En esta sesión, los estudiantes serán introducidos al emocionante mundo del Aprendizaje por Refuerzo (RL), un área de la inteligencia artificial que se centra en que los agentes aprendan a tomar decisiones óptimas a través de la interacción con su entorno.
Exploraremos los conceptos fundamentales del RL, incluyendo los elementos básicos del agente, el entorno, las acciones, los estados y las recompensas, así como los principios subyacentes del Proceso de Decisión de Markov (MDP) y los algoritmos más comunes utilizados en RL, como Q-Learning, Sarsa y la Política de Gradiente de Montecarlo.
Make a website with Mobirise