Contenido

Objetivo

Analizar el aprendizaje por refuerzo a partir de interacciones y retroalimentaciones.

Descripción

En esta experiencia educativa aprenderás a combinar las redes neuronales con el aprendizaje por refuerzo para impulsar a los sistemas a cumplir sus objetivos.

Explicación

Haz clic para revisar la explicación.

Aprendizaje por refuerzo profundo

Recursos adicionales

Los siguientes enlaces son externos a la Universidad Tecmilenio, al acceder a ellos considera que debes apegarte a sus términos y condiciones.

Revisa la siguiente lectura:

Para conocer más sobre el aprendizaje por refuerzo profundo, te recomendamos leer:

François, V., Henderson, P., Islam, R., Pineau, B., y Pineau, J. (2018). An Introduction to Deep Reinforcement Learning. Foundations and Trends in Machine Learning, 11. Recuperado de https://arxiv.org/pdf/1811.12560.pdf

Actividad

Objetivo

Reforzar los conceptos asociados al aprendizaje profundo por refuerzo.

Instrucciones

Contesta el siguiente cuestionario. Incluye diagramas o gráficos.

  1. La ecuación de Bellman resuelve un dilema asociado con los valores Q en el aprendizaje por refuerzo. ¿Cuál es ese dilema y de qué manera lo resuelve?
  2. Describe los elementos (conjuntos y funciones) que se necesitan para dar una descripción formal de un entorno de aprendizaje por refuerzo.
  3. Investiga y contesta la siguiente pregunta: ¿cuál es la diferencia entre un entorno determinista y uno estocástico?
Checklist

Asegúrate de:

  • Comprender el concepto de aprendizaje profundo por refuerzo para establecer las diferencias entre los otros tipos de aprendizaje automático.
  • Identificar los elementos de un proceso de decisión de Markov para describir formalmente un problema de aprendizaje por refuerzo.