PROCESOS DE DECISIÓN DE MARKOV
El aprendizaje por refuerzo consiste en aprender a decidir en una situación dada qué acción es la mejor para lograr un objetivo. Un agente de hardware o software está conectado a su entorno a través de la percepción y la acción
Créé par
Rodrigo Palma
Mexico
Recherches connexes