Description

当状态和动作确定时,下一状态也是确定的。即下一状态是由当前状态和动作相关的函数所确定的。 在已知状态转移方程的情况下,Agent 可以依据模型生成一系列的动作。

![](/ox-hugo/lec-10-1.png” width=“100%)