Description
LQR 方法适用于状态转移方程为线性的,损失函数为二次的环境中,但实际中很多问题都不满足这个条件。 那么我们用一个线性方程来近似拟合现实问题的非线性环境动力学方程吗?
可以使用泰勒展开来近似。
移项之后,化简:
其中:
我们将其转换成了一个 LQR 问题。至此,我们可以得到 iLQR 算法:

LQR 方法适用于状态转移方程为线性的,损失函数为二次的环境中,但实际中很多问题都不满足这个条件。 那么我们用一个线性方程来近似拟合现实问题的非线性环境动力学方程吗?
可以使用泰勒展开来近似。
移项之后,化简:
其中:
我们将其转换成了一个 LQR 问题。至此,我们可以得到 iLQR 算法:
