FF's Roam Notes

❯

Model Based RL

Jun 05, 20252 min read

rl
mbrl

Model Based RL

无模型的强化学习不需要知道环境动力学方程，只要不断的进行试错和更新策略的过程就可以很好的进行训练了。但基于模型的强化学习需要用到环境动力学方程，在此基础上，对未来进行规划，从而达到加速训练和提高训练结果的效果。

分类

基于模型的强化学习按照环境的状态空间类型和 Plan 的方式可以分为以下三类： Deterministic Case, Stochastic Open Loop, Stochastic Close Loop 。

Deterministic Case
Stochastic Open Loop Case
Stochastic Close Loop Case

如何利用模型

假设我们有模型，如何利用模型来求解最优路径呢？

Random Shooting Methods
Cross Entropy Methods(CEM)
Monte Carlo Tree Search(MCTS)
Linear Quadratic Regression
Iterative Linear Quadratic Regression

基于模型的强化学习算法

如果要利用模型去生成最优路径，那如何来生成一个好的模型？

Model Based Method 0.5
Model Based Method 1.0
Model Based Method 1.5
With Model Uncertainty
Latent Model

与策略相结合

能不能把模型和策略的方法结合起来呢？

Backpropagate Gradient
Model Free with Model
Guided Search Method V1
Guided Search Method V2
Guided Search Method V3
SOLAR

Graph View

Model Based RL
分类
如何利用模型
基于模型的强化学习算法
与策略相结合

Created with Quartz v4.5.1 © 2025

Portfolio