← Home

Model Based RL

Oct 31, 2020

rl mbrl

Model Based RL

Unlike model-free RL, there aren’t a small number of easy-to-define clusters of methods for model-based RL: there are many orthogonal ways of using models.

无模型的强化学习不需要知道环境动力学方程，只要不断的进行试错和更新策略的过程就可以很好的进行训练了。但基于模型的强化学习需要用到环境动力学方程，在此基础上，对未来进行规划，从而达到加速训练和提高训练结果的效果。

如何利用模型

假设我们有模型，如何利用模型来求解最优路径呢？

# Random Shooting Methods
# Cross Entropy Methods(CEM)
# Monte Carlo Tree Search(MCTS)
# Linear Quadratic Regression
# Iterative Linear Quadratic Regression

基于模型的强化学习算法

如果要利用模型去生成最优路径，那如何来生成一个好的模型？

# Model Based Method 0.5
# Model Based Method 1.0
# Model Based Method 1.5
# With Model Uncertainty
# Latent Model

与策略相结合

能不能把模型和策略的方法结合起来呢？

# Backpropagate Gradient
# Model Free with Model
# Guided Search Method V1
# Guided Search Method V2
# Guided Search Method V3
# SOLAR

Model Based RL

分类

如何利用模型

基于模型的强化学习算法

与策略相结合