FF's Notes

Graph Home

← Home

Learning from Trajectories via Subgoal Discovery

Nov 19, 2022

imitation

Train a subgoal policy $\pi(s_g|s_t)$ by using imitation learning. That is, by collecting a bunch of expert data.