← Home Random Shooting Methods Oct 31, 2020 rlmbrl Description 随便找一个分布函数(distribution),使用此分布函数选择不同状态的动作序列 $A_1,\dots,A_N$ 根据上诉公式选取使得 $J(A_i)$ 最大的动作序列 $A_i$