Policy Gradient Algorithms

True Off-Policy Policy-Gradient algorithm https://arxiv.org/abs/1811.09013 6 comments 10/6/2020 reinforcementlearning

Implementing Reinforcement learning policy gradient algorithms in Matlab https://www.reddit.com/r/matlab/comments/9m5mgk/implementing_reinforcement_learning_policy/ 8 comments 7/10/2018 matlab

A Closer Look at Invalid Action Masking in Policy Gradient Algorithms https://costa.sh/blog-a-closer-look-at-invalid-action-masking-in-policy-gradient-algorithms.html 24 comments 1/7/2020 reinforcementlearning

UberAI: Genetic algorithms can solve deep reinforcement learning problems as well as popular alternatives, such as deep Q-learning and policy gradients. https://arxiv.org/abs/1712.06560 7 comments 6/5/2018 reinforcementlearning