[1705.08926] Counterfactual Multi-Agent Policy Gradients - discu.eu

Reddit

Does COMA work better than a simple Policy Gradient with a centralised critic? Why? https://arxiv.org/abs/1705.08926 4 comments 17/6/2019 reinforcementlearning

Linking pages

Related searches:

Search whole site: site:arxiv.org

Search title: [1705.08926] Counterfactual Multi-Agent Policy Gradients

See how to search.

Submit link to: