[1812.02353] Top-K Off-Policy Correction for a REINFORCE Recommender System - discu.eu

Reddit

"Top-K Off-Policy Correction for a REINFORCE Recommender System", Chen et al 2018 {G} [scaling to millions of items for YouTube video recommendations] https://arxiv.org/abs/1812.02353 3 comments 28/8/2019 reinforcementlearning

Linking pages

Setting ourselves up for exploitation: RL in the wild https://robotic.substack.com/p/rl-exploitation 0 comments

Related searches:

Search whole site: site:arxiv.org

Search title: [1812.02353] Top-K Off-Policy Correction for a REINFORCE Recommender System

See how to search.

Submit link to: