The implicit dynamics of optimizing costs vs. rewards vs. preferences - discu.eu

Reddit

The implicit dynamics of optimizing costs vs. rewards vs. preferences https://robotic.substack.com/p/costs-v-rewards-v-preferences 3 comments 27/3/2023 reinforcementlearning

Linking pages

Growing needs for accessing state-of-the-art reward models https://robotic.substack.com/p/open-rlhf-reward-models 0 comments

Linked pages

Related searches:

Search whole site: site:robotic.substack.com

Search title: The implicit dynamics of optimizing costs vs. rewards vs. preferences

See how to search.

Submit link to: