[1711.09883] AI Safety Gridworlds - discu.eu

Newsletters
Mentions
Extension
Pricing
Login
Sign Up

Linking pages

Understanding Agent Incentives with Causal Influence Diagrams | by DeepMind Safety Research | Medium https://medium.com/@deepmindsafetyresearch/understanding-agent-incentives-with-causal-influence-diagrams-7262c2512486 1 comment
Building safe artificial intelligence: specification, robustness, and assurance | by DeepMind Safety Research | Medium https://medium.com/@deepmindsafetyresearch/building-safe-artificial-intelligence-52f5f75058f1 0 comments
Scalable agent alignment via reward modeling | by DeepMind Safety Research | Medium https://medium.com/@deepmindsafetyresearch/scalable-agent-alignment-via-reward-modeling-bf4ab06dfd84 0 comments
Designing agent incentives to avoid reward tampering | by DeepMind Safety Research | Medium https://medium.com/@deepmindsafetyresearch/designing-agent-incentives-to-avoid-reward-tampering-4380c1bb6cd 0 comments
Part 2: The Problems https://aisafety.dance/p2/ 0 comments

Related searches:

Search whole site: site:arxiv.org

Search title: [1711.09883] AI Safety Gridworlds

See how to search.

Submit link to:

Hacker News
Reddit
Lobsters
Twitter
Mastodon

Features

Weekly newsletter
Social & bots
Browser extension
Bookmarklet
Search
Pricing

Developers

Mentions
API
Website

Advertisers

Ad price calculator

About

Privacy Policy
Terms
Support

Made by Alexandru Cojocaru