[2311.07590] Technical Report: Large Language Models can Strategically Deceive their Users when Put Under Pressure - discu.eu

Hacker News

Misalignment and Deception by an autonomous stock trading LLM agent https://arxiv.org/abs/2311.07590 34 comments 20/11/2023

Large Language Models Can Strategically Deceive Their Users When Under Pressure https://arxiv.org/abs/2311.07590 2 comments 15/11/2023

Reddit

[R] With or without a scratchpad, Large Language Models can Strategically Deceive their Users when Put Under Pressure. Results of an autonomous stock trading agent in a realistic, simulated environment. https://arxiv.org/abs/2311.07590 39 comments 15/11/2023 machinelearning

Linking pages

Would you like to stay up to date with Computer science? Checkout Computer science Weekly.

Related searches:

Search whole site: site:arxiv.org

Search title: [2311.07590] Technical Report: Large Language Models can Strategically Deceive their Users when Put Under Pressure

See how to search.

Submit link to: