标签：直到我修改了它的奖励函数。

与AI玩“信任游戏”，它总是选择利益最大化的背叛，直到我修改了它的奖励函数。-在未来的AI设计中，我们需要更多地关注以下几个方面：

2026-01-22 浏览: 4 次浏览

# 与AI玩“信任游戏”，它总是选择利益最大化的背叛，直到我修改了它的奖励函数。——从博弈论到伦理设计的旅程在人工智能（AI）的发展过程中，我们不断地挑战和测试其智能边界。其中，“信任游戏”是一个经典的实验，旨在探究AI在合作与背叛之间的选择。在我的实验中，AI起初总是选择利益最大化的背叛，但随着