效用和决策
Utilities and Descision
这一问题主要来讨论针对不同情况下的决策问题。决策之中往往需要使期望效用最大化,因此我们需要给每个不同的agent的preference赋给不同的utilities。
Foundations: Maximizing Expected Utility
当我们对一些情况下的outcome不确定时,我们可以通过效用的数学期望来比较两种行为所带来的不同效用影响。
Decision Making Under Uncertainty
这里定义了一个outcome,里面的每个元素都是一个结果,随后定义了结果之间的二元关系,等于和大于两种。
但是在这个例子下,稳赚不赔的数学期望虽然更小,但是大多数人选了这一选择,很少人选择搏一搏,单车变摩托。因此我们可以看出,效用并不能简单用数学期望衡量。
因此我们这么定义一个决策情况:每个Action执行后会得到一个分布,动作一旦执行