从不确定性到规划

Link: https://informationalmind.appspot.com/2013/04/10/FromUncertaintyToPlanning.html


洗澡时突然想到了这么个东西,然后越想越多,就干脆写下来吧。

在开始之前,先跑题一下,给一个TED的演讲:游戏创造美好生活(有中文字幕)。虽然和本文关系不是很大,但是很值得一看。

在开始之前

这篇文章主要是自己的一些思考,并没有什么结论。内容关于:

为什么高端玩家会避免不确定性,或者为什么竞技性强的游戏本身不确定性会低;然后推广到生活中,为什么对生活掌控力强的人相对更倾向于避免不确定性。

游戏中的不确定性

作为一个老牌的游戏玩家,我自己也能很清晰的体会到这么个被广泛认可(具体请自行Google)的事实:游戏中的不确定性能提高吸引力。给一些例子:小到收集任务中的任务物品掉落,大到各种稀有装备的掉落,以及一些宝箱之类的东西。游戏中的不确定性大多是独立事件带来的不确定性,不过也有一些是非独立事件(比如利用玩家在将要完成任务之前的兴奋感,将收集任务中最后两个任务物品的掉落几率降低,从而延长玩家的游戏时间),但是影响不大。

正是这些不确定性,在很大程度上提高了游戏的吸引力,让人不知不觉中投入了更多的时间/精力等资源去玩游戏。当然,游戏中不同的事件的不确定度很不一样,表现形式也很不相同。较大的不确定性比如任何类似赌博的机制,较小的不确定性比如攻击力的浮动。不同的不确定性当然带给人们的感受也不通。

不过玩家和玩家也是有区别的。有些人喜欢这些不确定性,而有些人并不一定喜欢。纯粹是体验游戏的玩家,比如说没什么追求,就是看游戏内容的,或者玩的就是感觉的这类玩家,这里就给他们叫做感性玩家,这些人在很大程度上是会享受不确定性的。还有一些玩家,有着明确的目的,比如快速升级的,快速打钱的,要拿装备,或者为了战胜对手的,这类玩家并不会喜欢不确定性,特别是当不确定性很大的时候,这些玩家通常会回避不确定性。

为什么呢?后面再说。

不太相关的但是也很重要的——游戏中的及时反馈

这个很明显,游戏中获得物品,获得经验,技能升级,当前的生命值数,经验数等等,都是显式且及时的。这样玩家就能第一时间感受到变化,这个变化可以用来调整下一步的规划,或者仅仅是享受一下成长/收获的乐趣。

除了让玩家能明确的认识到当前的状态之外,及时反馈可以缩短采取下一步调整所需要的时间,也就是说可以在固定的时间内提高重复的次数。或者这么说,及时反馈能给予玩家掌控感和确定性。

更多的关于及时反馈对于人的成长的正面作用,这里就不多说了,一开始的视频里就有,网上也有很多,请自行Google。

再谈游戏中的不确定性

第一节中提到的理性玩家会回避不确定性,为什么呢?这里展开说。

前奏

展开之前,不了解正态分布Normal distribution)先科普自我一下(应该都懂吧?),大概看一下即可,只要知道这是个中间多,两边少的一种概率分布,而且独立的个体组成的群体各种属性的分布大体上都符合正态分布。

为了说清楚,先明确一些概念。

  1. 上面提到的感性玩家与理性玩家,并不是离散的两极,而是一个连续的,每个玩家会分布在这个区间内。(个人猜测这个分布应该接近正态分布,也就是说大部分玩家是在理性与感性这两极之间的。)
  2. 不确定性我这里定义为投入总量与产出总量比值的浮动程度,比如说我在某个事情上投入100,产出在(40, 60)之间的可能性为80%,在(30, 70)之间的可能性为15%……一般情况下也会是个正态分布。本文并不准备量化这个东西,所以后面仅用不确定性高低来定性的区分,不确定性高指的是产出的可能性分布较广(黑话:正态分布的标准差standard deviation)大)。

感性玩家随心所动,没有便于统一度量的标准,所以,这里只说理性玩家的情况。玩游戏目标最明确,最需要理性的地方,当然是战略类对战游戏了,比如即时战略类。所以这里大多以即时战略游戏为例。

目前的即时战略类游戏中的不确定性相对于其他类型的游戏来说还是很低的了,但还是有一些的(英雄连Company of Heroes)这种很容易搞成“人品连”的即时战略游戏还是很少见的)。

感受到的不确定性

虽然对于对抗双方来说,相同的事件的概率是一样的,所以当某个事件多次触发时,效果类似投硬币。

比如,一个事件触发后50%成功为1,50%失败为0,当玩家只触发某个事件1次是,结果不是0就是1;而触发2次时,结果就是25%的0,50%的1,25%的2;3次时就是12.5%的0,37.5%的1,37.5%的2,12.5%的3;……依此类推。可以看出,当一个事情需要重复多次时,结果会越来越多的集中在靠近平均值的区间内,总的不确定性会被降低。所以不确定性对于个人来说,很大程度上是触发某个事件的次数相关的。

再比如,更复杂的,还是刚才那个事件,如果玩家希望有75%的概率获得1,那么至少需要触发2次;如果希望50%的概率获得2,那么至少需要触发3次;如果是希望68.75%的概率获得2,那么至少需要触发4次;如果希望81.25%的概率获得2,那么至少需要触发5次;……依此类推。可以看出,如果希望保证更高的可靠性达到某个目标,需要的尝试的次数就越多,并且随着尝试次数的增加,可靠性的收益递减。

实际中的例子就是,比如某个单位攻击力0-10浮动,但是攻速很快,这样虽然单次攻击不确定性很大,但是在一定的时间内,这个单位的输出还是很稳定的,而且时间越长,这个输出总量越是稳定。再比如,在RPG游戏中,为了获得一定数量的,有一定概率掉落的某物品,如果是为了获得1个,那么需要打怪的数量就会很不确定,可能要保证50%的可靠性情况下需要打10个怪,要保证更高的可靠性则需要打更多的……这样规划时就很难给这个任务分配所需要的资源。但如果是为了获得100个,假如要保证50%的可靠性需要打500个怪,而要提高这个可靠性,需要多打怪的数量的比例的提高就不会有只需要1个物品的时候那么多了,从而不确定性就会大大降低。

不确定性下的规划与决策

由于不确定性的存在,所有的规划就没法做到100%确保可行,为了让规划的可行度高,规划中的每个事件的投入都必须达到较高的“可靠度”让产出高于需要的值,并且,还必须留出一定的后备资源以防止出现投入的资源没有产出所期望的量的情况。

比如说,为了达到一个目标,有三个事情需要顺序完成,为了最终较为可靠的达到目标,在每一个事情上的投入必须让产出有80%的可能性达到要求,并且还要预留出来一定资源以防止其中一个或两个没有在期望的投入内达到所需要的产出,当然,如果这三个事情都没有在规划的投入内达到需要的产出那就没办法了,认倒霉吧(小概率的悲剧)。

实际的例子,比如在即时战略游戏中,一场战斗中己方处于劣势,为了不太吃亏,所以希望秒掉对方一个高价值单位然后传送逃跑。假如那个目标有一种奇特的护盾,单次攻击最多只能打掉其中一层,但他一共有三层,那么我方可以希望用三个自爆单位去杀掉目标;但是由于每个自爆单位由于攻击力的浮动,不能100%确保一下打掉一层护盾,那么还需要其他单位攻击几次来打掉那层护盾。这样,一个常见的规划就是,用三个自爆单位和少量低价值部队去自杀式攻击,希望能干掉目标。由于单个自爆并不能确保打掉一层护盾,派出多少自杀式攻击部队去辅助合适呢?当然,派出的越多,成功率越高。这里就需要去考虑希望有多大的投入去换掉目标,投入太大不划算,投入太小可能一无所获。这里,这些自爆就是三次要触发事件,低价值的自杀式攻击单位就是预留资源。在这个例子中,每次自爆所造成伤害浮动越大,为了确保较高可能性的完成目标所需要的自杀式攻击部队就越多。

从上述例子中可以看出,虽然可能一件事情的平均收益相同,但是不确定性越大的事情,为了达到希望的产出,所需要的投入越多。由于这个原因,在希望确保达成目标的情况下,不确定性是个很恶心的东西。从这方面来看,越高的不确定性,对于希望更好地规划的玩家来说,越是会去避免。反之,对于并不怎么精确规划的感性玩家来说,不确定性会是乐趣/新鲜感/刺激的来源。

不过还有另外一种情况,还是上面那个例子,只不过境况稍微换一下。在最终的决战里,我方处于劣势,正常拼的话必输无疑,但是如果能干掉对方的某个特别的高价值单位,这一场战斗就有很大的可能性获胜,干不掉就肯定会失败。那么这就会有和上面的情况完全不同的规划。上面的情况是要确保达成目标,而这一次是希望能达成目标,不然就失败。这种情况下的规划就只会考虑如何让这一次行动成功,而不会考虑之后的事情了。那么规划就变成了去赌上全部的实力去希望能达成目标。

说简单些总结一下,在理性游戏的情况下,高确定性的事物更有利于规划。在优势的时候,不确定性可能会带来低于期望值的结果,从而让胜利变成失败,所以会被回避;在劣势的时候,不确定性可能会带来高于期望值的结果,从而让失败变成胜利,是一丝希望,会被追求。

(这些内容当然是被研究过的,我只是用自己的话举例子说了一下)

加入及时反馈

及时反馈可以让玩家更快的了解到自己的行动的结果,从而减少下一步行动的等待时间,或者是减少在第一轮行动的结果还未出来时而采取下一步行动所需要的预判的失败带来的损失。从而间接的减少了为了保证一定的成功率达到某个目标所需要的后备资源的数量。

并且及时反馈可以减少暂存的等待结果的事件的数量,从而降低精神负担。从而使玩家有更多的精力去规划其他问题。

那么,在生活中

在生活中,不确定性更是广泛存在。并且生活中的每个事件都不是孤立的,出现上面提到的最终交锋时的孤注一掷去赌的情况并不多。人们需要规划的更长远,所需要规划的内容也更为复杂多样。

在生活中,规划是为每件事情安排所需要投入的时间/精力/财力/物力,并把这些一个个的事件规划成一个事件关系网(黑话:有向无环图Directed acyclic graph))。但是进行规划、调整规划本身也是需要消耗资源的,特别是时间与精力,当规划中的事件没有达到预期的结果而进行应急调整,会消耗很多的储备资源。而人的精力可谓是一个人最宝贵的资源了,所以规划的稳定性也会很重要,这从另一方面增进了人们对于低不确定性事件的偏好(传说中的风险规避偏好)。

而及时反馈这一点,就如上文所说,可以减少需要暂存的事件的数量,降低精神负担,这样就从另一个方面降低了所需的精力消耗。而且人不像计算机,可以在内存中保存大量的线程上下文,并且可以用不大的代价来切换当前的工作;人能同时在大脑中保存的事情并不多,而且切换代价很大,所以减少保存的事情数并减少不必要的切换是很重要的,这是及时反馈在生活中的另一个好处。

并且生活中有一些相对更特别的情况:某个事件只能触发一次,失败了就再也没有机会了(或者是很难再有第二次机会,再或者是第二次机会代价太大)。这种东西如果和你相关,那么它们在生活中会非常的显眼,你很难忽视它们的存在。这种事情很容易成为一个障碍。比如高考,更进一步,婚姻。

这里还有一点个人的观察,未经证实:类似于上一节中提到的游戏中对战的情况,在实际生活中,对自己的生活掌控力高的人,或者是目标明确并坚定的为之奋斗的人,通常更不喜欢大的不确定性。而那些对生活掌控力低的人,或者那种目标不明确的人,或者混日子的人,大的不确定性反而能带来些新鲜感/刺激/乐趣。

并且好的规划者,会把事情规划的让事件之间不确定性边界可以相互重合,并且在边界的不确定范围内规划一些琐碎的小事来避免资源浪费,从而在一定程度上将不确定性降得更低。这样较小的不确定性就在一定程度上可以当作确定的事情的去规划。

以上这些大家自然也会有所体会。我自己也多次体验过一些巨大不确定性所带来的困扰与迷茫,无力感,甚至是恐惧。

(这里自我检讨一下,我常常是过于害怕不确定性了,总是等到可靠度很高的时候才会采取下一步的行动,这样反而使获得所希望的产出的投入过高,更悲剧的是直接错过机会。并且,还不习惯于给予合作者及时的反馈,特别是关于自己的感受与情绪方面的,这样很容易让合作者难以做有效的决策。这两点估计可以算是我的致命伤了,这些方面必须要要有所改变才行。)

极限推广

这东西推广到极限嘛,就是让信息充分公开,增加及时反馈的效果。并且让合作者知道自己的目标与规划,让合作者知道自己的不确定性在哪里,度是多少,从而便于其规划。

而这么个东西推到极限,就是高度互联的自主决策个体组成的信息透明网络。

而这已经是现有的人类很难做到的了,原因是人自身的物理限制,或者说,本能。

记得网上看到过某人说过的一句话:理性到极致就是没人性。

这句话没错,但我并不欣赏这句话。如果人性指的是人的动物本能,那么这句话无疑是正确的,把理性推进到超出人类本能的地步自然是反人性的。但是这种人性是好事么?人性也是慢慢进化中的,如果总是符合当前的人性,就有些类似于说“过去的xxxx多么美好”的感觉。想要进化,必须超越当前,必须超越本能,努力让新的更适合当前环境的价值体系成为本能。

选择符合当前的人性是正常行为,因为这就是人性。只是如果当所有人都选择符合人性的时候,世界会因为当前的美好而发展缓慢。世界需要超前的牺牲者去打破、去推进当前的体系。有足够实力的牺牲者会让世界产生一点变化,从而对世界的前进有了那么一点贡献;而没有足够实力的牺牲者,会被历史所遗忘。人的群体的平均值相对于个体来说,适应新事物新理念的速度实在是太慢了。当很多年之后人们认识到那些牺牲者多么具有前瞻性时候,就是人们享受到了那些牺牲者带来的成果的时候。

这是个美丽的悲剧。

后记

我为什么要在有一堆事情要做的情况下蛋疼的写博客啊!!

这是自从2010年开这个blog以前写了那篇成为网络信息源以来,第一次写这种理念型长文,真的是好久了。

转载于:https://www.cnblogs.com/ylqcnblogsylq/archive/2013/04/24/FromUncertaintyToPlanning.html

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值