一、绪论
为什么人类的本质是复读机?
浅层次的理解如同QQ/wecaht消息的 +1 操作;
深层次的理解,就得由一款游戏《信任的进化》。游戏中设置了几个角色:
- 复读机:特点是会选择和玩家之前一模一样的选择。假如玩家一直合作,他也会一直合作;假如玩家一直欺骗,他也会一直欺骗。
- 千年老油条:永远不合作;
- 万年小粉红:永远合作;
- 黑帮老铁:如果第一轮合作,那么后面都合作;如果第一轮欺骗,那么后面都欺骗的。
如同你上学读书十几年,实际上每天都在复读前人的理论知识学说概念,你所学的每一个公式,你背诵的每一首诗,都是在复读前人的成果,也就是人类的智慧,人类的文明。
Scenery 基于复读机这一点,认为人的行为是可以预测的,正如机器学习使用数据进行预测。
1.1 基本术语
- 数据集(data set), 示例(instance)
- 属性(attribute)= 特征(feature)
- 属性值(attribute value),属性空间(attribute space)
- 特征向量(feature vector)
一般地,令 D = { x 1 , x 2 , . . . , x m } \boldsymbol{D=\{ x_1,x_2,...,x_m \}} D={ x1,x2,...,xm} 表示包含 m m m 个示例的数据集,每个示例由 d d d 个属性描述,则每个示例 x i = ( x i 1 ; x i 2 ; . . . ; x i d ) \boldsymbol{x_i =} (x_{i1};x_{i2};...;x_{id}) x