第3章多模型思维

最新推荐文章于 2024-01-03 14:45:40 发布

His Last Bow

最新推荐文章于 2024-01-03 14:45:40 发布

阅读量51

点赞数

分类专栏： # 模型思维文章标签：模型思维

本文链接：https://blog.csdn.net/blackornate/article/details/135052877

版权

4 篇文章 0 订阅

订阅专栏

1. 孔多塞陪审团定理和多样性预测定理

孔多塞陪审团定理（Condorcet jury theorem）
- 从一个解释多数规则长处的模型中推导出来的
- 通过构建多个模型并使用多数规则，将比只使用其中一个模型更加准确
- 依赖于**世界状态（state of world）**的概念，它是对所有相关信息的完整描述
- 如果许多模型都导致相似的结果，那我们就得到了一个强有力的定理，它基本上不受模型细节的影响
- 我们的真理就是若干独立的谎言的交集
- 当许多模型都给出了相同的分类时，我们会信心大增
多样性预测定理（Diversity prediction theorem）
- 用于给出数值预测或估值的模型
- 它量化了模型的准确性和多样性对所有模型平均准确性的贡献
$\\ (\overline{M} - V) ^ 2 = \sum_{i=1}^{N}\frac{(M_i - V)}{N} - \sum_{i=1}^{N}\frac{(M_i - \overline{M})}{N} \\ M_i:模型i的预测 \\ \overline{M}:模型的平均值 \\ V:真值$
- 相反类型的误差会相互抵消
- 两个模型的误差相互抵消，模型的平均值将比任何一个模型更加准确
- 即使两个模型预测值都太高，这些预测值的平均误差仍然不会比两个高预测值的平均误差更糟
- 群体的智慧（Wisdom of crowds）：任何多样性的模型的集合将比其普遍成员的预测更加准确

将世界状态划分为不相交的
对世界分类的10个范畴
- 实体（substance）
- 数量（quantity）
- 地点（location）
- 状态（positioning）
- ···
相关属性的数量限制了不同类别的数量。因此也就限制了有用模型的数量
分类模型
- 存在一组世界的对象或状态，每个对象或状态都由一组属性定义，每个属性都有一个值
- 根据对象的属性，分类模型 $M$ 将对象或状态划分为一个有限的类别 ${S_1,S_2,···,S_n\}$ ，然后给每个类别赋值 ${M_1,M_2,···,M_n\}$
虽然增加模型可以提高准确性，但是在已经拥有了一定数量的模型之后再继续添加模型，每个模型的边际贡献就会下降
如果能构建出多个多样性的、准确的模型，我们就可以做出准确的预测和估值，并选择正确的行动

通过简化，我们可以应用逻辑来解释现象、交流思想、并探索各种各样的可能性
我们拥有的数据越多，模型就越精细
创造过多的类别会导致对数据的过度拟合，而过度拟合会破坏对未来事件的预测
分类误差（Categorization error）：每个类别中，数据均值的误差
- 与类别数量成正比
估值误差（Valuation error）：估计均值的误差
- 与类别数量成反比
模型误差分解定理（model error decomposition theorem）
$\\ 模型误差 = 分类误差 + 估值误差 \\ \sum_{x\in{X}}(M(x)-V(x))^2 = \sum_{i=1}^n\sum_{x\in{S_i}}(V(x)-V_i)^2 + \sum_{i=1}^n(M_i-V_i)^2 \\ M(x):数据点x的模型值 \\ M_i:类别S_i的模型值 \\ V(x):数据点x的实际值 \\ V_i:类别S_i的实际值 \\$