第3章 多模型思维

1. 孔多塞陪审团定理和多样性预测定理

  • 孔多塞陪审团定理(Condorcet jury theorem)

    • 从一个解释多数规则长处的模型中推导出来的

    • 通过构建多个模型并使用多数规则,将比只使用其中一个模型更加准确

    • 依赖于**世界状态(state of world)**的概念,它是对所有相关信息的完整描述

    • 如果许多模型都导致相似的结果,那我们就得到了一个强有力的定理,它基本上不受模型细节的影响

    • 我们的真理就是若干独立的谎言的交集

    • 当许多模型都给出了相同的分类时,我们会信心大增

  • 多样性预测定理(Diversity prediction theorem)

    • 用于给出数值预测或估值的模型
    • 它量化了模型的准确性和多样性对所有模型平均准确性的贡献

    多模型误差 = 平均模型误差 − 模型预测的多样性 ( M ‾ − V ) 2 = ∑ i = 1 N ( M i − V ) N − ∑ i = 1 N ( M i − M ‾ ) N M i : 模型 i 的预测 M ‾ : 模型的平均值 V : 真值 多模型误差 = 平均模型误差-模型预测的多样性 \\ (\overline{M} - V) ^ 2 = \sum_{i=1}^{N}\frac{(M_i - V)}{N} - \sum_{i=1}^{N}\frac{(M_i - \overline{M})}{N} \\ M_i:模型i的预测 \\ \overline{M}:模型的平均值 \\ V:真值 多模型误差=平均模型误差模型预测的多样性(MV)2=i=1NN(MiV)i=1NN(MiM)Mi:模型i的预测M:模型的平均值V:真值

    • 相反类型的误差会相互抵消

    • 两个模型的误差相互抵消,模型的平均值将比任何一个模型更加准确

    • 即使两个模型预测值都太高,这些预测值的平均误差仍然不会比两个高预测值的平均误差更糟

    • 群体的智慧(Wisdom of crowds):任何多样性的模型的集合将比其普遍成员的预测更加准确

2. 分类模型

  • 将世界状态划分为不相交的

  • 对世界分类的10个范畴

    • 实体(substance)
    • 数量(quantity)
    • 地点(location)
    • 状态(positioning)
    • ···
  • 相关属性的数量限制了不同类别的数量。因此也就限制了有用模型的数量

  • 分类模型

    • 存在一组世界的对象或状态,每个对象或状态都由一组属性定义,每个属性都有一个值
    • 根据对象的属性,分类模型 M M M将对象或状态划分为一个有限的类别 { S 1 , S 2 , ⋅ ⋅ ⋅ , S n } \{S_1,S_2,···,S_n\} {S1,S2,⋅⋅⋅,Sn},然后给每个类别赋值 { M 1 , M 2 , ⋅ ⋅ ⋅ , M n } \{M_1,M_2,···,M_n\} {M1,M2,⋅⋅⋅,Mn}
  • 虽然增加模型可以提高准确性,但是在已经拥有了一定数量的模型之后再继续添加模型,每个模型的边际贡献就会下降

  • 如果能构建出多个多样性的、准确的模型,我们就可以做出准确的预测和估值,并选择正确的行动

3. 适当的模型粒度

  • 通过简化,我们可以应用逻辑来解释现象、交流思想、并探索各种各样的可能性

  • 我们拥有的数据越多,模型就越精细

  • 创造过多的类别会导致对数据的过度拟合,而过度拟合会破坏对未来事件的预测

  • 分类误差(Categorization error):每个类别中,数据均值的误差

    • 与类别数量成正比
  • 估值误差(Valuation error):估计均值的误差

    • 与类别数量成反比
  • 模型误差分解定理(model error decomposition theorem)
    偏差 − 方差权衡( b i a s − v a r i a n c e t r a d e − o f f ) 模型误差 = 分类误差 + 估值误差 ∑ x ∈ X ( M ( x ) − V ( x ) ) 2 = ∑ i = 1 n ∑ x ∈ S i ( V ( x ) − V i ) 2 + ∑ i = 1 n ( M i − V i ) 2 M ( x ) : 数据点 x 的模型值 M i : 类别 S i 的模型值 V ( x ) : 数据点 x 的实际值 V i : 类别 S i 的实际值 偏差-方差权衡(bias-variance trade-off) \\ 模型误差 = 分类误差 + 估值误差 \\ \sum_{x\in{X}}(M(x)-V(x))^2 = \sum_{i=1}^n\sum_{x\in{S_i}}(V(x)-V_i)^2 + \sum_{i=1}^n(M_i-V_i)^2 \\ M(x):数据点x的模型值 \\ M_i:类别S_i的模型值 \\ V(x):数据点x的实际值 \\ V_i:类别S_i的实际值 \\ 偏差方差权衡(biasvariancetradeoff模型误差=分类误差+估值误差xX(M(x)V(x))2=i=1nxSi(V(x)Vi)2+i=1n(MiVi)2M(x):数据点x的模型值Mi:类别Si的模型值V(x):数据点x的实际值Vi:类别Si的实际值

4. 一对多

  • 我们不能随便拿起一个模型就将它应用到任何情境之中,但是,大多数模型都是灵活的

更高的幂

超级油轮

  • 设邮轮为一个长方体,且宽和高为 S S S,长度为 8 S 8S 8S
  • 则表面积为 34 S 2 34S^2 34S2,体积为 8 S 3 8S^3 8S3
  • 表面积决定成本,体积决定收益

体积 表面积 = 8 S 3 34 S 2 ≈ S 4 \frac{体积}{表面积} = \frac{8S^3}{34S^2} \approx \frac{S}{4} 表面积体积=34S28S34S

  • 随着 S S S的增长,盈利能力呈线性增长

身体质量指数

  • 设人体为一个近似完美的立方体,且1立方米立方体的重量为 M M M,身高为 H H H

B M I = M H 3 H 2 = H M BMI = \frac{MH^3}{H^2} = HM BMI=H2MH3=HM

  • 此时模型有2个缺陷
    • 身高本应与肥胖无关
    • 肌肉发达是肥胖的对立面
  • 解决方法
    • 添加参数 d d d表示一个人的“深度”(前胸到后背的厚度)
    • 添加参数 w w w表示一个人的“宽度”

B M I = H ∗ ( d H ) ∗ ( w H ) ∗ M H 2 = d w H M BMI = \frac{H * (dH) * (wH) * M}{H^2} = dwHM BMI=H2H(dH)(wH)M=dwHM

代谢率

  • 设小鼠和大象皆为一个近似完美的立方体,且身体由 1 c m 3 1cm^3 1cm3的细胞组成,小鼠表面积为 14 c m 2 14cm^2 14cm2,体积为 3 c m 3 3cm^3 3cm3,大象表面积为 57600 c m 2 57600cm^2 57600cm2,体积为 864000 c m 3 864000cm^3 864000cm3

小鼠 : 表面积 体积 = 14 c m 3 3 c m 3 ≈ 5 大象 : 表面积 体积 = 57600 c m 3 864000 c m 3 ≈ 1 15 小鼠: \frac{表面积}{体积} = \frac{14cm^3}{3cm^3} \approx 5 \\ 大象: \frac{表面积}{体积} = \frac{57600cm^3}{864000cm^3} \approx \frac{1}{15} 小鼠:体积表面积=3cm314cm35大象:体积表面积=864000cm357600cm3151

  • 小鼠每立方厘米的细胞,就有 5 c m 2 5cm^2 5cm2的体表皮肤来散热
  • 大象每立方厘米的细胞,仅有 1 15 c m 2 \frac{1}{15}cm^2 151cm2的体表皮肤来散热
  • 综上,小鼠散热的速度是大象的 75 75 75

女性CEO

  • 设成为一名CEO,至少要升职 15 15 15
  • 并且升职时会出现有利于男性的偏差,即男性的升职率略高于女性,则设两个概率分别为 50 % 50\% 50% 40 % 40\% 40%

男性 : ( 50 % ) 15 = 0.000030517578125 女性 : ( 40 % ) 15 = 0.000001073741824 男性 女性 = 0.000030517578125 0.000001073741824 ≈ 30 男性: (50\%)^{15} = 0.000030517578125 \\ 女性: (40\%)^{15} = 0.000001073741824 \\ \frac{男性}{女性} = \frac{0.000030517578125}{0.000001073741824} \approx 30 男性:(50%)15=0.000030517578125女性:(40%)15=0.000001073741824女性男性=0.0000010737418240.00003051757812530

  • 差异的累计最终成为非常巨大的差异

5. 多模型思维

  • 成功的一对多思维取决于创造性地调整假设和构建新的类比,以便将为某个特定目的而开发的模型应用到新的领域
  • 要成为一个多模型思考者,需要的不仅仅是数学能力,更需要的是创造力
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值