[数据思维】基本概念-Day01

一、均值

  1. 一般来讲,平均值会看算数平均和加权平均,算数平均要尤其注意异常值的影响,对于数据分布跨度较大,或是要对近期数据分配较大权重系数的分析范围,加权平均值更优;

  1. 辛普森悖论。要注意分组时算数平均表现更优的选手,在合并为总体后,表现可能较差,显然此种情况,要是想用算数平均值指标,那么分组计算是合理的;【启示:对于数据要深挖。若只看整体数据指标就下结论,很有可能导致错误的结论。】

二、大数定律和小数陷阱

  1. 大数定律,理论上应该服从的分布或概率,只有在试验次数达到一定量级上才会实现,如抛硬币正反两面出现的概率都是50%;

  1. 小数陷阱,生活中很多事情是否发生,彼此间是相互独立的,所以想当然的认为既然其他情况已经发生多次,那么下次会发生某种情况的概率就会很高;【如掷色子,在有限的掷数下,一直不出点数6也是有可能的。】

三、墨菲定律。大家都会对满足自己解释预期的情况,或者说对影响不好的坏事关注度更高,更容易记住,并认为会经常出现。

四、随机对照试验,当我们不知道客观世界里一个问题的真正答案的时候,可以通过少量的数据来验证非常大的数据规律,即在有限的数据条件下,验证实验组和对照组是否有明显差异。

五、直方图与柱状图不同。

1.直方图用来看分布,柱子和柱子之间没有间隔,且柱子宽度可以不一样;

2.柱状图用来对比数据大小,柱子和柱子之间有间隔,且柱子宽度需要一样;

六、幂律分布(指数分布)与帕累托法则(二八法则)

  1. 幂律分布,归功于传播性;

  1. 帕累托法则,互联网公司,只有第一第二,没有第三第四

3.启示:我们身处的世界是赢者通吃的世界,开始时细微优势最终将带来无穷多的回报。反之,最初的细微劣势也将导致最终一无所有。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值