一、均值
一般来讲,平均值会看算数平均和加权平均,算数平均要尤其注意异常值的影响,对于数据分布跨度较大,或是要对近期数据分配较大权重系数的分析范围,加权平均值更优;
辛普森悖论。要注意分组时算数平均表现更优的选手,在合并为总体后,表现可能较差,显然此种情况,要是想用算数平均值指标,那么分组计算是合理的;【启示:对于数据要深挖。若只看整体数据指标就下结论,很有可能导致错误的结论。】
二、大数定律和小数陷阱
大数定律,理论上应该服从的分布或概率,只有在试验次数达到一定量级上才会实现,如抛硬币正反两面出现的概率都是50%;
小数陷阱,生活中很多事情是否发生,彼此间是相互独立的,所以想当然的认为既然其他情况已经发生多次,那么下次会发生某种情况的概率就会很高;【如掷色子,在有限的掷数下,一直不出点数6也是有可能的。】
三、墨菲定律。大家都会对满足自己解释预期的情况,或者说对影响不好的坏事关注度更高,更容易记住,并认为会经常出现。
四、随机对照试验,当我们不知道客观世界里一个问题的真正答案的时候,可以通过少量的数据来验证非常大的数据规律,即在有限的数据条件下,验证实验组和对照组是否有明显差异。
五、直方图与柱状图不同。
1.直方图用来看分布,柱子和柱子之间没有间隔,且柱子宽度可以不一样;
2.柱状图用来对比数据大小,柱子和柱子之间有间隔,且柱子宽度需要一样;
六、幂律分布(指数分布)与帕累托法则(二八法则)
幂律分布,归功于传播性;
帕累托法则,互联网公司,只有第一第二,没有第三第四
3.启示:我们身处的世界是赢者通吃的世界,开始时细微优势最终将带来无穷多的回报。反之,最初的细微劣势也将导致最终一无所有。