一、图标的玄机
(1)拉伸图表
两张图是同样的原始数据
- 图表的拉伸和缩放可以使它展示在人们眼前的信息迥然不同
- 观察图表不要被眼睛和说谎者所欺骗
(2)操纵坐标轴
利润增长缓慢,几乎没变化(坐标轴从0开始)
利润飞速增长(坐标轴从2开始)
- 改变坐标轴最小值,改变了图表趋势
数据的波动性很大——湖北、河南、江苏总产值排名前三,远超其他省市
数据之间差异缩小——各省市总产值相差不大
- 如果数据的取值间隔划分过大(等比数列1,10,100,1000)
- 而不是标准的等差数列(1,2,3,4),数据之间巨大的差异就会被缩小
(3)数据标准化——是为了不同的指标进行对比和加权
-
基本思想:将数据按比例缩放,使之落入一个小的特定区间(比如按照某种公式,将所有数据标准化映射到[0,1]区间)
-
简单方法:直接将数据除以100倍,1000倍或10000倍,具体取决于数据的最大值
将数据同时缩小1W倍,进行标准化处理,便于指标之间进行比较与加权(图标有小失误)
(4)捏造趋势
假设一组公司的财务数据:
10,1,20,3,40,4,50
(数据波动性看起来很大)
如果只挑选奇数项的数据(X轴变)
看起来公司明年可以上市了
- 如果数据的波动性很大,只挑选X轴中对自己有利的数据,就会改变数据的趋势(不一定是奇数项)
二、被混淆的因果关系
- 伪相关:相关,但没有因果关系
案例1:越是成功人士(收入越高),睡眠时间越短
错误结论:只要减少睡眠时间,收入就会增加,就会越成功
上面的推理有严重的逻辑错误,把相关关系当作了因果关系
- 相关关系:A越多,B越多
- 因果关系:A越多,导致B越多
实际上“A越多,B越多”这样的相关关系,可能存在4种可能
案例2:游泳死亡人数越高,雪糕卖的越多
案例3:常吃海参的人比较聪明
- 学习统计,让我们理清思路,学会分析事物之间各种各样的关系
思考题:
三、打破权威
据统计
- 央视公布2013年虎年春晚的满意度是83.6%
- 新浪公布的调查结果为14.55%
- 腾讯公布的调查结果为10.48%
幽默:
常见的如何分辨数据的真假方法?
- 谁说的?
- 他是如何得知?
- 数据遗漏了什么?
- 是否有人偷换了概念?
- 数据有意义吗?
总结
统计学为我们提供了一种审视周边世界的新视角
这种视角可以揭示数据背后内在的真实的含义 从而让我们看到事情的真相
参考资料:
轻松驾驭统计学——数据分析必备技能(12集)–第一集
系列笔记: