统计学系列目录(文末有超级大礼
):
统计学②——概率分布(几何,二项,泊松,正态分布)
统计学③——总体与样本
统计学④——置信区间
统计学⑤——假设验证
一、统计学是什么?
统计学分为两类,一类是描述性统计学,通过对数据的集中趋势和变异趋势的刻画来描述数据的分布情况,集中趋势有平均值,中位数和众数三个指标,变异趋势则有全距,四分位距,百分位距,方差,标准差等指标来衡量
另一类是推断统计学,通过对样本的统计来推断总体的参数和置信区间,以及对多变量进行相关性分析和回归预测。
用一句话就是:总结历史,预测未来
二、概率论基础
概率论是统计学中非常重要且基础的内容,因为统计学都是要基于数据分布,而数据分布就要依赖于概率分布。
1、概率是什么?
描述一个事件发生的可能性,范围在[0,1],值越接近于1,说明发生的可能性越大
引申:某一事件的信息熵就是基于其发生概率,概率越小信息熵越大,说明不确定性越大
2、各种事件?
独立事件:A,B如果为独立事件,则A发生不会影响B发生,B发生也不会影响A发生,比如连中了3次彩票为A,B为下一次仍中彩票,A,B就是独立事件,因为每次中彩票的概率都是一样的~
互斥事件:不可能同时发生的事件,比如A为吃饭噎住,B为吃饭不噎住,这两者不可能同时发生
3