本文只是个人对统计学基础知识的一点整理,仅作参考。
基础知识
数据压缩的方法,制作“图”和“统计量”,用来反映数据特性。
平均值的计算:
1. 所有数据相加除以个数
2. 组值乘以相对频数的合计
直方图中平均值的意义:将直方图看做挑担人偶玩具(类似杠杆)时平衡的支点
平均值的性质:
1. 数据在平均值的周边分布
2. 多次出现的数据对平均值的影响比较大
3. 直方图呈左右对称的情况下,其对称轴通过的点是平均值
平均值计算类型:(基本规律是:先聚合,再分解,先进行的操作最后逆操作)
1. 算术平均值: x+y2
2. 几何平均值: xy−−√
3. 均方根值: x2+y22−−−−−√
4. 调和平均数: 21x+1y
偏差的计算:偏差 = 数据 - 平均值
方差的计算:方差 = 偏差的平方的和/数据个数,方差 = (组值 - 平均数)的平方 * 相对频数的总和
标准差的计算:标准差 = 方差开根号 = 偏差的均方根值
标准差的意义:数据以平均值为基点,在其左右扩散,评价这种扩散、分散程度的是标准差,是数据离散程度的平均化。
数据约有几个标准差:(数据 - 平均值)/ 标准差,反映数据是否特殊
数据的标准化,设数据为 x ,平均值是
这样数据就符合 μ=0,σ=1 的标准正态分布
金融商品优劣性评价基准:夏普比率(SPM)= (X的回报 - 国债的收益率)/ (X的风险),设 E(Rp) 是投资组合预期报酬率(回报), Rf 是无风险利率(国债收益率), σp 是投资组合的标准差(风险),则:
夏普比例越大,金融商品越优良
推论方法:
* 演绎法:由全体推论部分
* 归纳法:由部分推论全体
正态分布
正态分布是自然界和人类社会中最常见的分布,如抛硬币、身高数据等
标准正态分布,平均值 μ=0 ,标准差 σ=1