@01统计学温习-4月4日
01统计学温习-4月4日
近期公司上线了大数据平台和相关应用,做为应用人员中感觉还是要深入了解一些深层的原理。做为理工男大学多少都学过高等数学,但远离课堂N多年,数学符号已成了熟悉的陌生人,遂开始恶补数据分析、统计学等基础性的知识,试着融入这个时代。
此次跟着视频从最基础开始温习统计学知识,3日、4日学习了12课至34课。首先学到了统计学中的一些概念的专业性描述、数学符号。跟着过了一遍二项式、泊松分布、正态分布的数学推导过程,还好看得懂——密度函数求积分的过程也想起来了。
至于应用场景中常见的双峰、左偏、右偏分布也终于有点明白是怎么回事了。
不清楚未来学到什么程度,但一定坚持跟学到80课。
12课
Sample 样本和总体 Population
样本 总体
均值 X上横 μ(听视频,似乎mean的发音是来自这个希腊字母?)
x₁ 大写X
xn 大写N
13课
dispersion 离差 Population dispersion 总体离中值
variance 方差,反映数据离数据中心的距离,离散度
14课
样本方差。这几个都体现了一个意思:用样本替代总体;用样本反映总体;用样本均值近似表示总体均值;用样本方差近似表示总体方差。
使用另一个公式:总体方差的无偏估计或无偏样本方差。分母变成n-1,这样取值略大。
15课
标准差 std
16课
诸方差
方差公式简化、推导结果
这个公式可在某些场景下用于快速求方差
17课
离散随机变量、连续随机变量
18课
density function
20课
–
23课
离散随机变量的期望值就是均值。
24课
二项分布期望值 = n*P
27课
law of large numbers 大数定理
28课
正态分布、高斯分布、鈡曲线
对比二项分布曲线和正态分布曲线,趋近。代码演示。
30课
bimodal distribution双峰分布
right skewed distribution右偏态分布
left skewed distribution 也称为negatively skewed distribution
左偏态分布,也称为 负偏态分布。
32课
empirical rule 经验法则。又称为68-95-99.7法则
遵循正态分布:
低于均值1个标准差的概率密度(经验概率)约68%,
低于均值2个标准差的概率密度约95%,
低于均值3个标准差的概率密度约99.7%,