统计学
文章平均质量分 72
alistair_chow
这个作者很懒,什么都没留下…
展开
-
统计学学习笔记——(1)统计学研究方法概论
抽象概念抽象概念(Construct):抽象概念很难被定义和度量,也许每个人都有自己的定义方式和度量方法。例如,怎么去度量幸福? 幸福就是:我饿了,看见别人手里拿个肉包子,他就比我幸福;我冷了,看见别人穿了一件厚棉袄,他就比我幸福;我想上茅房,就一个坑,你蹲那儿了,你就比我幸福。 ———— 范伟操作定义(Operational Definition):操作定义是抽象概念的测量单位。一旦原创 2017-11-09 13:15:56 · 2859 阅读 · 0 评论 -
统计学学习笔记——(10)t检验
t分布当我们不知道总体标准偏差时,用t检验是最好的方式,用样本标准偏差来取代。t统计量(t-statistic):计算t统计量与计算z统计量非常相似,可以用以下公式计算: t=x¯−μσn√t=\frac{\bar{x}-\mu}{\frac{\sigma}{\sqrt{n}}}我们同样必须计算样本的自由度(df): df=n−1df=n-1与z统计量一样,我们可以使用来获取低于特定值或在特定值原创 2017-12-01 11:07:27 · 7490 阅读 · 0 评论 -
统计学学习笔记——(8)估计
置信区间(Confidence Intervals)误差幅度(Margin of error):我们从样本统计量估计总体参数时所预测的误差。误差幅度计算公式为: Z∗⋅σn√Z^*\cdot\frac{\sigma}{\sqrt{n}}Z∗Z^*是置信水平的临界Z值置信水平(Confidence level):估计的置信水平是指,所有可能样本的均值落在估计误差范围内的百分比。也就是说,我们有一定的原创 2017-11-23 12:36:25 · 8214 阅读 · 1 评论 -
统计学学习笔记——(5)归一化
标准正态分布标准正态分布(Standard Normal Distribution):标准正态分布式一个特殊的正态分布。其随机变量均值为0,标准偏差为1。普通的随机变量在标准正态分布上的映射称为标准化值或Z值。Z值标准化值(Standard Score):给定一个观察值xx,通过用xx减去均值再除以标准偏差就可以得到Z值。 Z=x−μσZ = \frac{x-\mu}{\sigma}示例例1:职业原创 2017-11-16 17:17:31 · 3588 阅读 · 0 评论 -
统计学学习笔记——(7)抽样分布
中心极限定理(Central Limit Theorem)中心极限定理帮助我们了解以下事实,无论总体的分布是否为正态: 1. 样本均值的均值和总体均值近似 2. 样本均值的标准偏差总是等于标准误差 3. 样本容量越大,其样本均值越接近正态分布抽样分布(Sampling Distributions)抽样分布是样本统计量的分布。它可以被看作是从同一指定大小的总体中,所有可能样本的统计量分布。原创 2017-11-21 15:22:42 · 1835 阅读 · 0 评论 -
统计学学习笔记——(4)差异性
箱线图和IQR箱线图(Box Plot):是由一组数据的最大值(maximum),最小值(minimum),中位数(median),两个四分位数(quartiles)这五个特征值绘制而成的,它主要用于反映原始数据分布的特征,还可以进行多组数据分布特征的比较。四分位距(interquartile range,IQR):又称四分差,是第三四分位数和第一四分位数之间的距离。其计算公式为: Qd=Q3−Q原创 2017-11-15 14:49:23 · 4447 阅读 · 0 评论 -
统计学学习笔记——(3)集中趋势
集中趋势(Central Tendency)是指一组数据项某一中心值靠拢的程度,它反映了一组数据中心点的位置所在。均值,中位数,众数均值(Mean):也称平均数,它是全部数据的算术平均。均值在统计学中具有重要的地位,是集中趋势的最主要测度值。可以通过数据值的总和除以数据的个数来计算:x¯=∑ni=0xin\bar{x}=\frac{\sum_{i=0}^nx_i}{n}中位数(Median):是一组原创 2017-11-14 10:10:29 · 5745 阅读 · 2 评论 -
统计学学习笔记——(6)概率分布
概率分布函数概率分布函数(Probability Distribution Function,PDF):概率分布函数是一个普通的曲线,该曲线下的面积为1,用它来表示值的累积频率查出概率我们可以使用PDF来测算出特殊值的概率。例1:一所私立大学的学生标准身高为1.85米,其标准偏差为0.15米。玛吉身高为2.05米,有多少百分比的学生比她矮,有多少百分比的学生比她高?为了解决这个问题,首先算出玛吉的Z原创 2017-11-17 10:22:05 · 1109 阅读 · 0 评论 -
统计学学习笔记——(2)数据可视化
频数频数(Frequency):数据落在某一特定类别或组中的数据个数。比例比例(Proportion):一个样本(或总体)中各个部分的数据占全部数据之比。 比例比例(Proportion):一个样本(或总体)中各个部分的数据占全部数据之比。使用前面的数据集,不及格(< 60)的学生的比例为,9÷25=0.36或36%进行数据整理,数据整理结果如下: 直方图直方图(Histogram):数据分布的原创 2017-11-13 10:11:11 · 1238 阅读 · 0 评论 -
统计学学习笔记——(9)假设检验
假设检验假设检验是用来检验一个人的观点,即某个人的观察与已知的总体参数有何不同显著性水平(Alpha level):显著性水平帮助我们分布的临界区域零假设(Null Hypothesis):零假设是指干预后的总体和当前总体参数之间没有显著性差别。零假设总是等式,通常如下表示: H0:μ0=μH0:μ0≥μH0:μ0≤μH_0:\mu_0 =\mu\\H_0:\mu_0 \ge \mu\\H_0:\原创 2017-11-28 14:09:58 · 1101 阅读 · 0 评论