统计学
花花呼呼
这个作者很懒,什么都没留下…
展开
-
95%置信区间
置信区间在SPSS里可以通过描述-探索获得1. 样本容量大于30根据中心极限定律以及正态分布(z table),95%置信区间的范围基本等于:sample mean ± 2*样本均值的抽样分布的标准差这里,sample mean是观测到的,‘2’是查正态分布z table表得出,而样本均值的抽样分布的标准差(也叫标准误差SE)等于:samp...原创 2017-08-14 23:33:00 · 20530 阅读 · 0 评论 -
关于样本标准差(SD)与样本标准误差(SE)
许多paper里经常能看到Mean±SD(SE)这样的表达方式,或者在图表里用SD或者SE来表示error bar,用SD的居多,但是也有不少用SE的。初学者很容易混淆SD(standard deviation)和SE(standard error)。SDSD我们都很清楚,是表达数据的离散程度,然后实际应用中很多数据具有近似正态分布的概率分布,有了SD...原创 2017-07-14 23:17:00 · 75419 阅读 · 0 评论 -
样本量对差异性分析(Anova)或者T 检验的影响
样本量大的时候做差异性分析容易得到有显著性差异的结论,原因如下图, 求p值的过程中,n越大,Z0也越大,相对应的p就小了。当然这里默认方差变化不大的情况下,因为一般来说很多数据经过平均后方差不会变化很大,相比平均前后的样本量。p值计算, from google image下图中的数据,y1和y2的数据量各为1000,y1m和y2m数据量各为...原创 2017-08-08 19:15:00 · 17788 阅读 · 0 评论 -
TableCurve 3D寻找拟合公式
拟合的时候不知道拟合公式的情况下,可以尝试TableCurve 2D和TableCurve 3D(听说1stopt 也不错,也支持拟合公式海量匹配,而且在已知公式拟合的时候甚至要优于MATLAB的,因为初值的问题)。TableCurve 3D内置了37365个公式可供拟合,只支持z = f(x, y)这样的公式形式,TableCurve 2D内置了3507...原创 2017-08-04 19:12:00 · 5890 阅读 · 0 评论 -
伯努利分布(二项分布)的假设检验
要点1. 单个二项分布检验用SPSS二项检验或者单样本T检验2. 比较两个个二项分布差异性之类的可以用Anova或者独立样本T检验,后者可以得到置信区间。3.上面的SPSS数据形式都是1和0的形式,用MATLAB生成即可。譬如这样一个问题:中国的互联网络覆盖率是不是在30%以上(5%显著性水平)?抽样显示,150个样本中,有57个是有网络覆盖...原创 2017-08-14 22:55:00 · 33672 阅读 · 1 评论 -
68-95-99.7法则
在实际应用上,常考虑一组数据具有近似于正态分布的概率分布。若其假设正确,则约 68% 数值分布在距离平均值有 1 个标准差之内的范围,约 95% 数值分布在距离平均值有 2 个标准差之内的范围,以及约 99.7% 数值分布在距离平均值有 3 个标准差之内的范围。称为"68-95-99.7法则"。PS:对于不符合正态分布的数据,该法则依然适用...原创 2017-08-14 23:42:00 · 4331 阅读 · 0 评论 -
中心极限定理
中心极限定理:设从均值为μ、方差为σ2总体中抽取样本量为n的样本,当抽取次数充分大时,样本均值的抽样分布近似服从均值为μ、方差为σ2/n 的正态分布。中心极限定理是统计学里非常伟大的定理,对于属于正态分布的指标数据,我们可以很快捷地对它进行下一步假设检验,并推算出对应的置信区间;实际应用中,很多分布往往是很杂乱的,但是根据中心极限定理,样本均值的抽样分...原创 2017-08-15 00:38:00 · 7082 阅读 · 0 评论 -
F检验(ANOVA)
F分布是两个卡方分布(具有不同的自由度)的比值。方差分析(ANOVA),又叫F检验,简单来说,就是求得F统计量(组间方差/组内方差),然后查F表,如果大于临界值(一般是0.05显著性水平下)则拒绝原假设,即组间具有显著性的差异。F统计量 = 组间方差/组内方差这里的方差等于平方和除以自由度,组间的自由度为(组数-1),组内自由度为组数*(样本量-1...原创 2017-08-15 20:26:00 · 50686 阅读 · 0 评论 -
归纳推理和演绎推理
归纳推理就是根据已有的数据或者事实,去寻找规律,甚至找到方程式,然后带入或者外推到未知的数据,譬如预测人口,我们可以根据已有的数据推出一个人口数与年份的拟合公式,然后带入年份外推即可。演绎推理是根据已有的事实,得到其他的一些事实,然后可以用其他数据来验证。常见的譬如公式的逻辑推理(譬如推倒(x+y)2 = x2 +2xy +y2),演算得到不同的公...原创 2017-08-15 20:28:00 · 4217 阅读 · 0 评论 -
为什么样本标准差分母为n-1
我们知道总体标准差(σ)是按照下面的公式来计算的:但是在真实世界中,找到一个总体的标准差是不现实的。大多数情况下,我们都是通过计算样本标准差(s)来估计总体标准差(σ)的。但是s的计算公式是这样的:分母为什么要(n-1)呢,而不是n?维基百科给出的解释有点费解:看过很多统计学的教程和问...原创 2017-07-13 17:15:00 · 8038 阅读 · 0 评论