统计学
文章平均质量分 79
ls317842927
这个作者很懒,什么都没留下…
展开
-
统计学1
样本和总体统计学关心的是对样本进行描述性统计,然后推断出总体的情况。对样本进行统计分析,一般能帮助估计总体的参数。μ\mu代表总体均值,X¯\bar{X} 表示样本均值。公式:μ=∑Ni=1xiN\mu =\frac{\sum_{i=1}^{N}x_{i}}{N},X¯=∑ni=1xin\bar{X}=\frac{\sum_{i=1}^{n}x_{i}}{n},其中,总体的个数N,样本(总体的子集)原创 2017-01-28 22:18:46 · 755 阅读 · 0 评论 -
统计学10
方差分析 1、计算总平方和SST SST也就是这些数据点离均值的距离的平方之和,将其考虑为计算方差时的分子部分。 总平均值X¯\bar{X}=(3+2+1+5+3+4+5+6+7)/9=4,它等于每个数据集的均值的均值。X1¯\bar{X_{1}}=2,X2¯\bar{X_{2}}=4,X3¯\bar{X_{3}}=6。 SST=(3−4)2+(2−4)2+(1−4)2+(5−4)2+(原创 2017-02-12 09:13:04 · 1004 阅读 · 0 评论 -
统计学9
卡方分布介绍 从概率密度图中看出,如果只从标准正态分布中抽样一次,n=1,得到接近0的可能性非常大,接近0的数再平方后会更接近0,所以得到小数值的概率非常高。随着n增加,小数值的平方和会增大,曲线会向右偏移。凸起部分越往右,某种程度上曲线越对称。卡方分布大体上是衡量离期望值的总误差,使用该分布能求出某一误差的概率。皮尔逊卡方检验 考虑购入一家餐厅,问老板店内每天顾客数的分布,给出下图,周一来原创 2017-02-11 19:53:03 · 337 阅读 · 0 评论 -
统计学4
中心极限定理 中心极限定理是最基础、意义最重大的概念之一。根据该定理,任意良好定义了均值和方差的分布,不管该分布是连续还是离散的,随着样本容量增大,所有样本和或者样本均值或者众数极差等统计量都符合正态分布。样本均值的抽样分布 抽样分布来自于原分布,这里我们求的是样本均值,由原分布的样本得到。 比如,下图的离散概率分布,可以看出不可能是正态分布 下面我们取该随机变量的样本,求其平均值,然后原创 2017-02-07 18:10:20 · 474 阅读 · 0 评论 -
统计学8
线性回归中的平方误差 假设坐标平面内有n点,想找到一条直线,最小化这些点到该直线的平方误差。我们需要求出m和b的值。 定义下误差的概念 e1=y1−(mx1+b)e_{1}=y_{1}-\left ( mx_{1}+b \right ) . . en=yn−(mxn+b)e_{n}=y_{n}-\left ( mx_{n}+b \right )平方误差 SE=e21+...+e原创 2017-02-11 09:26:34 · 318 阅读 · 0 评论 -
统计学7
随机变量之差的方差 假设有两个随机变量X和Y,两者完全独立。 E(X)=μXE(X)=\mu_{X}, E(Y)=μYE(Y)=\mu_{Y}, Var(X)=E((X−μX)2)=σ2XVar(X)=E((X-\mu_{X})^{2})=\sigma^{2}_{X}, Var(Y)=E((Y−μY)2)=σ2YVar(Y)=E((Y-\mu_{Y})^{2})=\sigma^{2}_{Y原创 2017-02-10 13:36:20 · 603 阅读 · 0 评论 -
统计学5
参数估计 统计推断的基本问题可以分为两大类,一类是参数估计问题,另一类是假设检验问题。下面讲的是总体参数的点估计和区间估计。1、点估计 最大似然估计法是一种常用的构造估计量的方法。 2、区间估计 置信水平 从农场收获的20万个苹果中抽取36个作为样本,样本中苹果重量的均值是112克,标准差为40克,问20万个苹果的重量均值处在100到124克之间的概率是多少。这20万个原创 2017-02-08 13:53:03 · 1333 阅读 · 0 评论 -
统计学2
随机变量 我们熟悉的变量是比如y=2x+3,x y是变量,该变量可以变化,可以取特定值,可以求出值。而随机变量虽然也可以取很多值,但这些变量无法求解。随机变量用大写字母X Y Z表示,这和可以求解的传统变量分开。随机变量其实是一种函数,将随机过程映射到实际数字。假设想量化一个随机过程,比如明天是否下雨。我们则可以定义一个随机变量X,如下图。X这个变量的取值是随机的,因为这个过程是随机的。再比如骰子原创 2017-01-29 21:06:32 · 461 阅读 · 0 评论 -
统计学3
正态分布 这一节我们将讲统计学中最重要的概念,甚至是任何科学领域中最重要的概念,因为它在生活中无处不在,就是正态分布,或者叫高斯分布或钟形曲线。使用Excel可以说明,二项分布在试验次数足够时会很接近正态分布。从图中可以看出均值为100*0.3=30。注意K=60~100概率极低但也不为0。 正态分布的概率密度函数图像 概率密度函数f(x)=12π√σe−12(x−μσ)2f(x)=\frac原创 2016-11-29 10:17:04 · 677 阅读 · 0 评论 -
统计学6
假设检验 统计推断的基本问题可以分为两大类,一类是参数估计问题,另一类是假设检验问题。精神学家用老鼠测试一种药物的反应时间的效果,已知没有注射药物的老鼠平均反应时间是1.2秒,100只注射了药物的老鼠平均反应时间是1.05秒,样本标准差是0.5秒,你认为药物对反应时间有效果吗?这里需要建立两个假设,第一个假设是零假设H0H_{0}:药物对反应时间无效果,也就是注射了药物的老鼠平均反应时间原创 2017-02-09 15:42:39 · 2213 阅读 · 0 评论