统计学
文章平均质量分 90
零 度°
这个作者很懒,什么都没留下…
展开
-
统计学1——导论
仅以此系列博客记录自己的统计学(贾书)学习生活。原创 2024-07-05 16:13:14 · 496 阅读 · 0 评论 -
统计学2——数据的搜集
知识结构。原创 2024-07-06 22:37:00 · 978 阅读 · 0 评论 -
统计学3——数据的图表表示
采集到的数据往往不能直接进行分析,还需要进行审核、筛选、排序等初步操作。就是检查数据中是否存在错误。主要包括完整性和准确性两个方面,完整性主要是检查应调查的单位或个体是否有遗漏;准确性则主要检查数据的真伪和是否存在异常值。对于二手数据,还应检查数据的时效性和适用性。根据研究需要的某项特征筛选出符合条件的某类数据。按一定的顺序将数据排序,以便研究者通过浏览数据发现一些明显的特征或趋势。数据排序还有助于数据的检查纠错。原创 2024-07-07 22:26:32 · 373 阅读 · 0 评论 -
统计学4——数据的概括性度量
集中趋势的概念就是平均数的概念,它对总体的某一特征具有代表性,表明所研究的理论现象在一定时间、空间条件下的共同性质和一般水平。低层次数据的集中趋势适用于高层次的测量数据,反过来,高层次数据的集中趋势测度值并不适用于低层次的测量数据。数据的离散程度是数据分布的另一个特征,它反应的是各变量值远离其中心值的程度。数据的离散程度越大,集中趋势的测度值对该组数据的代表性越差;适合对分类数据测度离散程度,当然顺序数据与数值型数据也可以计算。众数是一个位置代表值,不受极端值的影响,可能不存在,也可能有多个。原创 2024-07-08 16:41:21 · 926 阅读 · 0 评论 -
统计学5——概率与概率分布
古典定义下的概率有两个特点一是结果有限,在基本空间中只有有限个事件发生;二是各个结果的出现的可能性被认为是相同的。通常具有这两个特点的问题也被称为。原创 2024-07-09 18:23:19 · 1148 阅读 · 0 评论 -
统计学6——统计量及其抽样分布
从均值为$\mu$、方差为$\sigma^2$的任意一个总体中抽取样本量为n的样本,当n充分大时,样本均值$\bar{X}$的抽样分布近似服从均值为$\mu$、方差为$\frac{\sigma^2}{n}$的正态分布。对于$\bar{X}$一般有$E(\bar{X})=E(X)=\mu$,$D(\bar{X})=\frac{1}{n}DX=\frac{\sigma^2}{n}$。且有$F_{p}(v_{1},v_{2})=\frac{1}{F_{1-p}(v_{2},v_{1})}$。原创 2024-07-10 21:13:51 · 1644 阅读 · 0 评论 -
统计学7——参数估计
用样本统计量去估计总体的参数。如果将总体参数笼统地用一个符号$\theta$来表示,而用于估计总体参数的统计量用$\hat{\theta}$表示,参数估计就是如何用$\hat{\theta}$来表示$\theta$。即对于两个无偏估计量$\hat{\theta}_{1}$和$\hat{\theta}^2$,若$D(\hat{\theta}_{1})原创 2024-07-11 18:01:48 · 800 阅读 · 0 评论 -
统计学8——假设检验
当原假设H为真时,却错误的拒绝了原假设,导致由部分推断总体的判断发生错误,犯这种错误的概率用α表示,统计上把α称为假设检验中的显著性水平。备择假设是指如果原假设不成立,就要拒绝原假设,而需要在另一个假设中做出选择,这个假设与原假设对立的假设,也称“研究假设”,表示为$H_{1}$,(研究者想收集证据予以支持的假设总是有不等号)。从假设检验的原理来看,不拒绝原假设只能说明与原假设相矛盾的小概率事件没有发生,但可能还有其他的小概率事件,因此“接受原假设”的说法是不严谨的,应当为“没有充分的理由拒绝原假设”。原创 2024-07-12 21:27:26 · 1987 阅读 · 0 评论 -
统计学9——分类数据统计
分类数据在第一章已经进行了详细介绍,就是对数据进行分类的结果,特征是,调查结果虽然用数值表示,但不同数值描述了调查对象的不同特征。由此分类数据的结果是频数,而$\chi^2$检验是对频数进行分析的统计分析方法$\chi^2$统计量作为三大统计量之一,可以用于测定两个分类变量间的相关程度。其中$f_{0}$表示观察值频数,$f_{2}$表示期望值频数$\chi^2$统计量描述了观察值与期望值的接近程度,两者越接近,$\chi^2$就越小。原创 2024-07-14 17:48:56 · 895 阅读 · 0 评论 -
统计学10——方差分析
其中$\bar{\bar{x}}=\frac {\sum_{i=1}^{k}\sum_{i=1}^{n_{i}}x_{ij}} {n}$,是全部观测值的总和除以观测值总个数的结果。那么如何衡量这一关系的强度?总平方和$SSR=\sum_{i=1}^{k}\sum_{j=1}^{n_{i}}(x_{ij}-\bar{\bar{x}})^2$组间平方和$SSA=\sum_{i=1}^{k}n_{i}(\bar{x_{i}}-\bar{\bar{x}})^2$$H_{1}:\mu_{1},\mu_{2},…原创 2024-07-15 20:25:10 · 1353 阅读 · 0 评论 -
统计学11——一元线性回归
最小平方法:对于第i个x值,估计的回归方程可表示为:$\hat{y}_{i}=\hat{\beta_{0}}+\hat{\beta_{1}}x_{i}$最小平方法也称最小二乘法,通过使因变量的观测值$y_{i}$与估计值$\hat{y}_{i}$,之间的离差平方和达到最小来估计$\beta_{0}$和$\beta_{1}$的方法。因此回归方程$\hat{y}_{i}=\hat{\beta}_{0}+\hat{\beta}_{1}x_{i}$的一个特征就是通过点$(\bar{x},\bar{y})$。原创 2024-07-16 21:52:05 · 1327 阅读 · 0 评论 -
统计学12——多元线性回归
(2)在已经引入模型的基础上,分别拟合剩下的自变量,继续挑选F统计量最大的组合,如果除了初始的自变量,其他自编了没有显著的,则终止运算。$R^2_{a}$同时考虑了样本量n和模型中自变量的个数k的影响,所以$R^2_{a}$永远小于$R^2$,且不会随着自变量的增加而越来越接近1,因此多元回归中常使用调整的多重判定系数。其中$s_{\hat{\beta}_{i}}=\frac{s_{e}} {\sqrt{\sum{x_{i}^2}=\frac{1}{n}(\sum{x_{i}})^2 }}$原创 2024-07-17 17:11:55 · 917 阅读 · 0 评论 -
统计学13——时间序列分析
时间序列顾名思义就是按时间顺序观察排列而成的序列,根据观察时间的不同,时间序列的时间可以是年份、季度、月份等。根据观测值的分布情况时间序列可以分为平稳序列和非平稳序列趋势季节性周期性于是时间序列的成分便可以分为随机性波动(I)、趋势(T)、季节性(S)、周期性(C)。传统时间序列分析的一项主要内容就是把这些成分从时间序列中分离出来。原创 2024-07-18 21:00:54 · 891 阅读 · 0 评论 -
统计学14——指数
对于统计学(贾书)的理论学习就到此结束了,当然对于统计的学习来说这还是远远不够的,还需要大量的实践练习。在这个专栏中的内容也必然存在许多不足,会在不断地实践逐步完善内容,希望在最后呈现出一个较为丰富的笔记。原创 2024-07-19 20:45:50 · 1029 阅读 · 0 评论