0531笔记

这个月是一个怎样的月,是一个疯狂背单词的月

其实我的单词任务在23号左右的时候已经完成,后面的几天就是在通过音频进行重复。

这个月生活中的理财原理、商业数据挖掘结课,还有文献阅读也结课,

提交了形势与政策的作业,然后就是还在完成专业文献阅读13篇的基本要求。

我特别喜欢5月,一个原因是5月有31天,最后的这一天像一个礼物,让我有机会思考前面的内容

这个月的计量课程也接近尾声,从最开始将两个变量之间的关系,相关关系和函数关系(这里指的是两个数值型变量),到逐步学习一元线性回归、多元线性回归,以及放宽基本假定的处理,比如说异方差内生性这种。其实这门课更多像是统计学课程的一个拓展。因为统计学也是关于数据的收集整理和分析的科学,甚至包括到预测。计量就像是把数据分析的回归分析这一块单独拎出来细细地讲。所以,我把它看做统计学课程下面的一个子课程。

统计学这门课程是值得认真学习的一门课程。从数据的收集到数据的统计分析。数据的收集包括数据的抽样方法,各种抽样方法,从总体中的到样本。得到这个用于分析的样本后,首先我们可以对其进行描述性统计。也就是说这些数据基础上可以做一个描述,关于中位数四分位数,均值方差标准差这种。我们可以采用各种图去描述它们,比如柱状图箱线图条形图等。当然样本还有更加多样的统计量,统计量帮助我们把我们想要关注的信息从样本中集中起来。也就是说,通过统计量,我们对样本有了更精确的把握,上面的关于数据的集中趋势什么的这种描述只能算是一个总体性的把握。那么关于统计量呢,我们就是说大大小小多多少少你要懂点概率论的知识。

这里我说统计学你们综合的学科一点不为过。前面学过的概率论在这里是要用到的。而概率论呢,这个东西,其实包含了微积分,比如说你回想一下概率密度函数,是不是经常对概率密度函数积分得到分布函数,求某个区间对应的概率,当然这里是指连续型变量。因为概率论里面讲分布,讲随机事件衍生出来的概念随机变量的分布。如果这个随机变量是一个离散型的,也就是这个变量所有的取值都是可以完全列举出来,就像是一个加强版的分类变量,那么这里更多的是代数计算。最常见的比如0-1分布。一个列联表,上面变量的取值,下面对应的概率,一个大表画出来直接按照加权平均数的思想求出期望值,然后再求出取值去期望值之差的平方的期望,即方差。如果呢,这个变量是一个连续型的变量,那么这里就是要涉及到我们的函数和常见的分布。

最常见最普通也是最重要的分布是正态分布。我之前一直挺好奇为什么这个分析如此的重要。原来是因为我们生活中很多连续型变量的分布都服从这个分布,你看这个东西的英文名就知道normal distribution。也就是很平常很常见。那正态分布(高斯分布)它其实说了一个什么事呢,就是说啊,对于一个整体来说,大部分数据都集中在中间,过大过小的极值出现的概率都很小。这里要提一下的是,正态分布的纵轴代表的是一种概率密度,也就是随机变量在某一特定值处的概率密度大小。在均值处,概率密度是很大的。那么的话,对于大多数连续型的变量,都符合这个分布规律,正态分布自然很重要。当然,我们还有其他分部,比如均匀分布、指数分布、t分布F分布,这种。我们都会用分布函数以及对应的概率密度函数来描述这个事情。

你了解这些常见的分布后,你就可以构造统计量根据这个分布的图形情况,来进行假设检验。

也就是说但我们离开描述性统计之后,我们就是进入了推断性统计。参数估计、假设检验。这里还要提一个概念,抽样分布。抽样分布是指从总体中随机抽取样本时,样本统计量(如样本均值、样本方差等)的概率分布。它是统计推断的基础,用于估计总体参数的不确定性。抽样分布的形状、中心和离散程度取决于样本大小和总体分布的特性。例如,当样本量足够大时,根据中心极限定理,样本均值的抽样分布趋近于正态分布,无论总体分布如何。

参数估计就是你要利用样本的统计量去估计总体的参数,那这个就是统计学利用科学原理要做的事情。主要有两个方案,一个是点估计一个是区间估计。点估计是用样本统计量的某个取值直接作为总体参数的估计值。例如,最大似然估计就是一种常见的点估计方法,它基于观察到的样本数据,试图找到一个参数值,使得在该参数值下观察到这些数据的概率最大化。区间估计则是在点估计的基础上,给出总体参数的估计的一个区间范围,该区间通常由样本统计量加减抽样误差得到。

假设检验的事呢是这样的。

假设检验是统计学中用来检验关于总体参数的假设是否成立的一种方法。其基本步骤包括:

1. 提出假设:通常包括零假设(H0,表示没有效应或差异)和备择假设(H1或Ha,表示有效应或差异)。
2. 选择检验统计量:根据数据类型和假设检验的目的选择合适的统计量。
3. 确定显著性水平:通常用α表示,常见的α值有0.05、0.01等,它决定了犯第一类错误(拒真错误)的概率上限。
4. 计算检验统计量的值:根据样本数据计算检验统计量的观测值。
5. 做出决策:将检验统计量的观测值与临界值或P值比较,根据比较结果拒绝或不拒绝零假设。

假设检验的结果可以帮助研究者判断样本数据是否提供了足够的证据来支持或反对某个关于总体的假设。

  • 4
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值