统计推断的前提和最应该知道的概念

统计推断的前提和最应该知道的概念

之前收到一些同学朋友的咨询,大部分是关于如何计算p值的。诸如:我知道均数和方差可以计算p值吗?或者给我列了列联表让我我计算p值的。
面对这样的问题,我很无奈,我的回答一般都是,你有原始资料吗,把原始资料给我看看?可以算,但是如果你仅仅给我均数方差N、仅仅给我一个列联表,它有什么意义呢?
今天我将对我以上的发问进行解答,讲一讲在进行统计分析前,最应该知道的东西——样本推断总体!

随便翻开一本统计学教材,最最最开始一定会告诉大家几个最基本概念,总体、样本、参数、统计量、误差、抽样、随机化、概率、频率……讲完这些才告诉大家统计描述和统计推断……

所以,为什么知道均数、方差N,有列联表计算的p不一定有意义?
请听一个小学应用题:小明有5岁,小红有3个苹果,请问他俩一共有几个苹果?
这根本没法计算,但统计软件它不知道,统计软件就是个计算器。你给他5和3,加减乘除乘方随便来一通不就出结果了吗,但结果是你想要的吗,不是!

计算p值属于统计推断,也就是,根据样本信息,推断总体信息。
举个例子,厂家做了两批灯泡A和B,想知道谁的寿命更长,好采取不同的定价策略;当然,最精确的办法是,把两种灯泡都用完再比较,但那已经没有意义了。
所以,正常的做法是,从A、B两批灯泡中,分别抽取一定数量的灯泡(这就是样本,我们可以把它叫做a、b),测量他们的寿命a1、a2、a3……b1、b2、b3,最后比较其寿命,然后用这两批“样本”去推断这两批灯泡(A、B)的寿命。那么,如何抽取a和b呢,要抽多少,要怎么抽?

(1)怎样抽样?
田忌赛马的故事大家都听过,大家都知道田忌的上中下三等马都差于对手,但最终田忌赢了。为什么?因为他们在“抽样”的时候做了手脚,用田忌的上等马对对手中等马,用田忌中等马对对手下等马,赢了两局。
对此,抽样的时候尽可能做到随机化

(2)抽多少合适?抽的少不行,抽的多浪费资源。以后再讲具体的。

(3)p值是什么,由于我们抽取的是两批灯泡中的部分样品,用这个样本去代表总体可能出错,也就是你得出a好于b,但实际情况是A差于B,这个时候才需要计算p值,看看你犯错误的可能是多少。如果犯错误的可能性很低(比如小于0.05,0.01),你才可以根据你的a好于b的结论来推断A好于B。

(4)什么时候才需要计算p值,如果你根本没有抽样,你比较的是两个总体,不需要计算p值。你把A、B两批灯泡用完了,再比较他们的寿命长短,那不可能有错,大就是大、小就是小。。。。

(5)用什么方法计算p值,这需要根据样本的分布来确定。以后再讲具体的。

(6)最后说明下,抽样不仅仅是直观的,抛一次硬币这样的也是抽样。

为什么说,你给我均数、方差、N,列联表,我计算的p值可能没意义。因为资料可能根本没有抽样,在用两个总体比较,可能没有随机化抽样,可能“所给的列联表”仅仅是几个数字,不是有真正的列联表……

最后解释下,如果知道均数、方差、N,还知道它属于正态分布,逆运算计算一下p是可以的,但一般用于验证别人研究的结果。。。。看到别人的四格表资料,也可以给他计算下p看看它有没有错误。。。

在这里插入图片描述
欢迎大家关注微信公众号。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: 统计推断是一种通过数据分析和模型构建来进行推理和预测的方法。它通过收集和整理样本数据,并运用统计学原理和方法,从中推断总体特征和参数。统计推断的目的是通过对样本数据的分析,对总体进行推断,并对未知数据进行预测。 统计推断的过程通常包括两个方面:参数估计和假设检验。参数估计是指基于样本数据,通过运用统计学方法,对总体分布的参数进行估计。常用的参数估计方法有点估计和区间估计。点估计是以样本数据来估计总体参数的一种方法,例如通过样本均值来估计总体均值。区间估计是通过构建一个区间,将总体参数估计值包含在其中,来估计总体参数的范围。 假设检验是指通过对样本数据的分析,对总体参数的某种假设进行检验的方法。假设检验通常分为零假设和备择假设,其中零假设是在统计学中认为是真的假设,备择假设则是对零假设的否定。通过计算样本数据的统计量,并在假设成立的前提下,计算该统计量的概率。若该概率小于预先设定的显著性水平,则可以拒绝零假设,认为备择假设成立。 统计推断在科学研究、市场调查、医学诊断等领域都有广泛用。它能帮助人们从有限的样本数据中获取关于总体的信息,为决策提供依据。在统计推断的过程中,需要注意样本的选取、样本的代表性以及所使用的方法的合理性,以保证推断的准确性和可靠性。 ### 回答2: 统计推断是一种基于概率论和统计学原理的方法,用于根据样本数据对总体特征进行推断和预测。PDF(Probability Density Function,概率密度函数)是统计推断中常用的一种工具,它描述了连续型随机变量在各个取值上的概率分布情况。 在统计推断中,我们通常通过收集一部分样本数据来进行分析。首先,我们需要了解总体数据的分布情况,通过PDF可以获得关于总体随机变量的概率密度函数。概率密度函数是描述样本数据与总体之间关系的数学函数,它能帮助我们研究总体的特征和规律性。 CSDN(中国专业的IT社区)是一个拥有大量技术文章和资源的网站。在这个网站上,我们可以找到很多关于统计推断和PDF的相关文章和教程,这些资源可以帮助我们更好地理解统计推断的原理和用。在CSDN上,我们可以学习如何使用不同的统计方法,包括PDF,在数据分析和推断的过程中提供帮助。 总之,统计推断和PDF是统计学中重要的概念和工具。通过对总体的抽样和分析,我们可以利用PDF函数来研究总体的特征和规律性。CSDN作为一个IT社区,为我们提供了学习统计推断和PDF相关知识的资源和平台。 ### 回答3: 统计推断(Statistical inference)是统计学中的一个重要分支,通过利用样本数据对总体特征进行推断和估计。它使用概率论和统计学方法,通过对样本数据的分析,对总体特征进行研究和判断。 统计推断包括参数估计和假设检验两个方面。参数估计是通过样本数据对总体参数进行估计,常用的方法有点估计和区间估计。点估计是通过样本数据,得到总体参数的一个“点”估计值;区间估计是通过样本数据,得到总体参数的一个区间估计范围。对于点估计,常用的方法有最大似然估计和最小二乘估计;对于区间估计,常用的方法有置信区间估计。 假设检验是通过样本数据对总体参数进行推断和判断。假设检验旨在根据样本数据,对总体参数的假设进行判断。在假设检验中,首先建立原假设和备择假设,然后利用样本数据计算统计量,通过计算统计量的值与临界值的比较,来判断原假设是否成立。 统计推断在实际用中起到了重要的作用。通过对样本数据的统计推断,可以对总体特征进行估计和推测,进而对实际问题进行决策和预测。统计推断在许多领域中都有广泛的用,如医学研究、社会调查、经济学等。它为我们提供了一种科学和可靠的方式,从有限的样本数据中推断和判断总体的特征,为决策和实际问题解决提供依据。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值