从头学计量-了解统计学常见概念

本文深入探讨统计学中的核心概念,如个案、变量、误差、信度与效度的区别,以及正态分布、偏度、峰度和自由度的概念。通过实例说明假设检验、p值和置信区间的含义及其在统计分析中的应用。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

个案: 每一个个体|记录

变量: 属性

误差:随机误差(找不到原因) 系统误差(有规律)

信度: 同样方法重复测量同一对象结果一致性

效度: 与真实结果的相似性。

在这里插入图片描述
不同点

  • 研究对象不同
    信度:答卷者 效度:组卷人

  • 研究角度不同

    信度:测量的质量效度:问卷的质量

  • 数值大小不同

    • 问卷效度<问卷信度
    • 效度的最大值≤信度的平方根
    • 效度高,信度一定高;信度高,效度不一定高

正态分布

  • M± 1SD: 68%
  • M± 1.96SD: 95%
  • M± 2.58SD: 99%

偏度: 数据的倾斜(下图为右偏)

在这里插入图片描述

峰度: 有多高

在这里插入图片描述

自由度: 可以自由变化的未知数,X+Y+Z=0,自由度为2,两个数确定下来,第三个未知数自动确定

对于样本量为N的数据,它的自由度天然就是N-1个。因为它存在一个均值,这就是限制它的条件。
自由度=变量个数(样本量)N-限制条件

假设检验

在这里插入图片描述
在这里插入图片描述
判断标准: 显著性水平( significance level)-α一常用标准5%、1%和0.1%
p值(p- value): 即虚无假设事实上成立,但我们计算出的结果却错误判断虚无假设不成立的概率
用p值与α进行比校,以此判断结果。

深入理解p值

这个东西困扰我好久了,我只会比较但不理解含义。
p值代表真实样本数据中小概率事件发生的偶然性,当偶然性不大的时候就可以认为原假设错误,比如猪肉场宣称自己的猪肉都是5kg,你买了100块猪肉发现均值不是5kg,而是4kg,原假设就是猪肉是5kg,备则假设是猪肉不是5kg。p值就是猪肉不是5kg出现的偶然性。现在你固定显著性水平 α \alpha α是5%,即只要偶然性低于5%,就可以拒绝原假设,因为偶然性越低代表猪肉不是5kg的普遍性越高。下面置信区间是什么意思呢,还是猪肉,如果你买的100块猪肉的平均值是4kg,标准误差是1kg,那么你置信区间是(4±1)*95%概率的分位数。还是猪肉,如果你买的100块猪肉的平均值是4kg,标准误差是1kg,那么你置信区间是(4±1)*95%概率的分位数。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Data_Designer

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值