【学习笔记】统计学入门(2/7)——连续变量的统计描述

来源:http://study.163.com/course/courseMain.htm?courseId=1005232026

 

 

索引——

  • 基本概念
  • 连续变量的统计描述
  • 分类变量的统计描述
  • 正太分布
  • 二项分布
  • 参数估计与可信区间
  • 假设检验

 

 

二、连续变量的统计描述

 

1、统计方法

     1.1 频数表

     组数:不宜过多或过少,保证大多数组都有个观察值

     组距:确定全距猴,进行等距分组,组距(约等于)极差/组数

     上下限:各组的起点称为该组下限,终点称为上限

     1.2 直方图/频数图

     从频数图/表中可获得的信息:

     (1)集中趋势:高峰组段在什么位置出现

     (2)离散趋势:数据分布范围、分散程度如何

     (3)分布形状:是否对称,分布曲线的形状;正、负偏(尾巴在那边就偏哪边,推荐说法)和左、右偏

     (4)分布特征:如一个高峰还是两个高峰,有无偏移得较远的值

2、集中趋势(central tendency)描述指标

     2.1 均数(mean):即算数平均数,描述一组数据在数量上的平均水平;

                              总体均数和样本均数用不同符号表示:μ和

                              均数的书写都应该带有测量单位,如:身高1.7米;

                              均数的实质:把各个原始值抽象画,集中在一个平均水平上。

           均数的优点:(1)高度浓缩,一个数值代表整个个体的水平;(2)便于比较、传播

           均数缺点:(1)大锅饭:掩盖了数据间的差异性;(2)欺骗性:对个别极端值反应比较灵敏 ,如图:                          

                         

  • 1
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值