下列统计量服从什么分布_医学统计学-总结-重点-笔记-复习资料

第一章

2选1

总体:总体(population)是根据研究目的确定的同质观察单位(研究对象)的全体,实际上是某一变量值的集合。可分为有限总体和无限总体。总体中的所有单位都能够标识者为有限总体,反之为无限总体。

总体population根据研究目的而确定的同质观察单位的全体。

样本:从总体中随机抽取部分观察单位,其测量结果的集合称为样本(sample)。样本应具有代表性。所谓有代表性的样本,是指用随机抽样方法获得的样本。

样本sample从总体中随机抽得的部分观察单位,其实测值的集合。

3选1

小概率事件:我们把概率很接近于0(即在大量重复试验中出现的频率非常低)的事件称为小概率事件。

P值:P 值即概率,反映某一事件发生的可能性大小。统计学根据显著性检验方法所得到的P 值反应结果真实程度,一般以P ≤ 0.05 认为有统计学意义, P ≤0.01 认为有高度统计学意义,其含义是样本间的差异由抽样误差所致的概率等于或小于0.05 或0.01。

P值是:1) 一种概率,一种在原假设为真的前提下出现观察样本以及更极端情况的概率。2) 拒绝原假设的最小显著性水平。3) 观察到的(实例的) 显著性水平。4) 表示对原假设的支持程度,是用于确定是否应该拒绝原假设的另一种方法。

小概率原理:一个事件如果发生的概率很小的话,那么可认为它在一次实际实验中是不会发生的,数学上称之小概率原理,也称为小概率的实际不可能性原理。统计学中,一般认为等于或小于0.05或0.01的概率为小概率。

资料的类型(3选1)

(1) 计量资料:对每个观察单位用定量的方法测定某项指标量的大小,所得的资料称为计量资料(measurement data)。计量资料亦称定量资料、测量资料。.其变量值是定量的,表现为数值大小,一般有度量衡单位。如某一患者的身高(cm)、体重(kg)、红细胞计数(1012/L)、脉搏(次/分)、血压(KPa)等。

计量资料measurement data定量资料quantitative data数值变量资料numerical variable

为观测每个观察单位某项指标的大小,而获得的资料。

(2) 计数资料:将观察单位按某种属性或类别分组,所得的观察单位数称为计数资料(count data)。计数资料亦称定性资料或分类资料。其观察值是定性的,表现为互不相容的类别或属性。如调查某地某时的男、女性人口数;治疗一批患者,其治疗效果为有效、无效的人数;调查一批少数民族居民的A、B、AB、O 四种血型的人数等。

计量资料enumeration data定性资料qualitative data无序分类变量资料unordered categorical variable 名义变量资料nominal variable

为将观察单位按某种属性或类别分组计数,分组汇总各组观察单位数后而得到的资料。

(3) 等级资料:将观察单位按测量结果的某种属性的不同程度分组,所得各组的观察单位数,称为等级资料(ordinal data)。等级资料又称有序变量。如患者的治疗结果可分为治愈、好转、有效、无效或死亡,各种结果既是分类结果,又有顺序和等级差别,但这种差别却不能准确测量;一批肾病患者尿蛋白含量的测定结果分为 +、++、+++等。

等级资料ranked data半定量资料semi-quantitative data有序分类变量ordinal categorical variable资料

为将观察单位按某种属性的不同程度分成等级后分组计数,分类汇总各组观察单位后而得到的资料。

等级资料与计数资料不同:属性分组有程度差别,各组按大小顺序排列。

等级资料与计量资料不同:每个观察单位未确切定量,故亦称为半计量资料。

两种误差(2选1)

抽样误差(sampling error )由于抽样而引起的总体指标(参数)与样本指标(统计数)之间的差异。抽样误差是由个体变异或其它随机因素造成的,是不可避免的,但误差分布有规律可循,可进行估计和分析。

系统误差(systematic error):由于测量仪器结构本身的问题、刻度不准确或测量环境改变等原因,在多次测量时所产生的,总是偏大或总是偏小的误差,称为系统误差。它带有规律性,经过校正和处理,通常可以减少或消除。

统计的步骤(考填空题,四个空)

统计工作的步骤

1.设计:设计内容包括资料收集、整理和分析全过程总的设想和安排。设计是整个研究中最关键的一环,是今后工作应遵循的依据。

2.收集资料:应采取措施使能取得准确可靠的原始数据。

3.整理资料:简化数据,使其系统化、条理化,便于进一步分析计算。

4.分析资料:计算有关指标,反映事物的综合特征,阐明事物的内在联系和规律。分析资料包括统计描述和统计推断。

实验设计的基本原则 (考填空题,三个空)

随机化原则、对照的原则、重复的原则。

2选1

参数:参数(paramater)是指总体的统计指标,如总体均数、总体率等。总体参数

是固定的常数。多数情况下,总体参数是不易知道的,但可通过随机抽样抽取有代表性的样

本,用算得的样本统计量估计未知的总体参数。 

统计量:统计量(statistic)是指样本的统计指标,如样本均数、样本率等。样本

统计量可用来估计总体参数。总体参数是固定的常数,统计量是在总体参数附近波动的随机

变量。 

第二章

频数表的制作步骤以及频数分布表的用途(问答题)

频数分布表的编制步骤:

例:某市1982年50名7岁男童的身高(cm)资料如下,试编制频数表。

114.4 117.2 122.7 124.0 114.0 110.8 118.2 116.7 118.9 118.1

123.5 118.3 120.3 116.2 114.7 119.7 114.8 119.6 113.2 120.0

119.8 116.8 119.8 122.5 119.7 120.7 114.3 122.0 117.0 122.5

119.7 124.9 126.1 120.0 124.6 120.0 121.5 114.3 124.1 117.2

120.2 120.8 126.6 121.5 126.1 117.7 124.1 128.3 121.8 118.7

1、找出观察值中的最大值(largest value)、最小值(smallest value),求极差(range)。

极差等于最大值减最小值。本例最大值=128.3,最小值=110.8,则极差=128.3-110.8=17.5(cm )

2、确定分组数和组距(class interval)。

组数的多少是根据例数的多少来确定的,以能够反映出频数分布的特征为原则,一般分10—15组。组距为相邻两组的间隔,组距=极差/组数。本例拟分10组,则组距=17.5/10=1.75≈2,为划记方便,可取稍大或稍小的数(当然本例组距也可取1.5)。

3、确定组段。

第一组段包括要最小值,取较最小值稍小且划分方便的数,本例取"110~"。最后组段包括最大值并写出其上限值。

4、划记。

将各观察值以划"正"字的方法,一笔代表

  • 2
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值