第一节 绪 论
一、预防医学的概述
1.以环境-人群-健康为模式,以个体和确定的群体为主要对象。
2.三级预防策略:第一级预防:疾病的因子---病因预防、根本性预防
第二级预防:三早---早发现,早诊断,早治疗
第三级预防:已患病者,促康复
3、任何疾病都应强调第一级预防。
第二节 医学统计学方法
一、基本概念和基本步骤
(一)统计学中的几个基本概念
1.同质:除实验因素外,影响被研究指标的非实验因素相同。
变异:同质基础上被研究个体之间的差异。
总体:同质的个体所构成的全体。
样体:从总体中抽取部分个体所组成。
误差:观测值和真实值之间的差别。主要有
①系统误差:仪器或标准不符等造成,可影响原始资料准确性,必须克服。
②随机测量误差:各种偶然因素造成同一对象多次结果不一致,应采取措施尽量控制在一定范围。
③抽样误差:总体抽样得到某变量值的统计量和总体参数之间的差别。
概率:描述随机事件(如发病)发生可能性大小的度量,常用P表示。P值0-1,P≤0.05或P<0.01---小概率事件。
P≤0.05为事物差别有统计学意义;
P<0.01为事物差别有高度统计学意义。
变量:观察对象的特征或指标;测量的结果为变量值。
(二)统计工作的基本步骤:设计--基础、最关键;收集、整理、分析资料。
二、数值变量数据的统计描述
频数表:组数通常选择8-15之间;组距=(最大值-最小值)/组数;必须包含全部数据,一个数据只能归属某一组,实际组段在每组中只包含下限。
(一)集中趋势指标
1.算术均数:μ---总体均数。样本均数--χ,正态或近似正态分布。
2.几何均数:G表示。同一组观察值的几何均数总是小于它的算数均数。
3.中位数:M;奇数---中间;偶数---中间两个数的平均值。
4.百分位数:Px;从小到大分成100等分,分割界限上的数值就是百分位数。
(二)离散趋势指标 离散二距方标差,正态标准差最佳,偏态四分数最佳
1.极差/全距:R---最大值和最小值之差。越大说明离散程度越大。
2.四分位数间距:Q=P75-P25。越大说明离散程度越大。
3.方差:σ2--总体方差,σ2=Σ(X-μ)2/N。S2--样本方差,S2=Σ(X-x)2/(n-1),越大说明变异程度越大;自由度df=n-1,n为样本例数。
4.标准差:σ,S。描述离散趋势最常用指标。
5.变异系数: CV ,常用于比较度量单位不同或均数相差较大的两组或多组观察值的变异程度。
(三)正态分布的特点、面积分布规律
1、①以均数μ为中心,左右对称;②有两个参数即均数μ和标准差σ,μ是位置(平均水平)参数,σ一定时,μ增大则曲线沿横轴向右移动,σ是变异参数,σ越大则曲线形态越“矮胖”,表示数据分布越分散;③标准正态分布:N(μ=0,σ=1)。
2、正态分布的面积分布规律:越远离中心,曲线越接近X轴,曲线下面积越小。±1,68.3%;±1.96,95%;±2.58,99%。
三、数值变量数据的统计推断
1.抽样误差:样本均数x≠总体均数μ。不可避免。
2.标准误:标准误与样本含量的平方根成反比。①衡量抽样误差大小,标准误越小则样本均数与总体均数越接近,样本均数可信度越高;②估计总体均数的可信区间。
3.假设检验的基本步骤:也叫显著性检验,比较总体参数之间有无差别。
1)建立检验假设和设定检验水准:
目的 | H0(无效假设) | H1(备择假设) | |
双侧 | 是否μ1≠μ2 | μ1=μ2 | μ1≠μ2 |
单侧 | 是否μ1>μ2 | μ1=μ2 | μ1>μ2 |
是否μ1<μ2 | μ1=μ2 | μ1<μ2 |
α(检验水准)=0.05或α=0.Ol
2)计算统计量:u值或t值
3)确定P值和判断结果。
如双侧t检验,∣t∣≥tα/2,v,则若P≤α,拒绝H0接受H1;若P>α则不能拒绝H0。通常P>0.05称差异不显著,0.01<P≤0.05为差异显著,P≤0.01为差异非常显著。
4.u检验和t检验:适用于两个样本均数的比较,多个则采用方差分析。
u检验(总体标准差已知)---大样本n>50,正态分布。
t检验(总体标准差已知)---小样本n<50,正态分布。
u/t=(X1-X2)/Sx1-x2。
四、分类变量资料的统计描述
1.率:某现象发生的频率或强度。总体率:π;样本率:P。
2.构成比:某事物内部各构成部分所占的比重。百分数表示。
3.相对比:描述两者对比水平。
五、分类变量资料的统计推断
1、总体率(π)95%可信区间:P±1.96SP;总体率(π)99%可信区间:P±2.58SP。
2、u检验和X2检验:X2检验:推断两个及两个以上率有无差别。
比较均数用u、t,>50要选u,率的检验用卡方,偏态分布也可以
六、直线相关和统计图表
1、直线相关:表示两事物的相关关系,多用散点图。
①相关系数:r,没有单位,数值为-1≤r≤1,为正则正相关;r=0为零相关;绝对值为1称完全相关;r的绝对值越接近1,相关越密切。正负取决与Lxy。
②直线回归分析:X自变量,Y因变量,Y=a+bX,其中b为回归系数即直线的斜率,表示X每增减一个单位,Y平均改变b个单位;a为直线在Y轴上的截距,a>0则直线与Y轴交点在原点上方,=0过原点。
2、直条图:①资料性质:适用于彼此独立的资料。②分析目的:用等宽直条的高度和长短来表示各统计量的大小,进行比较。
圆形图:①资料性质:构成比。②分析目的:用圆的扇形面积表达内部构成图。
线图看变化,直方看分布,直条比大小,散点回归数,百分直条和圆形图表示构成比。
七、秩和检验、Logistic回归分析
1、秩和检验:目的是推断配对资料的差值是否来自中位数为0的总体。若差值不满足正态分布条件,宜用秩和检验。
2、Logistic回归分析:研究分类变量与多个因素之间的相互关系,进行疾病的病因分析常选用。