统计分析中对资料类型的识别非常重要,决定了统计分析方法的选择,因为不同类型的资料要用不同的统计方法去分析。资料类型分为计量资料、计数资料和等级资料。
1
计量资料的每个研究对象的变量值为一个数值,表现出有量的大小。其可以是离散型变量资料,离散型变量只能取整数值,如一年中的手术患者数、新生儿数;连续型变量可以取实数轴上的任何数值,“连续”是指该变量可以在实数轴上连续变动,如身高体重骨密度等。
2
计数资料研究对象的变量值为互不相容的属性(类别),因此也叫定性变量资料,其包括二分类计数资料和无序多分类计数资料,二分类的计数资料如性别(男或女),无序多分类资料,如血型(O型、A型、B型、AB型)资料。
3
等级资料研究对象的变量值为互不相容的类别之一,但与计数资料不同的是,这些类别之间有程度的递进或递减关系。如癌症分期(早、中、晚);药物疗效(治愈、好转、无效、死亡)等。
4
正态分布
通常统计学上我们会接触到几种分布,最常用到的就是t分布、F分布、χ2分布(卡方分布)。在这之前,我觉得还是有必要了解点正态分布和统计学史。我们都知道,在统计学研究或者遇到的实际问题中,我们真正得到的是散乱的数据,并且没有一个单个数据是确切的,但所有这些数据可以对真实值进行近似的估计。那么散布数据(统计量)所表现出来的数学规律模型就叫做分布,分布的统计模型能够更加真实地描述随机的数学性质,能够更加真实准确地用于推断结果。
正态分布是由德国数学家高斯提