数据的离散程度,也是衡量数据分布的一个方面,它主要指各个变量和中心位置是相距多远的一个度量。
也就是说,数据的离散程度越大,那么集中趋势的这个指标的代表性就越差。
根据不同的数据类型,离散程度主要有以下几个测度值:
异众比率
异众比率,适用于类别型数据。它指的是非众数组的频数占总的频数的比例。计算公式如下:
从公式中不难看出,异众比率越大,说明众数的代表性越差,反之亦然。
四分位差
四分位差又叫内距,它指的是上四分位数和下四分位数的差,用公式可以表示为:
数据的离散程度,也是衡量数据分布的一个方面,它主要指各个变量和中心位置是相距多远的一个度量。
也就是说,数据的离散程度越大,那么集中趋势的这个指标的代表性就越差。
根据不同的数据类型,离散程度主要有以下几个测度值:
异众比率,适用于类别型数据。它指的是非众数组的频数占总的频数的比例。计算公式如下:
从公式中不难看出,异众比率越大,说明众数的代表性越差,反之亦然。
四分位差又叫内距,它指的是上四分位数和下四分位数的差,用公式可以表示为: