导读:数据科学入门:集中趋势度量——均值、中值和众数。
作者:保罗·戴特尔(Paul Deitel)、哈维·戴特尔(Harvey Deitel)
来源:大数据DT(ID:hzdashuju)
本文我们将讨论如何使用描述性统计数据进行数据分析,包括:
均值——一组值的平均值;
中值——当所有值按顺序排列时的中间值;
众数——最常出现的值。
以上这些都是集中趋势度量,每种都会产生一个值来表示一组值中的“中心”值,或者说,在某种意义上是这组值中的典型值。
我们来计算一个整数列表的均值、中值和众数。下面的代码段创建一个名为grades的列表,然后使用内置的sum和len函数来“手动”计算平均值——sum计算grade的总和(397),len计算grade的个数(5):
grades = [85, 93, 45, 89, 85]
sum(grades) / len(grades)