数据分类概述
按照所采用的计量尺度的不同,可以将统计数据分为分类数据、顺序数据和数值型数据。
分类数据和顺序数据说明的是事物的品质特征,通常是用文字来表述的,其结果均表现为类别,因而也可统称为定性数据或品质数据;数值型数据说明的是现象的数量特征,通常是用数值来表现的,因此也可称为定量数据或数量数据。
分类数据(categorical data)是只能归于某一类别的非数字型数据,它是对事物进行分类的结果,数据表现为类别,是用文字来表述的。
顺序数据(rank data)是只能归于某一有序类别的非数字型数据。顺序数据虽然是类别,但这些类别是有序的。
数值型数据(metric data)是按数字尺度测量的观察值,其结果表现为具体的数值。现实中所处理的大多数是数值型数据。
数据类型与主要图示方法
代码实现
- 条形图
import matplotlib.pyplot as plt
num_list = [1.5,0.6,7.8,6]
plt.bar(range(len(num_list)), num_list)
plt.show()
- 饼图
import matplotlib.pyplot as plt
labels = ['A', 'B', 'C', 'D', 'others']
share = [0.45, 0.25, 0.15, 0.05, 0.10]
explode = [0, 0.1, 0, 0, 0]
plt.pie(share, explode = explode,
labels = labels, autopct = '%3.1f%%',
startangle = 180, shadow = True,
colors = ['c', 'r', 'gray', 'g', 'y'])
plt.title('2017 Market Share')
plt.show()
- 直方图
from matplotlib import pyplot as plt
from matplotlib import font_manager
a = [131, 98, 125, 131, 124, 139, 131, 117, 128, 108, 135, 138, 131, 102, 107, 114, 119