数据:分类型数据,数量型数据
一 汇总分类变量的数据
1 频数分布:
定义:频数分布是一种数据表格汇总,表示在几个互补重叠组别中的每一组项目个数
可以使用表格法,把每个类型样本在数据集中出现的次数汇总求和计算后,列入表格中
2 相对频数分布和百分数频数分布
定义:组的相对频数 = 组的频数 / n
相对频数分布是每一组相对频数数据的表格汇总
百分数频数分布是每一组百分数频数数据的表格汇总
# 频数分布、相对频数分布、百分数频数分布
def work1():
data_arr = ['coke', 'milk', 'milk', 'cake', 'apple', 'orange', 'apple', 'apple',
'coke', 'coke', 'milk', 'cake', 'cake', 'orange', 'orange', 'orange',
'milk', 'milk', 'milk', 'coke', 'coke', 'coke', 'apple', 'apple',]
keep = np.unique(data_arr, return_counts=True, return_i