1. bar的作用
bar
是用不贴边等宽矩形来比较已给定类别在数量上的差异,矩形高表示数量大小。
>>> num_df = pd.DataFrame([1,1,1, 2, 2, 4,4,4,4,4,4], columns=['num'])
>>> num_df
num
0 1
1 1
2 1
3 2
4 2
5 4
6 4
7 4
8 4
9 4
10 4
>>> num_df.plot.bar()
2. hist的作用
hist
是对一列数进行排序并分组(桶),对比各个桶内元素数量的多少。hist
是一种bar
。
>>> num_df = pd.DataFrame([1,1,4,4,4,4,4,4,1, 2, 2], columns=['num'])
>>> num_df
num
0 1
1 1
2 4
3 4
4 4
5 4
6 4
7 4
8 1
9 2
10 2
>>> num_df.plot.hist(bins=3)
3. 异同
请思考区别是什么?
- 两者都是条状图,可以展示数据分布。
- bar按照用户给定的某个维度各个子元素的数量分布。hist按照分位数(quantile)方法将一系列样本分区间计数,展示其分布。