链接:https://pan.baidu.com/s/1N17ZMhy5O-pvShc_r2sjhA
提取码:9n1g
# -*- coding: utf-8 -*-
#1.概念:直方图(Histogram),是用一系列等宽不等高的长方形来绘制,宽度表示数据范围的间隔,高度
#表示在给定间隔内数据出现的频数,变化的高度形态表示数据的分布情况。
#直方图的作用主要有两个:
#a.显示各组频数分布的情况,让我们可以对数据分布情况有一个整体的认识
#b.对比各组之间频数的差异
#2.直方图的绘图函数:hist(x,color,bins,cumulative=False)
#参数说明:
#x:需要进行绘制的向量
#color:直方图的填充颜色
#bins:设置直方图的分组个数
#cumulative:设置是否累计计数,默认是False
#该函数先把x进行从小到大的排序,然后按照bins指定的分组个数对x进行分组。
import pandas
import matplotlib
from matplotlib import pyplot as plt
font = {
'family':'SimHei'
}
matplotlib.rc('font',**font)
data = pandas.read_csv("D:/workspaces/python/pythonStudy/36.csv")
mainColor = (42/256,87/256,141/256,1)
plt.hist(data['购买用户数'],color=mainColor)
plt.show()
#可以看到,绘制出来的直方图默认有10个分组,并且是中间高两边低,是基本符合正态分布的
#将分组设置为20个:
plt.hist(data['购买用户数'],bins=20,color=mainColor)
plt.show()
#进行累计计数:(也就是后面的长方形的高度是大于等于前面的长方形高度的)
plt.hist(
data['购买用户数'],bins=20,
cumulative=True,color=mainColor
)
plt.show()
图1:
图2:
图3: