直方图主要反映一维数据分布情况
import pandas as pd
import matplotlib.pyplot as plt
df = pd.read_excel(r'house_data.xlsx')
df.head()
Unnamed: 0 | 均价 | 小区 | 地段 | 具体位置 | |
---|---|---|---|---|---|
0 | 0 | 49000 | 零陵公寓 | 斜土路 | 零陵路111弄 |
1 | 1 | 64738 | 锦馨苑 | 田林 | 古井路38弄 |
2 | 2 | 59728 | 金牛苑 | 上海南站 | 石龙路731弄 |
3 | 3 | 42000 | 爱邦大厦 | 徐家汇 | 零陵路585号 |
4 | 4 | 42000 | 南林公寓 | 田林 | 小闸镇街123号 |
import matplotlib.pyplot as plt
import matplotlib
%matplotlib inline
#解决中文和负号不正常显示问题
plt.rcParams['font.sans-serif'] = 'SimHei'
plt.rcParams['axes.unicode_minus'] = False
#绘制条形图
df['均价'].plot(kind='hist',color='violet',legend=True,edgecolor = 'b',title='上海徐汇区二手房均价分布直方图')
plt.xlabel('均价(元)')
plt.ylabel('计数')
Text(0,0.5,'计数')
#绘制累积分布直方图
alpha=0.4 #透明度
df['均价'].plot(kind='hist',cumulative = True,legend=True,edgecolor = 'k',alpha=0.4,title='上海徐汇区二手房均价累积分布直方图')
plt.xlabel('均价(元)')
plt.ylabel('计数')
Text(0,0.5,'计数')