import pandas as pd
import matplotlib.pyplot as plt
df = pd.read_excel('house_data.xlsx')
df.head()
| Unnamed: 0 | 均价 | 小区 | 地段 | 具体位置 |
---|
0 | 0 | 49000 | 零陵公寓 | 斜土路 | 零陵路111弄 |
---|
1 | 1 | 64738 | 锦馨苑 | 田林 | 古井路38弄 |
---|
2 | 2 | 59728 | 金牛苑 | 上海南站 | 石龙路731弄 |
---|
3 | 3 | 42000 | 爱邦大厦 | 徐家汇 | 零陵路585号 |
---|
4 | 4 | 42000 | 南林公寓 | 田林 | 小闸镇街123号 |
---|
df['地段'].value_counts()
龙华 436
徐家汇 380
田林 357
康健 350
衡山路 252
长桥 221
华泾 178
建国西路 162
上海南站 136
斜土路 128
徐汇滨江 126
华东理工 103
植物园 89
漕河泾 58
万体馆 15
虹梅路 9
Name: 地段, dtype: int64
import matplotlib.pyplot as plt
import matplotlib
%matplotlib inline
plt.rcParams['font.sans-serif'] = 'SimHei'
plt.rcParams['axes.unicode_minus'] = False
df['地段'].value_counts().plot(kind='bar', legend=True,title='上海徐汇区二手房在售数量分布区域')
<matplotlib.axes._subplots.AxesSubplot at 0x2041e186780>
import matplotlib.pyplot as plt
import matplotlib
%matplotlib inline
plt.rcParams['font.sans-serif'] = 'SimHei'
plt.rcParams['axes.unicode_minus'] = False
df['地段'].value_counts().plot(kind='barh', legend=True,title='上海徐汇区二手房在售数量分布区域')
<matplotlib.axes._subplots.AxesSubplot at 0x2041e5a3b00>