~~~接上一篇--数据处理~~~
在对数据进行处理后,需要对数据进行分析
1. 房型:
a. 首先对房型分别进行分析:
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
%matplotlib inline
%pylab inline
pylab.rcParams['figure.figsize'] = (15, 10) # 调整图片大小
fig, axes = plt.subplots(nrows=2,ncols=2)
ax1, ax2, ax3, ax4 = axes.flatten()
for ax, col_name in zip(axes.flatten(), df_room.columns):
temp = df_room[col_name].value_counts().reset_index().rename(columns = {"index":col_name+"-count"})
sns.barplot(x=col_name+"-count",y=col_name,data=temp,ax=ax)
a. 由房型分组统计可知:
2室最多,其次分别为1室和3室,当房间数大于2室时,随着房间数的增加,二手房交易逐渐减少,包含有5个及以上房间的二手房交易非常少(<2000)。
1厅最多,其次分别为2厅和没有厅的房型,当厅数大于2厅时,随着厅数的增加,二手房交易逐渐减少,包含有3个及以上厅的二手房交易非常少(<2000)。
1厨最多,其次为没有厨房的房型,当厨房数大于1厨时,随着厨数的增加,二手房交易逐渐减少,没有厨房和有2个及以上厨房的二手房交易非常少(<2000)。
1卫最多,其次分别为2卫和3卫,当卫生间数大于3厨时,随着卫生间数的增加,二手房交易逐渐减少,没有卫生间和有3个及以上卫生间的二手房交易