file_data.head()
file_data["面积(㎡)"].values[0][:-2]
data_new=np.array([])
data_area = file_data["面积(㎡)"].values
for i in data_area:
data_new = np.append(data_new,np.array(i[:-2]))
data_new
4.2、户型表达方式替换
house_data=file_data["户型"]
temp_list =[]for i in house_data:
new_info = i.replace("房间","室")
temp_list.append(new_info)
file_data.loc[:,'户型']= temp_list
file_data
house_data = file_data["户型"]
house_data.head()defall_house(arr):
key = np.unique(arr)
result ={}for k in key:
mask =(arr == k)
arr_new = arr[mask]
v = arr_new.size
result[k]= v
return result
house_info = all_house(house_data)
8、去掉统计数量较小的值
house_data=dict((key,value)for key,value in house_info.items()if value >50)# show_house = pd.DataFrame({"户型":[x for x in house_data.keys()],# "数量":[x for x in house_data.values()]})
show_houses = pd.DataFrame({"户型":[x for x in house_data.keys()],"数量":[x for x in house_data.values()]})
show_houses
文章目录1、导包2、查看数据3、重复值和空值处理4、数据转换类型4.1、面积数据类型转换4.2、户型表达方式替换5、房源数量和位置分布分析7、户型数量基本分析8、去掉统计数量较小的值9、图形展示房屋类型10、平均租金分析11、图形可视化12、面积基本分析1、导包import pandas as pdimport numpy as npimport matplotlib.pyplot as plt2、查看数据file_data= pd.read_csv("D:\\data\\seaborn-da