房价影响因素挖掘
PS:如果各位有疑问的话,可以留下微信,我看到会第一时间加的,以后可以多多交流
1、项目需求
1、数据清洗、整合
2、计算“房屋售租比”,做初步判断投资上海房产是否可通过租房投资
3、上海市人口密度、路网密度、餐饮价格和“房屋每平米均价”是否有关系?
4、按照离市中心距离每10km,分别再次判断人口密度、路网密度、餐饮价格和“房屋每平米均价”的相关程度
2、实现思路
1、数据正常清洗,处理空值等
2、计算单位平方租房价格和单位平凡售房价格,计算售租比
3、通过qgis查看租房、售房、售租比的空间分布情况,再通过散点图查看各个纬度对房价的影响情况
4、提取超过10km的数据,绘制折线图查看各指标对房价的影响情况
3、实现步骤
1.1、导入模块,读取数据
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import os
import warnings
warnings.filterwarnings('ignore')
# 不发出警告
os.chdir('C:\\Users\\Administrator\\Desktop\\项目资料\\项目10房价影响因素挖掘')
df01 = pd.read_csv('house_rent.csv',engine = 'python')
df02 = pd.read_csv('house_sell.csv',engine = 'python')
1.2、数据清洗,合并数据
df01.dropna(inplace = True)
df02.dropna(inplace = True)
df01['rent_dj'] = df01['price']/df01['area']
df1_rent = df01[['community','rent_dj','lng','lat']].groupby(by = 'community').mean()
df1_sell = df02[['property_name','average_price','lng','lat']].groupby(by = 'property_name').mean()
df1_rent.reset_index(inplace = True)
df1_sell.reset_index(inplace = True)
df1_jg = pd.merge(df1_rent,df1_sell,left_on ='community',right_on='property_name')
df1_jg = df1_jg[[