房价影响因素挖掘

最新推荐文章于 2022-10-10 22:48:13 发布

董师傅

最新推荐文章于 2022-10-10 22:48:13 发布

阅读量1.6k

点赞数 1

本文链接：https://blog.csdn.net/weixin_43235688/article/details/82846178

版权

该博客探讨了上海房价受哪些因素影响，包括房屋售租比、人口密度、路网密度、餐饮价格与距离市中心的距离。通过数据清洗、计算和可视化，发现距离市中心是房价的强相关因素，而道路密度和人口密度则有中等关系，餐饮价格与房价关联性较弱。

摘要由CSDN通过智能技术生成

房价影响因素挖掘

PS:如果各位有疑问的话，可以留下微信，我看到会第一时间加的，以后可以多多交流

1、项目需求

1、数据清洗、整合
2、计算“房屋售租比”，做初步判断投资上海房产是否可通过租房投资
3、上海市人口密度、路网密度、餐饮价格和“房屋每平米均价”是否有关系？
4、按照离市中心距离每10km，分别再次判断人口密度、路网密度、餐饮价格和“房屋每平米均价”的相关程度

2、实现思路

1、数据正常清洗，处理空值等
2、计算单位平方租房价格和单位平凡售房价格，计算售租比
3、通过qgis查看租房、售房、售租比的空间分布情况，再通过散点图查看各个纬度对房价的影响情况
4、提取超过10km的数据，绘制折线图查看各指标对房价的影响情况

3、实现步骤

1.1、导入模块，读取数据

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import os
import warnings
warnings.filterwarnings('ignore') 
# 不发出警告

os.chdir('C:\\Users\\Administrator\\Desktop\\项目资料\\项目10房价影响因素挖掘')
df01 = pd.read_csv('house_rent.csv',engine = 'python')
df02 = pd.read_csv('house_sell.csv',engine = 'python')

1.2、数据清洗，合并数据

df01.dropna(inplace = True)
df02.dropna(inplace = True)
df01['rent_dj'] = df01['price']/df01['area']
df1_rent = df01[['community','rent_dj','lng','lat']].groupby(by = 'community').mean()
df1_sell = df02[['property_name','average_price','lng','lat']].groupby(by = 'property_name').mean()
df1_rent.reset_index(inplace = True)
df1_sell.reset_index(inplace = True)
df1_jg = pd.merge(df1_rent,df1_sell,left_on ='community',right_on='property_name')
df1_jg = df1_jg[[