北京二手房价预测(数据分析)

本文是一个使用Python进行初级数据分析的项目,旨在预测北京二手房价格。数据来源于链家,涉及数据清洗、处理、可视化和初步预测。分析了Id、Region、Size、Layout、Renovation、Elevator、Year和Floor等特征,揭示了各区域的房价差异、房间数量、装修状况、电梯影响、建造年份和楼层对房价的影响。
摘要由CSDN通过智能技术生成

分析目的:简单地介绍一个数据分析的初级项目,熟悉使用Python进行简单的数据分析的初级过程。
数据源:来及网络链接的链家全网北京二手房数据,读者可以从百度云盘中复制链接和提取码获取,进行动手实践。(最好使用python 3 完成此项目)
链接:https://pan.baidu.com/s/18R24WTkZIOFH_qvaWjixOw
提取码:61bp
一、数据初步认识:
需要导入要使用的机器学习包Sklearn和科学计算包Numpy,Pandas,可视化Matplotlib,Seaborn。
①初步查看数据
在这里插入图片描述
在这里插入图片描述
②查看缺失值,异常值和大概的数据统计进行合理分析:
describe可以包含平均数,标准差,中位数,最小值,最大值,25%分位数,75%分位数的数据;图一可以看出Elevator 存在大量的缺失数据,15440<23677;图二可以看出min(Size)=2,max(fllor)=57,这些数据不太符合一般房屋状况就应该注意了:
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
二、数据处理
Id 特征虽然在数据列表中,但是并没有实际意义,直接将其移除新增加一

评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值