Python北京二手房房价数据集分析

该博客通过对链家2017年的北京二手房数据进行分析,探讨了房价与多个因素的关系,包括区域、房屋大小、装修状况和有无电梯等。在数据预处理中,发现了异常值并进行了移除。结果显示,靠近市中心的区域、房屋面积大、精装修及有电梯的房源价格通常较高。同时,房屋布局、装修类型和时间也对房价有显著影响。
摘要由CSDN通过智能技术生成

本次分析的数据集来源为链家2017年房源信息。
在数据分析的过程中,我们也可以先去理解数据,再提出问题,在探索数据的过程当中,我们往往会发现很多有趣的事情~
1.提出问题
北京二手房的房价跟哪些因素有关呢?
2.读取数据,理解数据
导入数据分析相关工具包
%matplotlib 为魔法函数,之后的数据可视化过程中,有了它我们就不需要每次都使用plt.show()来显示图表了。
在这里插入图片描述

用pandas中的read_csv()方法读取格式为CSV的数据集,并用Head()方法默认查看前5行。
在这里插入图片描述
数据类型分析:

1.数值型:Floor,Price,Size,Year

2.字符串类型:Direction,District,Layout,Region,Renovation,Elevato

查看数据类型以及是否存在缺失值
在这里插入图片描述
在这里插入图片描述

评论 49
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值