安居客广州二手房定价分析

最新推荐文章于 2020-12-12 03:38:39 发布

VIP文章 WilliamZ_

最新推荐文章于 2020-12-12 03:38:39 发布

阅读量653

点赞数

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/williamz_/article/details/100146536

版权

数据

数据爬虫所得，为安居客广州二手房信息，由于数据量不大，所有分析只是针对这个二手房网站上发布的二手房信息所进行的一些简单分析，不能避免偶然性。本人对房价分析亦没什么了解，以下均只是当作数据分析的练习。下面展示一部分目标文本文件内的数据：
在这里插入图片描述

一共有2941条记录。

清洗数据

jupyter notebook 环境下创建python3文件，先用pandas read_csv函数读入文本文件所有内容，默认逗号为分隔符，指定各个字段的名称：
names=[‘小区’,‘户型’,‘房屋单价（元/m²）’,‘位置’,‘面积（平方米）’,‘参考首付（万）’,‘建造年代（年）’,‘朝向’,‘房屋类型’,‘所在楼层’,‘装修程度’,‘产权(年)’,‘电梯’,‘房本年限（年）’,‘产权性质’,‘唯一住房’,‘一手房源’]，一共17个字段。

在这里插入图片描述
显示读入的数据的数据框前五行：

我们目的只需要每条记录中每个字段冒号后面的内容，以及对于位置字段，我们打算将这个字段分成三个字段，分别为：区域，街道/周边城市，街号，所在楼层字段分成表示高、中、低的所在楼层字段以及表示楼盘共有多少层的层数字段。除了户型字段，其他含有数字的字段均只取数字部分，经过一些列操作，代码如下
在这里插入图片描述

经过一系列清洗后，显示数据框前五行：

最低0.47元/天解锁文章

关注

0
点赞
踩
7

收藏

觉得还不错? 一键收藏
0
评论
安居客广州二手房定价分析

数据数据为爬虫所得，下面展示一部分目标文本文件内的数据：一共有2941条记录。清洗数据jupyter notebook 环境下创建python3文件，先用pandas read_csv读入文本文件所有内容，默认逗号为分隔符，指定各个字段的名称：names=[‘小区’,‘户型’,‘房屋单价（元/m²）’,‘位置’,‘面积（平方米）’,‘参考首付（万）’,‘建造年代（年）’,‘朝向’,‘...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。