数据项目总结 -- 深圳租房数据分析

最新推荐文章于 2022-11-30 15:37:47 发布

Rich Dad

最新推荐文章于 2022-11-30 15:37:47 发布

阅读量1k

点赞数 1

分类专栏： Anaconda Jupyter Notebook 文章标签： python 数据分析可视化

I love 段奥娟

本文链接：https://blog.csdn.net/qq_44745905/article/details/109566658

版权

本文作者通过爬虫获取深圳租房数据，使用Python进行数据清洗和处理，利用数据可视化库揭示租房市场趋势。分析发现，福田区房源最多，房东偏好整租，南山区和关内房价偏高，而朝南、朝南北、朝北的房子最受欢迎。

摘要由CSDN通过智能技术生成

时间煮雨
@R星校长

最近在一个相对比较知名的房源网站上爬取了一份深圳各个区的租房信息，总共获得了2000*12的数据集。
在获得了相应的数据之后，利用Python的第三方库pandas进行前期的数据清洗工作，最后可视化库plotly绘制了相应的可视化图形进行了展示，并且得到了一些租房的结论，供租房者参考，自己对深圳的租房也有了一定的认识。

爬虫数据获取
数据清洗处理
数据可视化展示
得到结论

在这里插入图片描述
一、数据爬取
本文中获得的数据是自己通过爬虫从网上获取的。这个房源没有太多的反爬虫措施，所以爬取的过程没有遇到困难，比较顺利。数据集和代码已打包，提取码：56kj。提取码：q8ni 以下代码供参考。

1.1 导入各种库

首先，我们需要导入各种库，具体如下：

在这里插入图片描述
1.2 代码
下面👇是整个爬虫的源代码，主要是包含了以下几方面的信息：

在爬虫过程中需要设置请求头，伪装成浏览器的操作
如何利用Xpath进行数据解析
如何将Python中的字典类型数据转成json类型数据，主要是掌握json包的使用
获取到数据后，使用xlwt进行数据的保存

在这里插入图片描述
二、数据处理

2.1 数据的读取

上面的数据保存成了excel数据，我们直接通过pandas的read_excel来进行数据的读取

最低0.47元/天解锁文章

关注

1
点赞
踩
20

收藏

觉得还不错? 一键收藏
0
评论
数据项目总结 -- 深圳租房数据分析

@R星校长第3关：Python数据库编程之插入数据最近在一个相对比较知名的房源网站上爬取了一份深圳各个区的租房信息，总共获得了2000*12的数据集。在获得了相应的数据之后，利用Python的第三方库pandas进行前期的数据清洗工作，最后可视化库plotly绘制了相应的可视化图形进行了展示，并且得到了一些租房的结论，供租房者参考，自己对深圳的租房也有了一定的认识。爬虫数据获取数据清洗处理数据可视化展示得到结论一、数据爬取本文中获得的数据是自己通过爬虫从网上获取的。这个房源没有太多.
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。