- 博客(3)
- 收藏
- 关注
原创 (三)爬取新房销售信息——位置坐标转换+地图标点可视化篇
在上一次用pandas做数据分析、matplotlib实现可视化的任务中,主要对于“价格”信息做了简单的处理,了解到赣州地区房价水平的范围,各区县的房价水平,根据自己的预算大致可以确定一些楼盘目标作为备选。然而,买房要考虑的不仅仅是价格,房子所处地段及位置背后包含的丰富信息更为重要,好的地段也决定了房子升值空间。那怎么分析像地址这种地理信息呢?我习惯使用高德地图搜索一下,很方便地了解楼盘及其周边...
2020-03-19 20:42:10 1236
原创 (二)爬取新房销售信息——数据分析+可视化篇
pandas & matplotlib 用于数据分析和可视化上一个任务通过requests、BeautifulSoup4两个功能强大、用法简洁的函数库已经获取到了楼盘名、地址和价格这些新房信息,并且保存为csv格式文件,csv文件可以用excel打开并进行编辑。当然爬取数据只是第一步,“白嫖”网站辛苦整理的数据毕竟不太合适,所以这些数据如何产生价值呢?设置一个场景:当你想要在一座...
2020-03-17 19:37:11 2046
原创 (一)爬取新房销售信息——爬虫篇(requests、bs4(BeautifulSoup4)、csv库)
2020年3月14日任务介绍此次爬虫任务为“爬取新房销售信息”,获取楼盘名、地址、价格的简单信息,我选取的城市是“赣州”,尝试过安居客、房天下等几个房屋信息网站,安居客有反爬措施,由于是新手比较怂就果断避开了,从信息量来看房天下-赣州符合我的需要,且对新手比较友好,所以选择房天下为对象进行爬虫。由于信息均为文本,选择保存为csv格式,便于后续读取和分析。环境准备我用的是Anacond...
2020-03-14 17:18:12 1633 3
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人