- 博客(2)
- 收藏
- 关注
原创 Python实战:使用selenium及BeautifulSoup4进行BOOS直聘信息爬取与数据累积【附源码】
本文介绍了如何使用Python的Selenium和BeautifulSoup库,结合pandas进行高效的网页数据爬取、处理和累积存储。通过模拟浏览器操作,我们实现了自动登录、数据抓取和去重,最终将职位信息持续更新到CSV文件中。文章详细阐述了运行环境要求、设计思路、具体实践步骤以及遇到的挑战和解决方案,为读者提供了一个实用的数据爬取与处理的示例。
2024-04-09 11:58:29 1755
原创 Python实战:爬取二手房信息并进行地图可视化【附源码】
通过Python实现了对链家网站南昌市二手房信息的爬取,并利用高德地图API获取房源经纬度,最终通过Folium库在地图上可视化房源位置。项目涵盖网络爬虫、数据清洗、地理编码、数据可视化等技术点,同时引入日志记录和异常处理机制以提高代码的健壮性和用户体验。通过并发编程显著提升了数据爬取效率,而数据处理与可视化技能的应用则使得复杂数据得以简明展示,为房地产数据分析提供了一种有效的解决方案。
2024-04-08 11:24:21 1279 2
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人