自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(2)
  • 收藏
  • 关注

原创 Python实战:使用selenium及BeautifulSoup4进行BOOS直聘信息爬取与数据累积【附源码】

本文介绍了如何使用Python的Selenium和BeautifulSoup库,结合pandas进行高效的网页数据爬取、处理和累积存储。通过模拟浏览器操作,我们实现了自动登录、数据抓取和去重,最终将职位信息持续更新到CSV文件中。文章详细阐述了运行环境要求、设计思路、具体实践步骤以及遇到的挑战和解决方案,为读者提供了一个实用的数据爬取与处理的示例。

2024-04-09 11:58:29 1755

原创 Python实战:爬取二手房信息并进行地图可视化【附源码】

通过Python实现了对链家网站南昌市二手房信息的爬取,并利用高德地图API获取房源经纬度,最终通过Folium库在地图上可视化房源位置。项目涵盖网络爬虫、数据清洗、地理编码、数据可视化等技术点,同时引入日志记录和异常处理机制以提高代码的健壮性和用户体验。通过并发编程显著提升了数据爬取效率,而数据处理与可视化技能的应用则使得复杂数据得以简明展示,为房地产数据分析提供了一种有效的解决方案。

2024-04-08 11:24:21 1279 2

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除