- 博客(4)
- 收藏
- 关注
原创 动态爬取网站https://report.amap.com/detail.do?city=110000中武汉的交通数据
1、爬取数据区域拥堵排名、商圈拥堵排名、行政区划排名;2、爬虫程序包括网页的爬取、数据的解析和数据的存储;3、存储方式采用MySQL数据库。
2023-11-01 17:47:36
504
1
原创 Python爬取豆瓣电影“一周口碑排行榜”
利用requests库访问https://movie.douban.com/网站。检查是否出现乱码问题,如有请解决。利用正则表达式提取其中的“一周口碑榜”中的电影列表信息并打印输出。
2023-10-20 15:55:02
158
原创 Python爬取请求去哪网品质一日游中的门票信息
请求去哪网品质一日游中的门票信息,链接为:http://piao.qunar.com/daytrip/list.htm,请求前5页数据。在每次获得的html中利用xpath提取①一日游门票标题、②出发地、③已售数量、④用户评分、⑤景点图片链接,†价格。将结果保存到csv文件中。②反反爬的策略添加头部信息包括user-agent和cookies。①利用requests库发起带参数的get请求,多次发起请求。⑤以追加的方式将数据写入csv文件)④正则表达式精细化提取数据。(
2023-10-20 15:49:00
869
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人