IT宅男利用Python网络爬虫获取Mikan动漫资源(属于宅男的快乐)

本文介绍了一个使用Python爬虫从Mikan Project网站获取动漫种子的项目,详细阐述了如何处理翻页、设置请求头、解析HTML以及避免反爬策略。通过该项目,读者可以学习到字符串拼接、类型转换以及应对反爬技巧。
摘要由CSDN通过智能技术生成

一、项目背景

[蜜柑计划 - Mikan Project] :新一代的动漫下载站。是一个专门为喜欢动漫的小伙伴们打造的动漫视频在线播放网站,为大家第一时间分享最新动漫资源,每日精选最优质的动漫推荐。

二、项目目标

实现获取动漫种子链接,并下载保存在文档。

三、涉及的库和网站

1、网址如下:

https://mikanani.me/Home/Classic/{}

2、涉及的库:requests、lxml、fake_useragent

3、软件:PyCharm

四、项目分析

首先需要解决如何对下一页的网址进行请求的问题。可以点击下一页的按钮,观察到网站的变化分别如下所示:

https://mikanani.me/Home/Classic/1

https://mikanani.me/Home/Classic/2

https://mikanani.me/Home/Classic/3

点击下一页时,每增加一页Classic/()自增加1,用{}代替变换的变量,再用for循环遍历这网址,实现多个网址请求。

五、反爬措施

1、获取正常的 http请求头,并在requests请求时设置这些常规的http请求头。

2、使用 fake_useragent ,产生随机的UserAgent进行访问。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值