一、项目背景
[蜜柑计划 - Mikan Project] :新一代的动漫下载站。是一个专门为喜欢动漫的小伙伴们打造的动漫视频在线播放网站,为大家第一时间分享最新动漫资源,每日精选最优质的动漫推荐。
二、项目目标
实现获取动漫种子链接,并下载保存在文档。
三、涉及的库和网站
1、网址如下:
https://mikanani.me/Home/Classic/{}
2、涉及的库:requests、lxml、fake_useragent
3、软件:PyCharm
四、项目分析
首先需要解决如何对下一页的网址进行请求的问题。可以点击下一页的按钮,观察到网站的变化分别如下所示:
https://mikanani.me/Home/Classic/1
https://mikanani.me/Home/Classic/2
https://mikanani.me/Home/Classic/3
点击下一页时,每增加一页Classic/()自增加1,用{}代替变换的变量,再用for循环遍历这网址,实现多个网址请求。
五、反爬措施
1、获取正常的 http请求头,并在requests请求时设置这些常规的http请求头。
2、使用 fake_useragent ,产生随机的UserAgent进行访问。