Python爬虫实战系列(一)-request爬取网站资源
python爬虫实战系列第一期
初步了解爬虫基本原理,现在开始尝试写第一个比较综合的案例,利用request库,本系列下一期会使用其他方法进行爬取,还会写一些js逆向的方法
具体百度 我称之为一个强大的库
点开一个视频检索发现是这样,目录为网站基本域名+datail/1,同理其他视频为baseurl + detail / n…
F12里面也可以看到href,拼接即可使用。
切换目录发现URL+ page/2
点开一个看里面内容,有封面,电影名字,评分,时间等等,我们爬取他们,这不是阿瑟他爸吗,哇一个小
原创
2022-06-08 12:20:43 ·
432 阅读 ·
0 评论