python爬取b站JFla小姐姐视频封面

        昨晚学习英语听力,偶然间“遇到”了JFla翻唱的《Something Just Like This》的视频,看完之后被小姐姐 的声音和侧颜吸引住了,于是我去了万能的b站,搜了一下果然有很多。当时正好在学爬虫,比较菜,想练练手。于是我就蠢了一下,干脆把搜到的所有视频的av号和封面以 及标题都爬下来吧,满足于一下自己的双面需求。因此将实现的想法和过程放出来,大家可以一起讨论。(图片也上传了哟)

        然后就开始爬,先在b站搜索JFla

G:\Learning\html_learn\code\claw_film\bilibili\bilibili_pic\JFla\materials\1.png"

        可以看到我们搜到了很多,大概一共有50页的样子。既然是爬取封面,那就先看一下这个页面的源码,万一链接在里面呢,虽然可能性比较小,但是还是看看吧。

在这里插入图片描述

        好吧,可以看到src="",alt=""是空的,说明封面图片不在这,但是我们能看到,不仅标题在这里,视频的av号也在这里,觉得有可能有用,先标注一下。然后就只能去network里面找了,找来找去没找着......算了,不找了!干脆暴力一点,随便找一个视频点进去,打开network,我就不信找不到你!

在这里插入图片描述

        找到view?aid=****...**文件,打开preview一下,果然,被我找到了,可算发现你了。发现pic链接,就是它了,我们就准备获取它。复制它的adress,发现是 https://api.bilibili.com/x/web-interface/view?aid=9467312 于是我们猜测,每个视频包含我们想要数据的链接都长这样,只是aid即av号不一样而已,再随便打开几个看一下,证实了这个想法。那就好办了,之前不是说网页源码可以获取本页视频av号嘛,那就搞!

        我们根据源码页面的链接构造,改变page属性就可以轻松实现翻页,有多少page也可以爬下来,按照源码往下找找就行了。然后写个循环吧,把所有页面的av号和标题拿下来,存到数据库里面去。爬完以后,就从数据读取av号,完成最终url的拼接,这样我们就得到了所有视频包含数据的url,循环爬取信息,拿到我们想要的封面链接,保存到数据库里面,然后用requests包,写个方法,把图片下载下来就完事了,慢慢的爬,悄悄地,别被发现了。

在这里插入图片描述

        如果有不恰当的地方,希望大家指正!一起努力学习!

github网址:https://github.com/foreversunx/GetbilibiliPic

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值