尝试了破解bilibili滑动验证码达到自动登录的效果之后,就顺带做了下其中的视频信息的爬虫。
一,使用selenium登陆bilibili,保存的Cookie的信息到本地(网上有很多,这里就不细说了,代码文末有)
二,选择一个视频分区,爬取其中的视频信息
这里我拿音乐区的原创音乐做例子,查看更多进入原创音乐分区
这里有两种排序方式,按投稿时间和按热度,在chrome的控制台里的JS中可以找到这两中排序对应的信息的JSON数据,值得一提的是按投稿时间排序:
双击打开会发现肥肠抱歉(按热度排序不会),可是就是想用投稿时间排序怎么办呢