爬取bilibili再也不用头疼了,bilibili-api一步到位!

前几天在github上看到有意思的项目 —— bilibili-api,作者是个二次元的宅男Passkou。以下是该项目的地址:

https://github.com/Passkou/bilibili_api

项目可以直接使用pip直接进行安装:

pip install bilibili_api

之后在代码中直接 import bilibili_api 就可以使用了!

先来看个简单的demo:

from bilibili_api import video, Verify
# 设置验证
verify = Verify(sessdata="your sessdata", csrf="your csrf")

# 初始化VideoInfo类
my_video = video.VideoInfo(aid="40473736", verify=verify)

# 获取视频信息
video_info = my_video.get_video_info()

# 转换成格式化JSON并打印
print(json.dumps(video_info, indent=4, ensure_ascii=False))

关于sessdata和csrf这两个数据我们需要在浏览器中查看自己的登陆数据:

参数名类型必须提供默认值说明
sessdatastrFalse"False"用于登录验证
csrfstrFalse"False"用于请求验证

具体查找流程如下:

  1. 地址栏旁边有个小锁(非HTTPS的话应该是个圆圈里头一个感叹号),点开,选择Cookies。

  1. 如图所示,找到SESSDATA的值就可以了,CSRF是bili_jct。

认证结果有以下4种情况:{"code": "代码", "message": "提示信息"}

code=-3:未提供SESSDATA,

code=-2:SESSDATA值有误,

code=-1:csrf值校验失败,

code=0:权限正常

可以通过对应的接口返回值来确认验证问题。

关于目前开放的接口,大家可以参考下面这个接口文档来进行开发:

https://github.com/Passkou/bilibili_api/blob/master/bilibili_api/src/api.json

目前为止开放的API只有Video(视频信息包含弹幕)、User(用户基本操作)和Dynamic(动态信息)模块,其他模块仍在后续开发中,喜欢的朋友可以去github上点个star哦~



大家如果觉得不错的话
欢迎大家「转发」「点赞」「在看」三连!


扫一扫下面的二维码
免费领取10G的Python学习资料哦~




“扫一扫,领取Python学习资料”
  • 15
    点赞
  • 64
    收藏
    觉得还不错? 一键收藏
  • 5
    评论
### 回答1: 您想了解如何使用爬虫程序爬取B站(Bilibili)上的视频或其他数据吗?这是一个涉及到网站爬虫技术的问题,需要注意一些法律和道德方面的问题。我建议您在使用爬虫程序之前,先了解一下相关的法律法规和网站的使用协议。同时,为了避免对网站造成不必要的负担,也请您谨慎使用爬虫程序。如果您有具体的问题或需要使用爬虫程序来获取数据,可以告诉我,我会尽力帮助您。 ### 回答2: 爬虫是一种自动化抓取网页内容的程序,可以用于获取互联网上的各种信息。对于Bilibili这样的视频分享网站,如果想要获取其中的数据,也可以通过编写爬虫程序来实现。 首先,我们需要明确爬取的目标。在爬取Bilibili时,可以选择抓取视频、弹幕、评论、用户信息等内容。为了实现爬虫,我们首先需要使用Python编程语言,并安装相关的第三方库,如Requests、BeautifulSoup、Selenium等。 其次,我们需要了解Bilibili的网页结构。使用浏览器开发者工具可以帮助我们分析网页的HTML和CSS代码,从而确定目标数据所在的位置和规律。 在编写爬虫代码时,我们可以使用Requests库发送HTTP请求,获取Bilibili网页的源代码。然后,可以使用BeautifulSoup或正则表达式等方法解析源代码,提取出我们需要的数据。 例如,如果想要获取Bilibili热门视频的信息,可以发送一个GET请求到热门视频的网址,然后使用BeautifulSoup解析HTML源代码,提取出视频的标题、链接、播放量等信息。 对于需要模拟用户登录的情况,可以使用Selenium库来实现自动化操作。通过模拟用户登录,可以获取到更多的数据,如已登录用户的关注列表、观看历史等。 在编写爬虫程序时,需要遵守相关的法律法规和网站的规则,不得用于非法用途,也不得对网站造成过大的负荷。 总之,通过编写爬虫程序,我们可以有效地获取Bilibili网站上的各种数据,为后续的数据分析、挖掘和应用提供支持。
评论 5
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值