B站视屏爬取

本文详细介绍了如何通过分析B站网页源码,找出视频 cid 和 aid 参数,利用 fiddler 抓包获取 flv 视频流,并在 Java 中实现下载。过程中遇到的403 Forbidden错误通过设置 Referer 解决。
摘要由CSDN通过智能技术生成

前几天写了一个上网爬取滑稽色图片(手动滑稽)的小爬虫,今天,突发奇想,想爬取视频看看。


以B站敖厂长的视频实验:

1.找到要爬取视频


2.右键查看源码:


与审查元素对比找到这里:EmbedPlayer('player', "//static.hdslb.com/play.swf", "cid=26379702&aid=16164197&pre_ad=0");猜测这里调用的js的函数是嵌入播放器到这个里面;


3.去找页面引用的js里找EmbedPlayer()函数,发现在这个https://static.hdslb.com/js/core-v5/page.arc.js文件里;


评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值