![](https://i-blog.csdnimg.cn/blog_migrate/90c074f70147fdaec1393afef6e458c0.gif)
前言
![](https://i-blog.csdnimg.cn/blog_migrate/5c1cd3369fbaad0ff0dd7e59f34cd74b.png)
看到这张图,你想到了什么呢?
没错!就是它,国内知名的弹幕网站
同时也是二次元、创意的Up主聚集得网站
![](https://i-blog.csdnimg.cn/blog_migrate/8e9e62339a1e1229ef9ae1c04d538d00.png)
今天我们就来采集一下它得小姐姐系列
![](https://i-blog.csdnimg.cn/blog_migrate/d8c9559ff2a455bf06112ab87817cee1.png)
![](https://i-blog.csdnimg.cn/blog_migrate/59fd90c27f2141a86082a4e5f703402a.gif)
开发环境:
版 本: python 3.8
![](https://i-blog.csdnimg.cn/blog_migrate/ebec73e3bceac9823cca3bf9968332fd.png)
编辑器: pycharm 2022.3.2 专业版
![](https://i-blog.csdnimg.cn/blog_migrate/0bf49514d557f1dcabd0ad36867ed6a1.png)
requests >>> pip install requests
ffmpeg 音频合成软件
![](https://i-blog.csdnimg.cn/blog_migrate/7a7065af427e12034bacadb3192b1b84.png)
![](https://i-blog.csdnimg.cn/blog_migrate/90c074f70147fdaec1393afef6e458c0.gif)
如果安装python第三方模块:
win + R 输入 cmd 点击确定, 输入安装命令
pip install 模块名 (pip install requests)
在pycharm中点击
Terminal(终端) 输入安装命令
![](https://i-blog.csdnimg.cn/blog_migrate/5d4cd8b6e4bbc820b8399a832a1741f2.png)
![](https://i-blog.csdnimg.cn/blog_migrate/f7fb3df917be205115affc9e6b29707b.gif)
代码实现(代码实现基本流程)
发送请求 使用代码的方式访问网站
获取数据 取出网页源代码
解析数据 提取MP4链接
保存数据
![](https://i-blog.csdnimg.cn/blog_migrate/b975ee14fa90ce3d49b96d9f8a1d84d4.png)
![](https://i-blog.csdnimg.cn/blog_migrate/59fd90c27f2141a86082a4e5f703402a.gif)
代码展示
导入模块
import requests
import re # 正则表达式模块
import json
import pprint
import subprocess
import os
伪装(请求头)
headers = {
用户信息
"cookie": "buvid3=355AA300-6A61-04E5-A05C-E891D886F69632716infoc; b_nut=1675085932; i-wanna-go-back=-1; _uuid=387EA3810-FBF5-E92C-827E-2510B578C5B9A33232infoc; buvid4=15C69C98-F6A7-EC6A-872F-E69C1840DD6D33724-023013021-1pW1w45e5fZS9RtebDiGZw%3D%3D; nostalgia_conf=-1; CURRENT_FNVAL=4048; rpdid=|(kmJY|k))lY0J'uY~l|)lmY|; SESSDATA=17eb9f1a%2C1690782878%2C6a25c%2A22; bili_jct=4af9076b42f76603dfe4cf018ad2000f; DedeUserID=422789639; DedeUserID__ckMd5=fc4901c78719b545; CURRENT_QUALITY=80; b_ut=5; b_lsid=51ED8F105_1861C3EEC10; theme_style=light; is-2022-channel=1; sid=66dafqju; fingerprint=97ca5a8b555e63aca787c9cd27273c7e; buvid_fp_plain=undefined; buvid_fp=8cc52ae38b592ff26dc2b393eebd890b; PVID=2; innersign=1; bp_video_offset_422789639=758803412994228200",
防盗链
"referer": "https://www.****.com/",
浏览器基本信息
"user-agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/109.0.0.0 Safari/537.36"
}
发送请求
请求链接
url = 'https://www.***.com/video/BV1qv4y1k7UE/?vd_source=8f216a44bce0dbe14e3447c34c2ab3e2'
response = requests.get(url, headers=headers)
获取数据
html_data = response.text
解析数据
json_str = re.findall('__playinfo__=(.*?)</script>', html_data)[0]
# <h1 .*?>(.*?)</h1>
title = re.findall('<h1 .*?>(.*?)</h1>', html_data)[0]
# Python基础 字典
json_data = json.loads(json_str)
# pprint.pprint(json_data)
audio_url = json_data['data']['dash']['audio'][0]['baseUrl']
print(audio_url)
video_url = json_data['data']['dash']['video'][0]['baseUrl']
print(video_url)
保存数据
audio_data = requests.get(audio_url, headers=headers).content
with open(f'{title}.mp3', mode='wb') as f:
f.write(audio_data)
video_data = requests.get(video_url, headers=headers).content
with open(f'{title}.mp4', mode='wb') as f:
f.write(video_data)
ffmpeg = f'ffmpeg -i {title}.mp4 -i {title}.mp3 -acodec copy -vcodec copy {title+"-out.mp4"}'
subprocess.run(ffmpeg)
os.remove(f'{title}.mp4')
os.remove(f'{title}.mp3')
![](https://i-blog.csdnimg.cn/blog_migrate/59fd90c27f2141a86082a4e5f703402a.gif)
小姐姐美图展示
![](https://i-blog.csdnimg.cn/blog_migrate/d91348c2500b837ad647673ef5df8aaa.png)
![](https://i-blog.csdnimg.cn/blog_migrate/7b209b0cd096f0bac0f70901049ad261.png)
![](https://i-blog.csdnimg.cn/blog_migrate/81f891632fbcbe4e1e59fc88d7a7558f.png)
![](https://i-blog.csdnimg.cn/blog_migrate/597efa67068b65aa0f52e41d7e612358.png)
![](https://i-blog.csdnimg.cn/blog_migrate/331e22988507d11bf6fa60ab39fc626c.png)
![](https://i-blog.csdnimg.cn/blog_migrate/7f1793dd5166d4cac3a7238b62c01e40.png)
![](https://i-blog.csdnimg.cn/blog_migrate/d771e69c90c479678ab6842ef4026a46.png)
![](https://i-blog.csdnimg.cn/blog_migrate/5c4383f354cdf80f3999a3076ba283b4.png)
![](https://i-blog.csdnimg.cn/blog_migrate/59fd90c27f2141a86082a4e5f703402a.gif)
尾语
好啦,本文章到这里就结束拉
有喜欢的小伙伴记得给博主一个三连哦~
希望你在学习的路上不忘初心,坚持不懈,学有所成
把时间和精力,放在自己擅长的方向,去坚持与努力,
如果不知道自己擅长什么,就尽快找到它。
![](https://i-blog.csdnimg.cn/blog_migrate/c97a4381c13c597770f0d87a83ee45c6.gif)