梦幻代码与绝美主播共舞,Python征服hy小姐姐!

前言

嗨喽~大家好呀,这里是魔王呐 ❤ ~!

听说,hy小姐姐又有颜值又有才艺,就是容易被封

这我不得去寻找几个喜欢嘚小姐姐,把她们嘚主页统统保留下来

深夜回家自己慢慢欣赏~

环境使用:

  • Python 3.8 解释器

  • Pycharm 编辑器

模块使用:

  • requests >>> 数据请求 第三方模块 pip install requests <工具>

  • re <正则表达式模块>

第三方模块安装:

win + R 输入cmd 输入安装命令 pip install 模块名 (如果你觉得安装速度比较慢, 你可以切换国内镜像源)

python资料、源码、教程\福利皆: 点击此处跳转文末名片获取

流程思路: <采集基本公式>

一. 数据来源分析

  1. 明确需求

    • 明确采集的网站以及数据内容

      网址: https://v.huya.com/play/893496247.html

      数据: 视频链接 / 视频标题

  2. 抓包分析

    • 通过开发者工具 <浏览器自带> 进行抓包分析

      I. 打开开发者工具: F12 / 右键点击检查选择network

      II. 刷新网页: 让数据重新加载一遍

      III. 通过关键字去搜索对应数据包

二. 代码实现步骤

  1. 发送请求, 模拟浏览器对于url地址发送请求

    请求链接: 数据包地址

  2. 获取数据, 获取服务器返回响应数据

  3. 解析数据, 提取我们需要的数据内容

    视频标题以及视频链接

  4. 保存数据, 获取视频二进制数据进行保存

代码展示

# 导入数据请求模块 第三方模块, 需要安装 pip install requests
import requests
# 导入正则表达式
import re

# 模拟浏览器 <字典数据类型, 构建完整键值对> '键': '值'
headers = {
    # 用户代理, 表示浏览器基本身份信息 电脑系统版本
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/114.0.0.0 Safari/537.36'
}
for page in range(2, 501):
    print(f'正在采集第{page}页的数据内容')
    link = f'*****/g/all?set_id=51&order=hot&page={page}'
    html_data = requests.get(url=link, headers=headers).text
    video_id_list = re.findall('<li data-vid="(\d+)">', html_data)
    for video_id in video_id_list:
        # 请求链接 --> 视频信息数据包
        源码、解答、教程、安装包等资料加V:qian97378免费领
        url = f'****/moment/getMomentContent?videoId={video_id}&uid=&_=1690287098228'
        # 发送请求 <Response [200]> 响应对象, 表示请求成功
        response = requests.get(url=url, headers=headers)
        # 提取标题 字典键值对取值
        title = response.json()['data']['moment']['title']
        # 视频链接  [0] 表示列表索引取值
        video_url = response.json()['data']['moment']['videoInfo']['definitions'][1]['url']
        video_content = requests.get(url=video_url, headers=headers).content
        with open('video\\' + title + '.mp4', mode='wb') as f:
            f.write(video_content)
        print(title, video_url)


尾语

感谢你观看我的文章呐~本次航班到这里就结束啦 🛬

希望本篇文章有对你带来帮助 🎉,有学习到一点知识~

躲起来的星星🍥也在努力发光,你也要努力加油(让我们一起努力叭)。

最后,宣传一下呀~👇👇👇更多源码、资料、素材、解答、交流皆点击下方名片获取呀👇👇

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值