Python:爬取全网Video

最新推荐文章于 2024-03-30 19:55:09 发布

偶像迈特凯：也是爷的青春

最新推荐文章于 2024-03-30 19:55:09 发布

阅读量721

点赞数

分类专栏： Python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_42735156/article/details/103916463

版权

Python 专栏收录该内容

9 篇文章 1 订阅

订阅专栏

先上爬取1-10页的效果(获取全网即更改页数即可)

<><><><><><><><><><><><><><><><><><><><><><><><><><><><><><><><><><><><><><><><><><><><><><><><>

思路:

(1)访问网站

(2)获取响应数据

(3)解析数据:

a:转换数据类型

b:数据解析

(4)遍历列表,find网址

(5)下载到文件夹


import requests
import json
import re

def change_title(title):
    pattern = re.compile(r"[\/\\\:\*\?\"\<\>\|]")
    new_title = re.sub(pattern,"_",title) 
    return new_title

for page in range(1,10):#爬取1~n页

    print('正在抓取第{}页数据'.format(page))

    base_url = 'https://v.6.cn/minivideo/getlist.php?act=recommend&page={}&pagesize=20'.format(str(page))
    headers = {
        "user-agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/79.0.3945.88 Safari/537.36"
    }

    response = requests.get(base_url,headers=headers)
    response_data = response.text
    #print(response_data)

    dict_data = json.loads(response_data)
    #print(dict_data)
    data_list = dict_data['content']['list']#获取到列表
    #print(data_list)

    for data in data_list:
        #print(data)
        video_title = data['title'] + '.mp4'
        video_url = data['playurl']

        new_title = change_title(video_title)

        #print(video_title,video_url)
        print('正在下载...'+video_title)
        
        video_data = requests.get(video_url,headers=headers).content

        with open('video\\' + new_title,'wb') as f:
            f.write(video_data)
            print('下载完成\n')

print('网站视频已经全部下载完毕 ending...')

偶像迈特凯：也是爷的青春

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
Python:爬取全网Video

先上爬取1-10页的效果(获取全网即更改页数即可)<><><><><><><><><><><><><><><><><><><><><><&...
复制链接

扫一扫

专栏目录

偶像迈特凯：也是爷的青春 CSDN认证博客专家 CSDN认证企业博客

码龄6年

39: 原创

40万+: 周排名

207万+: 总排名

9万+: 访问

: 等级

707: 积分

30: 粉丝

51: 获赞

9: 评论

330: 收藏

私信

关注

热门文章

分类专栏

生活 4篇
元件选型 1篇
算法 1篇
单片机设计开发 7篇
Python 9篇
PCB 17篇

最新评论

AD16如何添加禁止区域
2401_82959744: cutout之后铺铜，会比cutout边界还内缩0.1mm左右，是我设置规则不对还是本身就是这样
AD16自动打地孔
小澤z: 我也碰到类似问题，用plane的地方可以打过孔，但track的走线就打不上。。。
PADS 9.5如何给矩形板框加上倒角
寒灯510: 楼主，选择板框-特性，2d线，确定就会报警闪退，为什么啊
做个四层PCB（one）自己画元器件封装库
小陈困了405: 看教学好简单，自己做呆住
AD16自动打地孔
Dawn_win: 我想在某条线上、或者某一个覆铜区域内打过孔，就是要勾选你这个文中的第二个图片中左上角的Constrain Area（约束区），比如我想打孔径20mil，外径35mil的过孔，间距设置为50mil。我的线宽200mil，结果一个过孔也没打上去，然后有弹窗：Unable to locate any suitable locations on net NetC42 2（无法在网络NetC42上找到任何合适的位置），可是我自己手动打孔，明明都是空余位置是足够大的，而自动打孔就不行。请问博主，您知道怎么办吗？这个问题困扰我好久了。

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。