使用Python 利用you-get 下载视频_第一篇

使用Python 利用you-get 下载视频

直接上代码:

未完成的部分:

1 下载过程会卡住,百度无解,
2 网址获取不完整,还在解决中,
3 仅仅使用re,requests,you-get
4 不满意的地方太多了,

代码如下(示例):

```python
获取斗罗大陆的全部视频,
URL = https://v.qq.com/detail/m/m441e3rjq9kwpsc.html

使用的moudle,
    -requests
    -re
    -you_get
    以及常用的模块,
headers = {

    'User-Agent':'Mozilla/5.0 (X11; Linux x86_64; rv:82.0) Gecko/20100101 Firefox/82.0'

}

'''

if __name__ == '__main__':
    # 导入需要的模块
    import requests
    import re
    from you_get import common as you_get
    import time
    import os

    headers = {

        'User-Agent':
            'Mozilla/5.0 (X11; Linux x86_64; rv:82.0) Gecko/20100101 Firefox/82.0'
    }
    url = 'https://v.qq.com/detail/m/m441e3rjq9kwpsc.html'
    ex = '<span class="item".*?><a href="(.*?)".*?>.*?</a></span>'
    page_list = requests.get(url=url, headers=headers, timeout=20).text
    # print('正在链接中!', reponse.status_code)
    # page_list = reponse.text
    # print(page_list)
    url_list = re.findall(ex, page_list, re.S)
    # Great a finder to save modive,
    dir_ = '/home/xingzhe/Desktop/liuzhangping/douludalu/'
    if not os.path.exists(dir_):
        os.mkdir(dir_, mode=0o770)

    # 目前只是获取到了一部分,有待优化,
    down_url_list = []
    # print(url_list)
    for url_ in url_list:
        if '/x/' in url_:
            down_url_list.append(url_)
        else:
            pass
    try:
        for down_url in down_url_list:
            you_get.any_download(url=down_url, info_only=False, output_dir=dir_, merge=True)
    except("content fail"):

        pass
    print('over')

#   分析我们需要的内容,书写re的模式
"""
<span class="item" itemscope=""
itemprop="episode" itemtype="http://schema.org/Episode" _stat="series:numbtn">
<a href="https://v.qq.com/x/cover/m441e3rjq9kwpsc/i0025secmkz.html" target="_blank" itemprop="url">
<span itemprop="episodeNumber">6</span></a></span>

<span itemprop="episodeNumber">1</span>

ex = '<a href="https:(.*)" target="_blank" itemprop="url"><span itemprop="episodeNumber">(.*?)</span>'

</a>
"""

如有任何网站的侵权,请联系我删除!

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值