Python 超级简单的小视频爬虫工具

最新推荐文章于 2024-08-24 11:00:06 发布

sunyu2033

最新推荐文章于 2024-08-24 11:00:06 发布

阅读量402

点赞数

分类专栏： Python 文章标签： python 正则表达式

本文链接：https://blog.csdn.net/sunyu2033/article/details/106515861

版权

Python 专栏收录该内容

1 篇文章 0 订阅

订阅专栏

import requests
from bs4 import BeautifulSoup
import re

url = 'https://ibaotu.com/shipin/7-0-0-0-3-1.html'
resource = requests.get(url)
html = resource.text

soup = BeautifulSoup(html, 'xml')
net_url = soup.find_all('video')

video_url = []

for x in net_url:
    if x.get('src'):
        video_url.append('https:'+x.get('src'))
# print(video_url)

titles = re.findall(r'<span class="video-title">(.*?)</span>', html)

for x,y in zip(titles, video_url):
    try:
        mp4_url = requests.get(y, timeout=10)
    except requests.exceptions.ConnectionError:
        print('出错啦')
        continue
    fn = open('F:\Python\PythonData/'+x+'.mp4', 'wb')
    fn.write(mp4_url.content)
    fn.close()