Python 学习之路------0724（Python简单实现爬取视频和图片）

最新推荐文章于 2024-05-24 16:30:33 发布

sinat_39381092

最新推荐文章于 2024-05-24 16:30:33 发布

阅读量293

点赞数 1

分类专栏： python 爬虫

本文链接：https://blog.csdn.net/sinat_39381092/article/details/97163478

版权

python 同时被 2 个专栏收录

7 篇文章 0 订阅

订阅专栏

爬虫

2 篇文章 0 订阅

订阅专栏

爬虫之爬图片和视频：

一、爬图片：

# 导入模块包
import requests
import re

# 链接地址
url = "https://www.hellorf.com/image/search?q=%E7%A7%91%E6%8A%80&source=bd"
# 获取网页信息
response = requests.get(url)
res = response.text
# print(res)

# 清洗数据，把图片链接提取出来
one_data = re.findall('''img data-src="(.*?)"''', res)
for i in one_data:
    image_response = requests.get(i)
    # 获取图片，得到二进制数据
    image_data = image_response.content
    # 对二进制数据进行清洗，得到图片的名称
    img_name = i.split('/')[-1]
    # print(img_name) # 拿到二进制数据
    f = open(img_name, 'wb')
    f.write(image_data)
    f.flush()  # 快速刷新

二、爬视频

# 导入模块包
import requests
import re
# 获取链接，爬取网站,清洗数据
url = 'http://www.mod.gov.cn/v/2019-07/24/content_4846365.htm'
response = requests.get(url)
data = response.text
# print(data)
mp4_url = re.findall('//Video (.*?).mp4', data)
# 拼接数据，得到完整url
mp4_str = mp4_url[0] + '.mp4'
# 进入mp4的url
mp4_data = requests.get(mp4_str)
# 拿到视频的二进制数据
mp4_data = mp4_data.content
# 切割视频的url，将末尾数字作为视频名称并将视频下载保存下来
mp4_name = mp4_str.split('/')[-1]
f = open('1.mp4', 'wb')
f.write(mp4_data)
f.flush()

sinat_39381092

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
Python 学习之路------0724（Python简单实现爬取视频和图片）

爬虫之爬图片和视频：一、爬图片： # 导入模块包import requestsimport re# 链接地址url = "https://www.hellorf.com/image/search?q=%E7%A7%91%E6%8A%80&source=bd"# 获取网页信息response = requests.get(url)...
复制链接

扫一扫

专栏目录