趣味学python（006）

最新推荐文章于 2019-08-01 16:07:23 发布

大笨钟47

最新推荐文章于 2019-08-01 16:07:23 发布

阅读量116

点赞数

分类专栏： python（学习爬虫）

python（学习爬虫）专栏收录该内容

19 篇文章 0 订阅

订阅专栏

python应用——爬取千图网的付费视频

最近小编学到了爬取千图网的代码，特来分享一下???

首先要会查找网页的源代码！

在这里插入图片描述

import requests
from lxml import etree
headers = {
“User-Agent”: “Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko)
Chrome/75.0.3770.100 Safari/537.36”,
“Referer”: “https://www.58pic.com/tupian/5848.html”
}
# 请求千图网拿到整体数据
response = requests.get(“https://www.58pic.com/tupian/5848.html”)
# 抽取千图网的数据，即视频标题，视频链接

html = etree.HTML(response.text)
src_list = html.xpath(’//div[@key=“19”]//@data-video’)
#要学会查看对应的标签，要切记不要打错字母，小编就是犯了这样一个错误，弄了好久

tit_list = html.xpath(’//div[@key=“19”]/p[@class=“card-title”]/span[@class=“title-text”]/text()’)
for src, tit in zip(src_list, tit_list):
# 下载视频
content = requests.get(“https:” + src, headers=headers).content
# 4.保存视频

filename = “video” + tit + “.mp4”
print(“正在保存视频文件：”+filename)
#不存在的文件会自动创建

with open(filename, “wb”) as f:
f.write(content)

成功之后就会在文件中自动创建一个文件夹：如图
在这里插入图片描述

这样即可保存文件????

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
趣味学python（006）

python应用——爬取千图网的付费视频最近小编学到了爬取千图网的代码，特来分享一下
复制链接

扫一扫

专栏目录

大笨钟47 CSDN认证博客专家 CSDN认证企业博客

码龄5年

91: 原创

31万+: 周排名

98万+: 总排名

22万+: 访问

: 等级

1502: 积分

55: 粉丝

112: 获赞

36: 评论

619: 收藏

私信

关注

热门文章

分类专栏

最新评论

唯一可译编码
R2274925295: 纸上画图那个例题，为什么110有两个后缀？1可以理解，为什么有0呢？
MS-SSIM
Agoni.: 对五个不同尺度特征图大小做相似性计算
唯一可译编码
Coconut_Cake: C语言代码可能有些bug？我输入{11,01,10,001,000}，这不应该是唯一可译码，因为码长是3/4 + 3/8 = 9/8 > 1，但程序说这是唯一可译码。尾随后缀集合为：1
SWinIR概述
fromzero02: 代表分辨率变大两倍
SWinIR概述
m0_70971972: 请问博主，实验结果那张图标，第二列scale中x2代表什么呢

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。