个人练习（第八天）

最新推荐文章于 2021-11-15 16:53:10 发布

Kevin 1024

最新推荐文章于 2021-11-15 16:53:10 发布

阅读量85

点赞数

分类专栏：每日练习

本文链接：https://blog.csdn.net/qq_42426806/article/details/85541809

版权

每日练习专栏收录该内容

10 篇文章 0 订阅

订阅专栏

今天把之前的东西捡起来练了练，写了个非常简单的爬虫程序，只能用于爬取静态页面的图片（也就是把图片直接放在标签里，写在HTML里的）

import re
import requests

respose=requests.get('这里写URL')
# print(respose.status_code)# 响应的状态码
# print(respose.content)  #返回字节信息
# print(respose.text)  #返回文本内容
urls=re.findall(r'class="items".*?href="(.*?)"',respose.text,re.S)  #re.S 把文本信息转换成1行匹配
url=urls[5]
result=requests.get(url)
mp4_url=re.findall(r'id="media".*?src="(.*?)"',result.text,re.S)[0]

video=requests.get(mp4_url)

with open('D:\\a.mp4','wb') as f:
    f.write(video.content)

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

Kevin 1024

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
个人练习（第八天）

今天把之前的东西捡起来练了练，写了个非常简单的爬虫程序，只能用于爬取静态页面的图片（也就是把图片直接放在标签里，写在HTML里的）import reimport requestsrespose=requests.get('这里写URL')# print(respose.status_code)# 响应的状态码# print(respose.content) #返回字节信息# pri...
复制链接

扫一扫