python爬取某网站上的图片

梦里逆天

已于 2022-07-15 10:42:24 修改

阅读量964

点赞数

分类专栏： Python 文章标签： python 爬虫图片

于 2022-07-15 09:28:14 首次发布

本文链接：https://blog.csdn.net/username666/article/details/125797079

版权

1.请求网页

import requests


# 请求头，对python爬虫进行伪装
# user-agent：浏览器的身份标识
headers = {
   
    'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/103.0.0.0 Safari/537.36'
}
# 由于vmgirls这个网站打开开发者工具会自动退出，可以在网址url前加“view-source:”，如：view-source:https://www.vmgirls.com/12985.html查看网页源代码
# 1.请求网页
response = requests.get('https://www.vmgirls.com/12985.html', headers=headers)
html = response.text
print(html)

在这里插入图片描述

2.解析网页，提取我们需要的数据

我们想要的是网页上的图片链接。
在这里插入图片描述

# 2.解析网页
# 使用正则表达式匹配网页文本中满足特定条件的内容
urls = re.findall('<a rel="nofollow" href="(.*?)" alt=".*?">', html)
print(urls)

在这里插入图片描述

3.保存数据

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

梦里逆天

关注关注

0
点赞
踩
7

收藏

觉得还不错? 一键收藏
打赏
0
评论
python爬取某网站上的图片

本章是学习B站python爬虫实战教程视频中，使用python爬取vmgirls上的美女图片的笔记。
复制链接

扫一扫

专栏目录

python爬虫入门教程：爬取网页图片(亲测可用)

萧海的博客

08-04

9064

其中之所以要加headers这一段是因为有些网页会识别到你是通过python请求的然后把你拒绝，所以我们要换个正常的请求头。其中re是python自带的，requests库需要我们自己安装，在命令行中输入pip install requests即可。注：此处表情包网站中的内容本来就可以免费下载，所以爬虫只是简化了我们一个个点的流程，注意不能去爬取付费资源。返回的内容是由字符串组成的列表，最后我们经由爬到的地址通过python语句把图片下下来保存到文件夹里就行了。...

Python爬取页面中的图片

需要远程指导仿真实验、代码有问题的，请后台私信或者关注公众号

07-06

1703

本实验任务主要基于ubuntu完成python对单个网页内容的爬取，完成对所需数据的采集。通过完成本实验任务，要求学生掌握python对网页数据的采集技能，为以后从事数据采集工程师奠定基础。完成实验实例，python语言爬取网址中的小说图片地址。Ubuntu、Python2.7.12、Tomcat打开获取数据的页面，进行对数据检索分析，找到要获取的数据，构建爬取思路。通过urllib2对页面进行请求，通过BeautifulSoup对请求的页面进行解析。对解析完的数据进行选取，获取重要数据。

参与评论您还未登录，请先登录后发表或查看评论

用python爬取某个图片网站的图片

Binary_huang的简介

06-15

3209

用python爬取某个图片网站的图片

最全python爬虫入门：批量爬取网站图片并保存_python爬虫图片(1)，最新Python大厂高频面试题

最新发布

2401_84138890的博客

05-13

1382

现在能在网上找到很多很多的学习资源，有免费的也有收费的，当我拿到1套比较全的学习资源之前，我并没着急去看第1节，我而是去审视这套资源是否值得学习，有时候也会去问一些学长的意见，如果可以之后，我会对这套学习资源做1个学习计划，我的学习计划主要包括规划图和学习进度表。分享给大家这份我薅到的免费视频资料，质量还不错，大家可以跟着学习获取网页文本并将文本解析。

python怎么爬取图片地址_Python爬虫爬取一个网站上的图片地址实例代码

weixin_35714577的博客

01-29

1386

本文实例主要是实现爬取一个网站上的图片地址，详细如下。读取一个网站的源码：import urllib.requestdef getHtml(url):html=urllib.request.urlopen(url).read()return htmlprint(getHtml(http://image.baidu.com/search/flip?tn=baiduimage&ie=utf-8...

如何通过Python进行图片批量下载？

oldboyedu1的博客

11-14

1203

大家在上网冲浪的时候，看到喜欢的图片都想要保存下来，有的时候可以直接右键图片另存为，但有的时候图片是无法下载的，甚至需要跳转到其他的网页去，非常麻烦。通过for循环获得所有符合条件的图片网址，并采用urllib.urlretrieve()方法，将远程数据下载到本地，并重新命名!页面数据抓取过程定义了getHtml()函数，其作用是给getHtml()传递一个网址，最终进行整个页面的下载。页面数据筛选中，定义了一个新的函数getImg()，该函数的功能是筛选出.jpg格式的图片地址。

python爬图一篇过（一）【超·详细】：selenium库：webdriver环境配置+新手基础知识

qq_53021454的博客

09-29

1791

前言：一个月前，博主在学过python（一年前）、会一点网络（能按F12）的情况下，凭着一腔编程改变世界的热血和对把电脑变成工具人的兴趣，开始了python爬虫的学习。一路过来可以说走了相当多弯路，但是前不久终于成功！！！（泪目）所以今天萌新我第一次斗胆在CSDN上开一个栏目，分享我的python图片爬虫全实现过程，内心真的激动！！！希望过路大神能多多指教和鼓励，写得不对的地方请直接指出！老规矩上第一章的思维导图所谓之所以要基于selenium库爬虫，是因为现在网...

Python批量爬取某图片网站图片完整代码

10-09

Python批量爬取某图片网站图片完整代码，python downimage.py 即可执行

python爬虫爬取某站上海租房图片

01-20

这段时间开始学习python爬虫，今天周末无聊写了一段代码爬取上海租房图片，其实很简短就是利用爬虫的第三方库Requests与BeautifulSoup。python 版本：python3.6 ,IDE ：pycharm。其实就几行代码，但希望没有开发基础...

python数据爬取美食网站xpath解析并将美食数据存入csv文件按照人气数据分析可视化

07-04

通过以上功能，这段代码实现了从美食网站爬取数据，并进行数据处理、存储到CSV文件和可视化数据的功能。用户可以通过这段代码快速获取美食网站的数据，进行数据分析和可视化显示人气排名前10的菜品。

python 抓取一个网站所有图片并保存

04-23

python 抓取一个网站所有图片并保存。 python 抓取一个网站所有图片并保存 python 爬虫

利用Python爬虫抓取网页上的图片（含异常处理）

08-02

利用Python爬虫抓取网页上的图片，当遇到不合法的URL时，会自动处理异常，不会导致程序崩溃。直到下载完整个页面的图片，程序才会退出

Python爬虫爬取一个网页上的图片地址实例代码

09-20

主要介绍了Python爬虫爬取一个网页上的图片地址实例代码，具有一定借鉴价值,需要的朋友可以参考下

Python 通过URL打开图片

zc520yzy的博客

02-25

3825

img_src = ‘https://i.ytimg.com/vi/Cn6Tw5Ilwo0/maxresdefault.jpg’ 1. OpenCV # OpenCV的imread()只能加载本地的图片，并不能通过网址加载图片。但是，opencv的VideoCapture类可以从url加载视频，如果只用opencv，可以先用VideoCapure加载网络图片，然后再传给Mat import cv2 cap = cv2.VideoCapture(img_src) if( cap.isOpened() ) .

Python之BeautifulSoup学习之一粗略抓取网页图片连接地址

icydust的博客

11-10

8808

Windows/Python 2.7.11 利用BeautifulSoup库抓取页面的一些标签TAG值粗略的抓取所有标签为img 属性为src的值（连接）代码如下： #coding=utf-8 import urllib2 from bs4 import BeautifulSoup def getImg(url): html = urllib2.urlop

python爬取图片链接（附带一个html装逼特效）

网络架构

01-02

1161

使用get方式获取网页文本 import re import requests #导入requests包 url = 'https://www.biaoqingbao.net/?post_type=post&s=%E5%91%B5%E5%91%B5' strhtml = requests.get(url) #Get方式获取网页数据 #匹配图片网址 pic_url = re.findall('img class="waitpic" src="(.+?)" alt=',st

福利！！！Python爬取好看的妹子图！！！

全网粉丝10W+、全栈领域优质创作者、掘金、阿里云等社区博客专家、专注于全栈领域和毕业项目实战

02-26

3926

大致步骤：第一步：找到我们要爬取的网站 https://www.vmgirls.com/这是个妹子图片的私人网站第二步：打开Vscode或者Pycharm都可以复制我的代码，详细的解释写好了 ps:requests库需要手动下载,按win+R输入cmd进入命令行模式，输入pip install requests安装requests库。第一部分，请求网页。 # 导入requests库 i...

python读入图片的四种方式

“相关推荐”对你有帮助么？

非常没帮助
没帮助
一般
有帮助
非常有帮助

提交