urllibrequest爬虫，爬取彼岸图片

最新推荐文章于 2022-04-18 08:40:13 发布

末影1

最新推荐文章于 2022-04-18 08:40:13 发布

阅读量229

点赞数

本文链接：https://blog.csdn.net/weixin_45940816/article/details/120595033

版权

爬虫 python

import urllib.request
from bs4 import BeautifulSoup

def index(page):
    if page == 1:
        url = 'https://pic.netbian.com/index.html'
    else:
        url = "https://pic.netbian.com/index_{}.html".format(page)
    # url = 'https://pic.netbian.com/index.html'
    headers = {
        'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) '
                      'Chrome/93.0.4577.82 Safari/537.36 '
    }
    w1 = urllib.request.Request(url=url, headers=headers)
    w2 = urllib.request.urlopen(w1).read()
    data = BeautifulSoup(w2, "html.parser")
    ul = data.find("div", class_="slist").find_all("li")
    # print(ul)
    for i in ul:
        n = i.find_all("img")
        for j in n:
            #图片地址
            src = j['src']
            #图片标题
            title = j["alt"].replace(" ", "")
            print(title)
            #拼接
            src1 = "https://pic.netbian.com/" + src
            #print(src1)
            #下载图片
            urllib.request.urlretrieve(url=src1, filename="./image/"+title+".jpg")

#爬取前20页
for j in range(1, 20):
    index(j)

这是爬取的网页链接最新4K壁纸_最新4K桌面壁纸_彼岸图网

图片下载成功

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

末影1

关注关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

urllib爬取图片

houyujie123的博客

05-05

1781

使用python中urllib模块实现简单的图片爬取：代码： import urllib.request import re import os def open_url(url): req = urllib.request.Request(url) req.add_header('Referer','http://fanyi.youdao.com/?keyfrom=dict2...

爬取网页图片（urllib）

TwinkleLemon的博客

07-03

1134

很久之前就想学习爬虫，今天进行第一次尝试，爬取百度贴吧的图片：第一步：先学习使用urllib包将网页HTML文件down下来 import urllib.request url = 'https://tieba.baidu.com/p/5999308366' page = urllib.request.urlopen(url) html = page.read() ...

参与评论您还未登录，请先登录后发表或查看评论

专题07-python使用urllib.request爬取图片

livan1234的博客

02-14

2553

笔者是一个痴迷于挖掘数据中的价值的学习人，希望在平日的工作学习中，挖掘数据的价值，找寻数据的秘密，笔者认为，数据的价值不仅仅只体现在企业中，个人也可以体会到数据的魅力，用技术力量探索行为密码，让大数据助跑每一个人，欢迎直筒们关注我的公众号，大家一起讨论数据中的那些有趣的事情。我的公众号为：livandata python在爬虫方面的应用非常灵活，几乎可以解决大部分数据获取问题，笔者在之前...

Python学习--两种方法爬取网页图片(requests/urllib)

weixin_34405925的博客

04-08

442

实际上，简单的图片爬虫就三个步骤：获取网页代码使用正则表达式，寻找图片链接下载图片链接资源到电脑下面以博客园为例子，不同的网站可能需要更改正则表达式形式。 requests版本： import requests import re #获取网页代码 r = requests.get('https://www.cnblogs.com/Mayfly-nymph/...

python爬虫爬取网页图片

最新发布

07-31

本项目可以爬取Lofter图片，依赖Python的BeautifulSoup4第三方库，使用本项目需要先安装BeautifulSoup4。

python爬虫爬取百度图片

01-02

python爬虫爬取百度图片

超详细解析python爬虫爬取京东图片

01-21

超详细图片爬虫实战实例讲解(京东商城手机图片爬取)1.创建一个文件夹来存放你爬取的图片2.第一部分代码分析3.第二部分代码分析完整的代码如下所示:升级版代码：爬取过程中首先你需要观察在手机页面变化的过程来使用...

urllib/request爬取百度贴吧图片

weixin_42960052的博客

01-10

366

import re from urllib import request,parse import os # 突破下载函数 def download(img_html): # 正则匹配图片url img_url = re.findall('<img class="BDE_Image" src="(.*?)"',img_html,re.S) # print(img_u...

python3的爬虫算法（2）--下载图片并保存到指定途径

fengzhizi76506的博客

03-02

2479

知道了如何获取网页数据之后，我们来学习一下如何下载图片 import urllib.request import socket import re import sys import os from bs4 import BeautifulSoup targetDir = r"D:\temp\img" #文件保存路径 name = 1 def destFile(path):

urllib库爬取网站图片

ajc_zh的博客

03-06

343

千图网：http://www.58pic.com 首先分析网页结构：第一页：http://www.58pic.com/haibaomoban/0/id-0.html 第二页：http://www.58pic.com/haibaomoban/0/id-1.html … 对每页的图片缩略图分析：缩略图：http://pic. qiant ucdn. com/58pic/23/35/02/53n58...

Python3 urllib 爬取花瓣网图片

SuCicada 小米的蝉

11-15

710

点我去我的github上看源码 **花瓣网是动态的,所以要抓包分析,但我真的累的不行,不想写教程了,我源码里有注释

【Python】urllib爬取动漫图片

我的博客

09-13

884

筛选src里的数据用par =r’<img src="[^"]+.jpg">'可以筛选出带有里面的内容 import urllib.request import re #成功爬取当前页面所有图片地址 html='dasdas <img src="Hello.jpg">adasdassdasdasd<img src="Hello12...

python_urllib入门爬取图片

m0_46525584的博客

12-09

611

有感而发几篇博客： "While we teach we learn " 欢迎提问！会改文件目录的，能直接run----2021.12.09 ''' 2021-12-09 1.框架结构 .0头信息使用了用户代理（未使用ip代理） .1爬取主页获得图片大类类别名称，并写入5.天堂图片网url爬取(目录).txt .2根据拿出的名称获得其下的图片小类类别名称及url，并追加写入6.天堂图片网url爬取(分目录).txt .3 ''' import time from urllib import reque

Python使用urllib工具抓取图片

panda_225400的博客

11-03

709

文章目录前言一、urllib是什么？二、使用步骤1.引入库2.解析数据3.出现问题总结前言使用urllib.urlretrieve(url,filename)时经常遇到下载到一半时，出现urllib.ContentTooShortError错误。为什么呢一、urllib是什么？ Urllib是python内置的HTTP请求库包括以下模块 urllib.request 请求模块 urllib.error 异常处理模块 urllib.parse url解析模块 urllib.robotparser

Python3+urllib爬取海量精美图片

xiaojiawen的博客

03-05

907

下载Python3：https://www.python.org/ 安装的时候记得勾选添加环境变量本代码参考了网上的一些教程，我又根据自己的理解简化了代码： import re,os,time import urllib.request os.mkdir('mm') os.chdir('mm') #请求头 head={} head['User-Agent']='Mo...

python爬虫实践2：用urllib.request爬取天气网的图片

qq_24601279的博客

12-23

295

上一个爬虫用的是打开浏览器的模式去爬取数据，执行效率是比较低下的。如果不同浏览器去爬，应该怎样获取想要的数据呢？这里需要用到urllib.request的方法，并结合正则表达式。 # -- coding: utf-8 -- from urllib import request import re #获取url对应的HTML源码 url = 'http://p.weather.com.cn/201...

python爬虫爬取彼岸图网

09-08

您可以使用Python来编写一个爬虫程序来爬取彼岸图网的图片。下面是一个简单的示例代码： ```python import requests from bs4 import BeautifulSoup import os def download_images(url, save_path): response = ...