python 3.7爬取彼岸风景栏桌面(2021年6月26日21:21:2)

本文介绍了使用Python 3.7进行简单网页图片爬取的方法,从单张图片到整个栏目,详细展示了最基础的爬虫代码实现。在2021年6月26日21:23:35,作者完成了无需登录验证的爬取过程。
摘要由CSDN通过智能技术生成

问题描述: 从试试一张图片的下载,到单页的图片下载,到单个栏目的下载(代码如下)
基本简单,最粗糙的代码

# 1: 引包
import time
import urllib.request
import re
import os

# 2: 请求得到响应
rootURL = "http://www.netbian.com"
url = "http://www.netbian.com/fengjing/"
response = urllib.request.urlopen(url)

# 3: 获得状态码
print(response.getcode())

# 4: 获取内容并编码
content = response.read().decode("GBK")
imgUrlList = re.finditer('(?<=(<li><a href=")).*?(?=")', content)

urlArr = []
insertStr = "-1920x1080.htm"
for url in imgUrlList:  # 把每张图片的 1920 * 1080 的链接放进数组
    url = url.group()
    if url.find("desk") > 0:
        url = rootURL + url
        tempUrl = url.split(".htm")
        tempUrl.insert(1, insertStr
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值