urllibrequest爬虫,爬取彼岸图片

  • import urllib.request
    from bs4 import BeautifulSoup
    
    def index(page):
        if page == 1:
            url = 'https://pic.netbian.com/index.html'
        else:
            url = "https://pic.netbian.com/index_{}.html".format(page)
        # url = 'https://pic.netbian.com/index.html'
        headers = {
            'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) '
                          'Chrome/93.0.4577.82 Safari/537.36 '
        }
        w1 = urllib.request.Request(url=url, headers=headers)
        w2 = urllib.request.urlopen(w1).read()
        data = BeautifulSoup(w2, "html.parser")
        ul = data.find("div", class_="slist").find_all("li")
        # print(ul)
        for i in ul:
            n = i.find_all("img")
            for j in n:
                #图片地址
                src = j['src']
                #图片标题
                title = j["alt"].replace(" ", "")
                print(title)
                #拼接
                src1 = "https://pic.netbian.com/" + src
                #print(src1)
                #下载图片
                urllib.request.urlretrieve(url=src1, filename="./image/"+title+".jpg")
    
    #爬取前20页
    for j in range(1, 20):
        index(j)

这是爬取的网页链接最新4K壁纸_最新4K桌面壁纸_彼岸图网

 

图片下载成功

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值