Python爬虫---制作爬取网页图片的爬虫

最新推荐文章于 2021-04-04 22:00:26 发布

qq_43574052

最新推荐文章于 2021-04-04 22:00:26 发布

阅读量246

点赞数

分类专栏： Python 文章标签： Python爬虫

本文链接：https://blog.csdn.net/qq_43574052/article/details/99316462

版权

最近在b站上学习了python基础编程入门，其中比较有意思的是用python写爬虫的项目
代码如下：

import  urllib.request
from bs4 import  BeautifulSoup
import re
import ssl
import  os

def find_img(page_url):

    html = openurl(page_url)
    soup = BeautifulSoup(html, "html.parser")
    pic_addres = []
    for each in soup.find_all(class_=re.compile("lazy")):
        # print(each.attrs['data-original'])
        pic_addres.append(each.attrs['data-original'])
    print('next page')
    return pic_addres

def openurl(url):
    req = urllib.request.Request(url)
    req.add_header('User-Agent','Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/72.0.3626.121 Safari/537.36')

    #使用代理ip
    # proxy_ = urllib.request.ProxyHandler('','')
    # opener = urllib.request.build_opener(proxy_)
    # urllib.request.install_opener(opener)

    response

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

qq_43574052

关注关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
Python爬虫---制作爬取网页图片的爬虫

最近在b站上学习了python基础编程入门，其中比较有意思的是用python写爬虫的项目代码如下：import urllib.requestfrom bs4 import BeautifulSoupimport reimport sslimport osdef find_img(page_url): html = openurl(page_url) soup...
复制链接

扫一扫