爬虫实战11：爬取aiss图片并保存

最新推荐文章于 2024-01-08 01:30:37 发布

shifanfashi

最新推荐文章于 2024-01-08 01:30:37 发布

阅读量2.3w

点赞数 1

分类专栏：爬虫实战爬虫实战文章标签：爬虫实战

本文链接：https://blog.csdn.net/shifanfashi/article/details/90320464

版权

爬虫实战同时被 2 个专栏收录

30 篇文章 8 订阅

订阅专栏

爬虫实战

29 篇文章 6 订阅

订阅专栏

import requests
import bs4
import urllib.request

url = "http://www.ligui.org/aiss/"
headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/71.0.3578.80 Safari/537.36'}


def get_page():
    response = requests.get(url, headers=headers)
    html = response.text
    return html

def page_parse(html):
    soup = bs4.BeautifulSoup(html, 'lxml')
    imgs = soup.find('ul', class_='img')
    imgs_list = imgs.find_all('li')
    i = 1
    for img_list in imgs_list:
        img = img_list.find('a').find('img')['src']
        urllib.request.urlretrieve(img,'G:\python\爬虫实战\images\\' + str(i) + '.png')
        i += 1


def main():
    html = get_page()
    page_parse(html)

if __name__ == '__main__':
    main()

shifanfashi

关注

1
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
爬虫实战11：爬取aiss图片并保存

import requestsimport bs4import urllib.requesturl = "http://www.ligui.org/aiss/"headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/7...
复制链接

扫一扫

专栏目录