爬取图片并下载

最新推荐文章于 2023-10-22 12:00:00 发布

阿祺的阿铖呀

最新推荐文章于 2023-10-22 12:00:00 发布

阅读量140

点赞数

分类专栏： Python爬虫文章标签： python

本文链接：https://blog.csdn.net/m0_48176011/article/details/112452926

版权

Python爬虫专栏收录该内容

8 篇文章 1 订阅

订阅专栏

import os
from urllib.request import urlretrieve
from urllib.request import Request, urlopen
import bs4

url='https://www.sohu.com/a/286956359_301394'
header = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/84.0.4147.105 Safari/537.36'}
ret = Request(url=url, headers=header)
html = urlopen(ret)
bs = bs4.BeautifulSoup(html, 'html.parser')
# allinfos=bs.find_all('article', {'class': "article"})
i=1
for link in bs.find('article',{'class':{'article'}}).find_all('img'):

    links=link.attrs['src']
    # url1=links
    dir=os.path.abspath('C:\\Users\\user\\PycharmProjects\\pythonProject\\pict\\')
    work_path=os.path.join(dir,str(i)+'.jpg')
    urlretrieve(links,work_path)
    i+=1