视觉中国的图片下载

import time
import urllib
import os
import re
from bs4 import BeautifulSoup
import requests
# from urllib.request import urlretrieve
headers = {
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/92.0.4515.159 Safari/537.36',
    'Accept-Encoding': 'gzip, deflate, br',
    'Cookie': 'gr_user_id=546172fa-e41a-435a-ae8b-03aa14a54b8b; acw_tc=2760821c16369652778958602e88299a0b9105bad593d33d8f74a59d6aafd2; JSESSIONID=2F2C2EAC9086E016E94F07278A3C9CC1; gr_session_id_9311c428042bb76e=984df283-4b7b-4f25-a9d5-b9d5fb0ab693; gr_session_id_9311c428042bb76e_984df283-4b7b-4f25-a9d5-b9d5fb0ab693=true'
}


def mkdir(path):
    '''
    创建指定的文件夹
    :param path: 文件夹路径,字符串格式
    :return: True(新建成功) or False(文件夹已存在,新建失败)
    '''
    # 引入模块
    import os

    # 去除首位空格
    path = path.strip()
    # 去除尾部 \ 符号
    path = path.rstrip("\\")

    # 判断路径是否存在
    # 存在     True
    # 不存在   False
    isExists = os.path.exists(path)

    # 判断结果
    if not isExists:
        # 如果不存在则创建目录
        # 创建目录操作函数
        os.makedirs(path)
        print(path + ' 创建成功')
        return True
    else:
        # 如果目录存在则不创建,并提示目录已存在
        print(path + ' 目录已存在')
        return False


def reqAndDownload1():
    url = "https://www.vcg.com/sets/ziranfengguang-1/"
    # 发送get请求,请求到的数据字典
    response = requests.get(url, headers=headers)
    soup = BeautifulSoup(response.text, 'html.parser')
    title = soup.select('.big')
    folder = './视觉中国/自然风光/'
    mkdir(folder)
    for index, item in enumerate(title):
        style = item.attrs['style']
        pt = r"url\('(.*)'\)"
        opt = re.findall(pt, style)
        imgUrl = 'https:' + opt[0]
        imgName = os.path.basename(imgUrl)
        print(imgName, '下载中...', sep='\t', end='\t', flush=True)
        r = requests.get(imgUrl, headers=headers)
        with open(folder+imgName, 'wb') as f:
            f.write(r.content)
            print('下载完成')


def reqAndDownload2():
    url = "https://www.vcg.com/sets/522061344"
    # 发送get请求,请求到的数据字典
    response = requests.get(url, headers=headers)
    soup = BeautifulSoup(response.text, 'html.parser')
    title = soup.select('.imgWaper img')
    folder = './视觉中国/2022二季度创意图片——热门TOP100/'
    mkdir(folder)
    for index, item in enumerate(title):
        src = item['src']
        imgUrl = 'https:' + src
        imgName = os.path.basename(imgUrl)
        print(imgName, '下载中...', sep='\t', end='\t', flush=True)
        r = requests.get(imgUrl, headers=headers)
        with open(folder+imgName, 'wb') as f:
            f.write(r.content)
            print('下载完成')


def reqAndDownload3():
    print('下载中...',  end='\t')
    img_url = 'https://alifei01.cfp.cn/cms/image/image/54965dde906d4542a8a806434fac174e.jpg?x-oss-process=image/format,webp'
    urllib.request.urlretrieve(img_url, '1.jpg')
    print('下载完成')


# reqAndDownload1()
reqAndDownload2()
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
这是视觉中国官方(shijue.me)提供的扩展,可以让你浏览网站时方便分享或收藏喜欢的图片,扩展提供了鼠标右键单击分享、网页截图到视觉中国(shijue.me)上的快捷功能。 视觉中国图片分享工具 这是视觉中国官方(shijue.me)提供的扩展,可以让你浏览网站时方便分享或收藏喜欢的图片,扩展提供了鼠标右键单击分享、网页截图到视觉中国(shijue.me)上的快捷功能。 “shijue.me 视觉中国”是中国最具活力的视觉图片分享社区及创意设计产品社会化电商平台。依托独特的创意生态理论,为原创者和消费者提供一个互动沟通的社区,发现原创、发现美丽,收获并分享美好的创意体验。 秉承了优质的创意资源和纯正的社区血脉,全新的“shijue.me 视觉中国”愿意和您一起,用创意和想象力,重新发现一个美丽的新世界! 这里是一个关于灵感和创意的好玩的全栖互动社区,你可以在里: 分享好看的图片找到品味同好、发表原创的作品获得更多成名的机会、编辑精彩的内容和大家分享你的奇闻乐事;上传你的奇思妙想,便可以在这里找到从前期到最终、从灵感到最终的盈利的所有通经,我们帮你将它变成商品,并通过为你铺设好的渠道实现盈利;你可以买到充满创意的原创产品,并可以和它的设计师进行互动;你还可以在这里找到很多趣味相投的朋友,组合线下聚会活动;这里更是一个显现企业和品牌形象的地方。总之只要是和视觉创意有关的想法,都可以在这里找到归属! == cvshare - 1.0.5 released 2012/11/04 - 修复标签分享,重复的bug. == cvshare - 1.0.4 released 2012/10/22 - 修复截图分享,URL编码bug - 新增截图分享后,查看按钮功能 == cvshare - 1.0.0 released 2012/10/20 - 鼠标右键分享功能 - 网页标签分享功能 - 多(组)图分享功能 - 网页可视区域、区域选择、整个网页截图分享功能 支持语言:English,中文 (简体)
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值