Python爬取照片

具体分析可以查看我的这篇文章

import urllib.request
from bs4 import BeautifulSoup
import re
import requests

# 影片图片的链接
findImgSrc=re.compile(r'<img alt=".*?".src="(.*?)"/>',re.S)    # re.S忽略换行符


def getData(baseurl):
    html=askURL(baseurl)    #一个页面的html
    # 解析每一个html
    data = []  # 保存每一个电影的信息
    soup=BeautifulSoup(html,'html.parser')
    for item in soup.findAll('img'):

        item=str(item)
        imgSrc=re.findall(findImgSrc,item)     #添加图片
        data.append(imgSrc)

    return data


# 得到一个指定的url网页内容
def askURL(url):
    head={  # 模拟成浏览器,伪装,反扒机制
        'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/91.0.4472.114 Safari/537.36'
    }
    request=urllib.request.Request(url,headers=head)
    html=""
    try:
        response=urllib.request.urlopen(request)
        html=response.read().decode('utf-8')
    except urllib.error.URLError as e:
        if hasattr(e,'code'):
            print(e.code)
        if hasattr(e,'reason'):
            print(e.reason)
    return html



# 保存信息
def saveDate(datalist):

    for item in datalist:
        file_name=str(item[0]).split('/')[-1]
        response=requests.get(item[0])
        with open(file_name,'wb') as f:
            f.write(response.content)

def main():

    # 1.爬取网页
    datalist=getData("https://www.bizhizu.cn/nvsheng/qcka/")
    # 2.保存路径
    # 3.保存数据
    saveDate(datalist)

main()

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值