爬图片的方法

# coding=utf-8
import requests
from bs4 import BeautifulSoup

headers = {
'user-agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_13_1) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/62.0.3202.94 Safari/537.36'
}

 

#获取下载链接后,下载图片的函数 

这里可以看我的这篇有说  https://www.cnblogs.com/kaibindirver/p/9950498.html
def download_file(url):
  print('Downding %s' %url)
  local_filename = url.split('/')[-1]
  r = requests.get(url, stream=True, headers=headers)
  with open(local_filename, 'wb') as f:
    for chunk in r.iter_content(chunk_size=1024):
      if chunk:
        f.write(chunk)
        f.flush()
  return local_filename

url = 'http://jandan.net/drawings'
soup = BeautifulSoup(requests.get(url, headers=headers).text, 'html.parser') #套路格式化网页

 

#src链接要符合下面要求
def valid_img(src):
  return src.endswith('jpg') and 'img.jandan.net' in src

#获取下载链接
for img in soup.find_all('img', src=valid_img):
  src = img['src']
  if not src.startswith('http'):
    src = 'http:' + src
  download_file(src)

 

转载于:https://www.cnblogs.com/kaibindirver/p/9951288.html

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值