花瓣网爬虫Python

 花瓣主页

 可爱头像

 F12查看源码 script脚本中有很多链接

果然放的是宝宝图片

正则表达式匹配,get地址,大功告成。

 

import urllib.request  
import re  
import os  

dir = "E:/space/python/Request/huaban/pic/"
url_re=re.compile(r'"(https://img2..+?)"')   
url='https://huaban.com/explore/ertongtouxiang/' 

def url_open(url):  
    html=urllib.request.urlopen(url).read()  
    return html  

def get_img_adds(html):  
    img_addrs=url_re.findall(html)  
    img_addrs=list(set(img_addrs)) 
    return img_addrs  

def save_img(dir,img_addrs,filename=0):  
    for each in img_addrs:  
       print("正在下载" + str(filename) + ".jpg") 
       with open(dir + str(filename)+'.jpg','wb') as f:  
           filename+=1  
           img=url_open(each)  
           f.write(img)  

def download_huaban_img():
 foler = os.path.exists(dir)
 if not foler:     
    os.mkdir(foler)  
    os.chdir(foler)  
 html=url_open(url)  
 img_addrs=get_img_adds(html.decode('utf-8'))  
 save_img(dir,img_addrs)  

if __name__=='__main__':  
    download_huaban_img()  

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值