简单爬取百度贴吧中的美图

  1. 最近再看贴吧的壁纸吧的时候发现了好多自己喜欢的壁纸,
    这里写图片描述
    2.右键图片,选择检查,可以看到我们要爬取的图片的class都为:’BDE_Image’,如图:
    这里写图片描述
    3接下来便可以调用beautifulsoup类进行匹配了,爬取了
    附上代码:

    #coding:utf-8
    import urllib
    from bs4 import BeautifulSoup//导入beautiful包
    
    url='https://tieba.baidu.com/p/4645322258'//我们要爬取的网页
    webpage=urllib.urlopen(url);
    webcontent=webpage.read();//读出html代码
    soup = BeautifulSoup(webcontent,'lxml')
    imgTags=soup.find_all('img',{'class':'BDE_Image'})//我们爬取的网页的类
    x=0;
    for imgtag in imgTags:
        pic_url=imgtag['src']
        urllib.urlretrieve(pic_url,'d:\\crawler\\%s.jpg' % x)//下载图片到D盘clawler文件夹中
        x+=1
    
    print soup.title
    

    4.结果:
    这里写图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值