Xpath实战二：下载百度贴吧的照片

最新推荐文章于 2024-07-27 23:40:19 发布

悦来客栈的老板

最新推荐文章于 2024-07-27 23:40:19 发布

阅读量1.6k

点赞数

分类专栏： Python，爬虫文章标签： Python爬虫

本文链接：https://blog.csdn.net/qq523176585/article/details/78524165

版权

Python，爬虫专栏收录该内容

57 篇文章 19 订阅

订阅专栏

#coding=utf-8  
import requests
import urllib.request
from lxml import etree

def getHtml(url):  
    page = requests.get(url)  
    html =page.text  
    return html

def getImg(html):
    html = etree.HTML(html)
    img_info = html.xpath('//img[@class = "BDE_Image"]//@src') #照片链接都在img标签下，先定位BDE_Image，再@src，即可获取所有图片链接
    for index,img in enumerate(img_info,1):
        print ("正在下载第{}张图片".format(index))
        urllib.request.urlretrieve(img,'%s.jpg' % index)  
        
if __name__=='__main__':
    url = "https://tieba.baidu.com/p/5113603072"
    html = getHtml(url)
    getImg(html)

    print ("OK!All DownLoad!")