【图片框架格式】——python

最新推荐文章于 2024-08-07 17:42:24 发布

我是秃头小宝贝儿

最新推荐文章于 2024-08-07 17:42:24 发布

阅读量93

点赞数 1

文章标签： python 爬虫

本文链接：https://blog.csdn.net/weixin_53713025/article/details/119962191

版权

关于图片的格式写法，很简单，更改套用数据即可

import requests
from lxml import html        #没有的用这个,要带上第八行提一下etree使用
#from html import etree     版本有etree的用这个


url = '....'  #换个rul  爬取的网站
headers = {'...'}  #用户登录的

et = html.etree   #有的不需要，现在的格式html的没etree的模块，转化一下
response =requests.get(url=url,headers=headers)   #发送请求
response.encoding='gb2312'    #网页的编码

html = et.HTML(response.text)    #获得到的数据转成text的格式，文本格式
img_list = html.xpath('//....')         #xpath方法，

# 以下属于数据解析，xpath BS4 RE  哪个好用用哪个
for img_data in img_list:
    img_url= img_data.xpath('./....')[0]
    #img_url= img_url.split('?')[0]     #split切割，从？后都删除
    img_name = img_data.xpath('./....')[0]
    new_url= 'https://'+(img_url[2:img_url.rfind('')])   # 获得的url从第二个开始

    #保存图片
    img = requests.get(new_url)
    with open('./image/%s.jpg' %img_name, 'wb') as file:
         file.write(img.content)    #二进制方式保存

    print('%s下载成功' %img_name)

我是秃头小宝贝儿

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
【图片框架格式】——python

关于图片的格式写法，很简单，更改套用数据即可import requestsfrom lxml import html #没有的用这个,要带上第八行提一下etree使用#from html import etree 版本有etree的用这个url = '....' #换个rul 爬取的网站headers = {'...'} #用户登录的et = html.etree #有的不需要，现在的格式html的没etree的模块，转化一下respon...
复制链接

扫一扫