抓取XML文件中的图片地址并进行下载

  • 最近在安全测试过程中遇到了好多任意文件泄露漏洞,但一个一个修改URL查看很慢,就写了一个Python脚本批量进行下载。
  • 首先是获取每个图片的URL,即地址,其中picture.xml为XML文件。
# encoding:utf-8
import os
import stat
import xml.etree.ElementTree as ET
f=open('picture.txt','a')
nowDir = os.getcwd()  # 得到进程当前工作目录
fileList = os.listdir(nowDir)  # 得到进程当前工作目录中的所有文件名称列表
for fileName in fileList:  # 获取文件列表中的文件
    if fileName.endswith("pictuer.xml"):  # 只看xml文件
        print (fileName)
        tree = ET.parse(fileName)
        root = tree.getroot()
        # 第一层解析
        #print ("root-tag:", root.tag, ',root-attrib:', root.attrib, ',root-text:', root.text)
        # 第二层解析
        for child in root:
            #print ('child-tag:', child.tag, ',child.attrib:', child.attrib, ',child.text:', child.text)
            # 第三层解析
            for sub in child:
                if sub.text.endswith((&#
  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值