提取html文件中的数据

# 解析xml文件读取数据
# 将str转换为list
# 将list转换为matrix
# 将matrix每个元素从str转换为int
from xml.dom.minidom import parse
import numpy as np
import matplotlib.pyplot as plt


def readXML(mystr="depthImg190"):
    domTree = parse("./%s.xml"%mystr)
    # 文档根元素
    rootNode = domTree.documentElement
    print(rootNode.nodeName)

    depthImg190 = rootNode.getElementsByTagName(mystr)
    for depthImg in depthImg190:
        if depthImg.hasAttribute("type_id"):
            print("type_id:", depthImg.getAttribute("type_id"))
            # data 元素
            data = depthImg.getElementsByTagName("data")[0]
            # print(data.nodeName, ":", data.childNodes[0].data)
        return data.childNodes[0].data


if __name__ == '__main__':
    rawData = readXML("depthImg212")
    data = rawData.split()

    myList = np.array(data)
    print(len(myList))
    myMatrix = np.resize(myList,(320,240)).astype(int)
    print(myMatrix)
    plt.matshow(myMatrix)
    plt.show()

测试文件 需要的可以下载测试一下 跑通了再改成自己的html文件测试
文件里面内容
目的:提取data里面的数据
步骤:
1.使用 parse 解析html文件
2.提取文档根元素 在这里插入图片描述
应该是这个里面的数据
3. depthImg190 = rootNode.getElementsByTagName(mystr)
在这里插入图片描述
提取这个里面的数据,只看左边一部分
4.if depthImg.hasAttribute(“type_id”)
判断上图右边的属性
4. data = depthImg.getElementsByTagName(“data”)[0]在这里插入图片描述
提取data里面的数据

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值