提取html文件中的数据

最新推荐文章于 2024-04-23 09:53:57 发布

0点51胜

最新推荐文章于 2024-04-23 09:53:57 发布

阅读量1.5k

点赞数 1

分类专栏： python

本文链接：https://blog.csdn.net/dss875914213/article/details/105071972

版权

python 专栏收录该内容

96 篇文章 3 订阅

订阅专栏

# 解析xml文件读取数据
# 将str转换为list
# 将list转换为matrix
# 将matrix每个元素从str转换为int
from xml.dom.minidom import parse
import numpy as np
import matplotlib.pyplot as plt


def readXML(mystr="depthImg190"):
    domTree = parse("./%s.xml"%mystr)
    # 文档根元素
    rootNode = domTree.documentElement
    print(rootNode.nodeName)

    depthImg190 = rootNode.getElementsByTagName(mystr)
    for depthImg in depthImg190:
        if depthImg.hasAttribute("type_id"):
            print("type_id:", depthImg.getAttribute("type_id"))
            # data 元素
            data = depthImg.getElementsByTagName("data")[0]
            # print(data.nodeName, ":", data.childNodes[0].data)
        return data.childNodes[0].data


if __name__ == '__main__':
    rawData = readXML("depthImg212")
    data = rawData.split()

    myList = np.array(data)
    print(len(myList))
    myMatrix = np.resize(myList,(320,240)).astype(int)
    print(myMatrix)
    plt.matshow(myMatrix)
    plt.show()

测试文件需要的可以下载测试一下跑通了再改成自己的html文件测试
文件里面内容
目的：提取data里面的数据
步骤：
1.使用 parse 解析html文件
2.提取文档根元素在这里插入图片描述
应该是这个里面的数据
3. depthImg190 = rootNode.getElementsByTagName(mystr)

提取这个里面的数据，只看左边一部分
4.if depthImg.hasAttribute(“type_id”)
判断上图右边的属性
4. data = depthImg.getElementsByTagName(“data”)[0]
提取data里面的数据

0点51胜

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
提取html文件中的数据

# 解析xml文件读取数据# 将str转换为list# 将list转换为matrix# 将matrix每个元素从str转换为intfrom xml.dom.minidom import parseimport numpy as npimport matplotlib.pyplot as pltdef readXML(mystr="depthImg190"): domTre...
复制链接

扫一扫