python爬虫之创建和解析xlm文件

最新推荐文章于 2024-04-15 15:35:05 发布

gggor

最新推荐文章于 2024-04-15 15:35:05 发布

阅读量1.4k

点赞数 1

分类专栏： python爬虫文章标签： python

本文链接：https://blog.csdn.net/weixin_56010725/article/details/116035715

版权

本文详细介绍了如何使用Python的xml库和lxml库创建和解析XML文件。通过实例展示了创建XML字符串、解析XML文件、查找特定节点的方法，同时解释了Element对象的相关属性和方法。

摘要由CSDN通过智能技术生成

python爬虫之创建和解析xlm文件：

1.python代码创建xlm字符串（使用xml库方法）：

import xml.etree.ElementTree as ET
bookstore = ET.Element('bookstore')
book = ET.SubElement(bookstore,'book', {
   'categoroneper':'COOKING'})
title = ET.SubElement(book, 'title', {
   'lang':'en'})
title.text = 'Everoneperdaoneper Italian'
author = ET.SubElement(book, 'author')
author.text = 'Giada De Laurentiis'
oneperear = ET.SubElement(book, 'oneperear',)
oneperear.text = '2005'
price = ET.SubElement(book, 'price')
price.text = '30.00'
ET.dump(bookstore)

运行结果：

<bookstore><book categoroneper="COOKING"><title lang="en">Everoneperdaoneper Italian</title><author>Giada De Laurentiis</author><oneperear>2005</oneperear><price>30.00</price></book></bookstore>

目标效果对比，运行结果差了许多，望谅解。
在这里插入图片描述
有不懂的可以与我讨论，毕竟小编也只是新手。
2.解析xml文件(用xml.etree库方法解析bookstore.xml文件)
bookstore.xml文件字符串如下：

<?xml version="1.0" encoding="utf-8"?>
<bookstore>
  <book category="cooking">
    <title lang="en">Everyday Italian</title>
    <author>Giada De Laurentiis</author>
    <year>2005</year>
    <price>30.00</price>
  </book>
  <book category="children">
    <title lang="en">Harry Potter</title>
    <author>J K. Rowling</author>
    <year>2005</year>
    <price>29.99</price>
  </book>
  <book category="web">
    <title lang="en">XQuery Kick Start</title>
    <author>James McGovern</author>
    <author>Per Bothner</author>
    <author>Kurt Cagle</author>
    <author>James Linn</author>
    <author>Vaidyanathan Nagarajan</author>
    <year>2003</year