python获取的html转换为json,python读取XML格式文件并转为json格式

XML文件如下:

红楼梦书名>

曹雪芹作者>

描述贾宝玉和林黛玉的爱情故事主要内容>

人民文学出版社出版社>

图书>

一、python读取XML格式文件代码:

import xml.sax

import xml.sax.handler

class BooksHander(xml.sax.ContentHandler):

def __init__(self):

self.CurrentData=""

self.name=""

self.author=""

self.contents=""

self.press=""

def startElement(self,tag,attributes):

self.CurrentData=tag

if tag =="图书":

print("--------内容--------")

def endElement(self,tag):

if self.CurrentData=="书名":

print("书名:",self.name)

elif self.CurrentData=="作者":

print("作者:",self.author)

elif self.CurrentData=="主要内容":

print("主要内容:",self.contents)

elif self.CurrentData=="出版社":

print("出版社:",self.press)

self.CurrentData = ""

def characters(self,conten):

if self.CurrentData=="书名":

self.name=conten

elif self.CurrentData=="作者":

self.author=conten

elif self.CurrentData=="主要内容":

self.contents=conten

elif self.CurrentData=="出版社":

self.press=conten

if __name__ == '__main__':

parser=xml.sax.make_parser()

parser.setFeature(xml.sax.handler.feature_namespaces,0)

Handler=BooksHander()

parser.setContentHandler(Handler)

parser.parse("图书.xml")

二、将XML格式转换成json格式文件

import xmltodict

import json

xml=open('图书.xml','r',encoding='UTF-8')

xml_str=xml.read()

xml_json=xmltodict.parse(xml_str)

xml_json=json.dumps(xml_json,indent=4)

with open('图书.json','w') as f:

f.write(xml_json)

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值