python html 中文注释,Python HTML注释不是serializab

我正在尝试解析html页面并保存在数据库中。使用页面的标记创建json。在

一些标记包括类似javascript的

这是正常的标签项目,没有问题。在

^{2}$

但是使用javascript标记时,我遇到了错误{'text': 'IK F uu ph---------------------', 'tag': , 'unqid': '.....'}

这是我的代码:ac = requests.get(url)

html_text = ac.text

lx = html.fromstring(html_text)

...some parsing codes

json.dumps(items).decode('utf-8') --> where I am getting error

错误如下Traceback (most recent call last):

File "main3.py", line 132, in

PageRunner(url)

File "main3.py", line 122, in PageRunner

InsertPageTags(1, url)

File "main3.py", line 58, in InsertPageTags

parameter = (WebsiteID, Url, json.dumps(items).decode('utf-8'))

File "C:\Python27\lib\json\__init__.py", line 244, in dumps

return _default_encoder.encode(obj)

File "C:\Python27\lib\json\encoder.py", line 207, in encode

chunks = self.iterencode(o, _one_shot=True)

File "C:\Python27\lib\json\encoder.py", line 270, in iterencode

return _iterencode(o, 0)

File "C:\Python27\lib\json\encoder.py", line 184, in default

raise TypeError(repr(o) + " is not JSON serializable")

TypeError: is not JSON serializable

如何转储带有注释的html或从html中删除注释?在

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值