python解析html用哪个模块_python爬虫模块之HTML解析模块

最新推荐文章于 2024-03-14 18:30:00 发布

weixin_39900180

最新推荐文章于 2024-03-14 18:30:00 发布

阅读量90

点赞数

文章标签： python解析html用哪个模块

这个就比较简单了没有什么好强调的，如果返回的json 就是直接按照键值取，如果是网页就是用lxml模块的html进行xpath解析。

from lxml import html

import json

class GetNodeList():

def __init__(self):

self.getdivxpath="//div[@class=‘demo‘]"

def use_xpath(self,source):

if len(source):

root=html.fromstring(source) #html转换成dom对象

nodelist=root.xpath(self.getdivxpath)#对dom对象进行xpath解析

if len(nodelist):

return nodelist

return None

def use_json(self, source,keyname):

if len(source):

jsonstr=json.loads(source)

value=jsonstr.get(keyname) #根据具体的键值修改

if len(value):

return value

return None

原文地址：https://www.cnblogs.com/c-x-a/p/9175124.html

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

关注关注