from lxml import etree html = etree.HTML(content) # 此时会将content中的html内容标签转换成小写导致使用xpath获取不到元素 原网页元素标签为data-nodeIdPath