功能: element对象转化成str, 并使用正则替换HTML标签, 保留内容, 非贪婪模式
def string_process(element):
string = etree.tostring(element, encoding='utf-8').strip().decode('utf-8')
return re.sub('<[^>]*>', '', string).strip()
功能: element对象转化成str, 并使用正则替换HTML标签, 保留内容, 非贪婪模式
def string_process(element):
string = etree.tostring(element, encoding='utf-8').strip().decode('utf-8')
return re.sub('<[^>]*>', '', string).strip()