from w3lib.html import remove_tags
#去除html的标签,可用于爬虫处理html
In[32]: remove_tags(u'<span>1000</span>')
Out[32]:u'1000'
Out[33]:
u'€'
Out[34]:
u'1000'
Out[35]:
u'10002432234'
from w3lib.html import remove_tags
#去除html的标签,可用于爬虫处理html
In[32]: remove_tags(u'<span>1000</span>')
Out[32]:u'1000'
u'€'
u'1000'