使用xpath进行匹配
在今天的学习中,使用xpath进行匹配内容
被匹配的内容是百度的百度百科部分内容
打开网页的检查,查找我们所匹配的内容标签:
我们想要匹配到红框内的内容,使用xpath进行匹配,查看了这个源码将源码copy为text,写进程序中:
#coding=utf-8
from lxml import etree
text='''
'''#百度的百度百科的源码
r=etree.HTML(text)
a=r.xpath('//div [@class="lemma-summary"]/div [@class="para"]/text()')
print(a)
输出结果:
是很长的一段列表,不方便看,将列表转换为字符串:
a=r.xpath('//div [@class="lemma-summary"]/div [@class="para"]/text()')
s=''.join(a)
print(s)
得到相应的匹配结果!
继续学习