我的爬虫学习
xpath使用text()失效
今天分析网页的时候,想用xpath获取一下一页里每一个二级url的标题,发现xpath写的没错,不写xpath之前也能得到标题,当然是用谷歌里的xpath插件(非常好用),然后发现加上text()之后就显示不出来了,变成了
然后就百度各种答案,再分析了下网页源码,发现竟然是这么写的网页源码
竟然是这么写的,这程序员是不是太闲了还是有这种类似的算法可以整成这个伢子??我说text()不行呢,遇到这种问题,可以改一改xpath而不用谷歌自带的copy xpath,然后就能得到
再用
a = html_1.xpath('你的xpath')
b = ''.join(a)
b就能得到连续的一个标题。