首先,零基础得就收藏把,留着以后好看,现在你也看不懂。
第一个问题
提取出来,多了个空格,解决方法
1,
加 normalize-space 这种直接在列表状态下就可以去掉
html.xpath('normalize-space(//div//tr/td[@class="inquiry_intitleb"]/span/text())')
2,
转列表为字符串,用strip。
company_namel=html.xpath('/html/body/div[1]/div/div/table/tbody/tr[4]/td[1]/text()')
uniscidd = ''.join(company_namel)
company_name= uniscidd.strip()
第二个问题
定位正确,但缺空。
解决
在text前多家个/ ------------
('//tr[position()=4]/td[4]/text()')
('//tr[position()=4]/td[4]//text()')
第三种
1,
我也是刚学得
html.xpath('//td[contains(text(),"经济类型")]/following-sibling::td[1]//text()')
可以通过父链接名来定位子链接
这两个是变动得,其他得不变
2,
通过这个 position() 来定位
取tr(父标签)td(子标签)
取第四条tr下得第一条td
最后,觉得写的还不错得,记得三连,评论,点赞,留言。
关注本人公众号,获取面试题,以及面试经验。