玩转xpath,以及解决出现得问题--------------爬虫

首先,零基础得就收藏把,留着以后好看,现在你也看不懂。

第一个问题
在这里插入图片描述
提取出来,多了个空格,解决方法
1,
加 normalize-space 这种直接在列表状态下就可以去掉

html.xpath('normalize-space(//div//tr/td[@class="inquiry_intitleb"]/span/text())')

2,
转列表为字符串,用strip。

company_namel=html.xpath('/html/body/div[1]/div/div/table/tbody/tr[4]/td[1]/text()')
uniscidd = ''.join(company_namel)
company_name= uniscidd.strip()

第二个问题
定位正确,但缺空。
在这里插入图片描述
解决
在text前多家个/ ------------

('//tr[position()=4]/td[4]/text()')
('//tr[position()=4]/td[4]//text()')

第三种
1,
我也是刚学得

html.xpath('//td[contains(text(),"经济类型")]/following-sibling::td[1]//text()')

可以通过父链接名来定位子链接

在这里插入图片描述这两个是变动得,其他得不变
2,
通过这个 position() 来定位
取tr(父标签)td(子标签)
在这里插入图片描述
取第四条tr下得第一条td

最后,觉得写的还不错得,记得三连,评论,点赞,留言。

关注本人公众号,获取面试题,以及面试经验。
在这里插入图片描述

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 4
    评论
评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

风启新尘

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值