关于python爬虫的几个问题,请知道的讲解一下!!

今天在爬一个iP网站时候遇到了问题

网站链接:https://www.xicidaili.com/nt/

首先可以确定用requests访问是成功的

这个是遍历table标签版本的代码

结果如下图

以列表形式的返回值,但是在这个列表中第一个元素是一个空列表,请问如何在for循环中设定从第二个元素开始循环,从而跨过这个空列表元素。

这是因为,接下来需要把有内容的列表元素(列表中的列表的元素)按角标的方式提取出来(类似这种tds[3].string)

但是因为大列表第一个元素是个空列表,就报错,超出了范围,求如何处理???

 

第二个问题就是,当我选择使用在tbody标签中而非table中进行遍历时,为何soup.find('tbody')children:这一句报错

我看了一下,好像是因为tbody是空的,但是我检查了网页代码,是table里面包含了tbody,tbody里面又有tr等标签

也就是我判断tbody中是有内容的,为何返回空

(不知道我这种想法是否正确)

当我们们把代码中的table换位tbody时

发生错误

单独选取了tbody标签打印也是空列表

还请知道的大神在评论里讲解一下,谢谢,谢谢,谢谢!!!

  • 2
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 5
    评论
评论 5
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值