今天在爬一个iP网站时候遇到了问题
网站链接:https://www.xicidaili.com/nt/
首先可以确定用requests访问是成功的
这个是遍历table标签版本的代码
结果如下图
以列表形式的返回值,但是在这个列表中第一个元素是一个空列表,请问如何在for循环中设定从第二个元素开始循环,从而跨过这个空列表元素。
这是因为,接下来需要把有内容的列表元素(列表中的列表的元素)按角标的方式提取出来(类似这种tds[3].string)
但是因为大列表第一个元素是个空列表,就报错,超出了范围,求如何处理???
第二个问题就是,当我选择使用在tbody标签中而非table中进行遍历时,为何soup.find('tbody')children:这一句报错
我看了一下,好像是因为tbody是空的,但是我检查了网页代码,是table里面包含了tbody,tbody里面又有tr等标签
也就是我判断tbody中是有内容的,为何返回空
(不知道我这种想法是否正确)
当我们们把代码中的table换位tbody时
发生错误
单独选取了tbody标签打印也是空列表
还请知道的大神在评论里讲解一下,谢谢,谢谢,谢谢!!!