全网代理IP,IP信息爬取

反击爬虫,前端工程师的脑洞可以有多大?

尝试上述文章中的全网IP的IP地址爬取。


使用网页分析工具可以发现,网页上隐藏了所有 p 标签中 style属性为display: none;的标签。

想要获取正确的IP地址文本,需要将所有属性值为 display: none;的标签删除。

可以使用 BeautifulSoup 的 extract 功能实现该功能。


for i,td_item in enumerate(td_soup):
    if i ==0:
        del_list = [s.extract() for s in td_item.find_all('p', attrs={'style': 'display: none;'})]
    print(td_item.text)

删除需要隐藏的标签后,直接获取各td标签下的文本,就可获取正确的IP信息






  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值