爬虫自动化-代理Ip获取

最新推荐文章于 2020-04-24 18:31:04 发布

HKO

最新推荐文章于 2020-04-24 18:31:04 发布

阅读量223

点赞数

分类专栏： Python

本文链接：https://blog.csdn.net/huangjinghao1/article/details/102773263

版权

Python 专栏收录该内容

7 篇文章 0 订阅

订阅专栏

在这里插入图片描述

from selenium import webdriver
import requests,time
from bs4 import BeautifulSoup
def url_open(url,a):
    e=1
    driver=webdriver.Firefox()
    driver.implicitly_wait(1)
    driver.get(url)
    while(True):
        html=driver.page_source
        soup=BeautifulSoup(html,'lxml')
        soup1=soup.select('tr[class="odd"],tr[class=""]')
        e+=1
        #print(soup1)
        for i in soup1:
            #print(i.text)
            i=i.text.split()[0]+':'+i.text.split()[1]+'    '+i.text.split()[4]
            if('HTTPS'in i ):
                print(i)
        driver.find_element_by_class_name('next_page').click()
        time.sleep(2)
        if(e>a):
            break
if __name__=='__main__':
    url='http://www.xicidaili.com/nn'
    a=int(input('请输入你要下载的页数：'))
    url_open(url,a)

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

HKO

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
爬虫自动化-代理Ip获取

from selenium import webdriverimport requests,timefrom bs4 import BeautifulSoupdef url_open(url,a): e=1 driver=webdriver.Firefox() driver.implicitly_wait(1) driver.get(url) whi...
复制链接

扫一扫