python 爬取西刺免费代理ip 并使用telnetlib.Telnet验证是否有效

最近运行使用时间2017.12.01

运行结果正常

运行环境python.27

#coding:utf8
from bs4 import BeautifulSoup
import urllib2
import sys
reload(sys)
import telnetlib



def getProxyList(targeturl="http://www.xicidaili.com/nn/"):
    # 创建变量查看爬取IP数量
    countNum=0
    # 创建打开txt文件
    proxyFile=open('ip_port.txt','a')
    
    # 设置报头
    requestHeader={"User-Agent":"Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:56.0) Gecko/20100101 Firefox/56.0"}
    
    # 爬取前五页
    for page in range(1,5):
        url=targeturl+str(page)
        print(url)
        request=urllib2.Request(url,headers=requestHeader)
        html_doc=urllib2.urlopen(request).read()
        
        # 使用bs4匹配
        soup=BeautifulSoup(html_doc,
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值