爬虫学习(七)——使用代理服务器进行数据爬取

代理服务器:快代理,西刺代理,阿布云代理,芝麻代理

1.使用代理的时候,可以直接使用浏览器设置就行了。
三个点-》设置-》高级-》打开代理设置-》连接-》局域网设置->w为lan使用代理服务器->输入ip号和端口号即可
2.使用代码进行模拟代理服务器的请求

 

import urllib.request
import random
import time

# 将代理读进来
fp = open( "pool.txt", "r", encoding="utf8" )
lt = fp.readlines()
fp.close()
# print(lt)

url = "http://www.baidu.com/s?ie=UTF-8&wd=ip"
# 从代理池中随便抽取一个
while 1:
proxy = random.choice( lt )
proxy1 = proxy.rstrip( "\n" )
print( proxy1 )

daili = {"http": proxy1}
#
print( "现在使用的代理服务器是:%s" % proxy1 )

handler = urllib.request.ProxyHandler( proxies=daili )

opener = urllib.request.build_opener( handler )

try:
response = opener.open( url )
print( "代理服务器%s使用成功" % proxy1 )
with open( "daili1.html", "wb" ) as fp:
fp.write( response.read() )
break
except Exception as e:
print( "代理服务器%s使用失败" % proxy1 )
lt.remove( proxy )
time.sleep( 2 )

 

转载于:https://www.cnblogs.com/kuangkuangduangduang/p/10370772.html

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值