python爬虫验证和代理

最近在学习这本书时候,基本库的使用中有个关于验证和代理的使用,都先后报了这个错误,[WinError 10061] 由于目标计算机积极拒绝,无法连接。

思路,网上搜索了几个原因。按照操作,无效。后来我想到了,关于验证,我的目的是实现打开一个需要授权的网站,然后输入用户名密码,打开后面的页面。但是python中的代码是打开了http://localhost:5000说明我需要在本地建一个服务器,来使用这个地址。

于是我下载了apache,当作服务器. 但是改变端口为5000后发现无法启动软件。后面检查发现win10的80端口和5000端口都被占用了。
那么就解释了为什么目标计算机积极拒绝的原因了。是这个地址一开始就不能使用的。关闭端口后,重新运行,可以打开测试页面。 当然我还是没有实现验证的功能,但是解决了我的疑惑。因为那样的话需要我在本地创建一个建议网站,模拟验证。偷个懒。。。。。

紧接着是代理,这个使用本机做一个正向代理,依旧是使用apache实现。
参考https://blog.csdn.net/zbuger/article/details/51648048 完成。 就是利用本机作为代理服务器,然后本机通过代理服务器打开百度官网。

附:https://www.cnblogs.com/yerenyuan/p/5460336.html apache详细安装指南,踩了一些坑。

这个是python3网络爬虫开发实战的两个例子,第三章基本库的使用 ,3.1 使用urllib 关于代理和验证的内容。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值