任意门:Python爬虫系统讲解
Q1
关于代理的事情
1. 从简单的说起——入门就有问题
出现在“分分钟扒一个网页下来”的问题:
运行如教程的代码,结果报错:(在公司使用这段代码)IOError: [Errno socket error] [Errno 10060]
Step 1:当我尝试将url地址换成公司某一内网的时候,我发现这段代码works fine
Step 2:根据评论:
“
You can do it even without the HTTP_PROXY environment variable. Try this sample:
import urllib2
proxy_support = urllib2.