使用Httpwebrequest采集百度图片,经常会出现403forbidden
采用以下解决办法:
1:增加refer,写https://www.baidu.com 就行了
2:在获得列表时,将cookie保存,
static CookieContainer cookie = new CookieContainer();
...
httpWebRequest.CookieContainer = cookie;
...
cookie.Add(httpWebResponse.Cookies);
这样在下载时,将cookie再送出去
3:如果出现输入验证码,那么载模拟post把验证码发出去(至于验证码是自动识别还是人为看下,就不是本文探讨范围内了)