问题描述
开发过程中,原本使用webmagic爬取网页信息;由于需要html中的个别字段信息;故准备改用restTemplate来获取Html;问题来了,使用restTemplate调用接口的时候发现一直会跳转到登录页;而使用webmagic或者postman调用接口能正常获取信息;
问题定位
初步怀疑cookie设置未生效;跟踪HttpURLConnection代码发现,请求时,网站对请求进行了重定向;那么,就可能是cookie没有跟随重定向;也就是restTemplate没有设置cookie的domain属性功能;
寻求解决方案
借鉴:https://blog.csdn.net/zgahlibin/article/details/83997404
由于开发时间紧张,暂时没有研究通过设置RestTemplate的cookieStore的方式去解决;直接使用了HttpClient来解决该问题
BasicCookieStore cookieStore = new BasicCookieStore();
BasicClientCookie cookie = new BasicClientCookie("sessionId", "76561198175162242");
cookie.setVersion(0);
cookie.setDomain("www.abc.com");
cookie.setPath("/");
cookieStore.addCookie(cookie);
// 有了cookieStore
HttpClientBuilder httpClientBuilder = HttpClientBuilder.create();
// HttpClient
CloseableHttpClient closeableHttpClient = httpClientBuilder.setDefaultCookieStore(cookieStore).build();
HttpGet httpGet = new HttpGet("https://www.abc.com");
// 在cookieStore 中设置了cookie,此处可以不用设置;此处设置的cookie不会跟随重定向
// httpGet.setHeader("Cookie", "sessionId=76561198175162242");
CloseableHttpResponse response = closeableHttpClient.execute(httpGet);
String result = EntityUtils.toString(response.getEntity());
System.out.println(result);
结语
通过研究设置restTemplate的cookieStore来解决的伙伴,希望留下代码,瞻仰瞻仰;