1.如何获取response的cookie
Header[] cookie = response.getHeaders("Set-Cookie");
System.out.println("--->" + cookie.length);
2.从网上抓取的文献标题,可能含有很多非法字符(对于文件名来说非法) 。在windows中文件名中不能有,所以的java中要过滤掉文件名中的这些字符,
代码如下:
public static String filterCharForFilename(String filename){
//特别注意掉如何过滤反斜杠\,在正则中必须写成\\\\这样才能过滤
String regEx="[\\\\/:*?\"<>|]";
Pattern p = Pattern.compile(regEx);
Matcher m = p.matcher(filename);
return m.replaceAll("").trim();
}
public static void main(String args[]) throws IOException, FileNotFoundException{
String s="中国:一个正在*发展/崛起的国家:\\亚洲的荣和\"辱?\"<中国白皮书|宣言>";
System.out.println(s);
System.out.println(StringTool.filterCharForFilename(s));
}
运行结果: