- 博客(4)
- 资源 (3)
- 收藏
- 关注
原创 java判断中文编码而后处理中文编码乱码问题
###先对返回的结果进行编码判断,可采用简单的编码函数进行:public static String getEncoding(String str) { String encode = "GB2312"; try { if (str.equals(new String(str.getBytes(encode), encode))) {
2017-07-18 21:12:59 1792
原创 java正则匹配返回所有匹配项
List getMatchers(String regex, String source){ Pattern pattern = Pattern.compile(regex); Matcher matcher = pattern.matcher(source); List list = new ArrayList<>(); while
2017-07-18 21:01:55 19731 3
原创 unicode编码转中文处理
###unicode编码转中文处理###实际只要进行16进制转换###代码参考示例: public static String UnicodeToChinese(String string) { String str = string.replace("\\u", ","); String[] s2 = str.split(",");
2017-07-18 21:00:27 1517 1
原创 JS渲染引擎比较HtmlUnit/Selenium/PhantomJs
JS渲染引擎比较HtmlUnit/Selenium/PhantomJs现如今的爬虫再也不是简单的爬取静态页面,解析Html文本这么简单,许多单页面应用,异步请求调用,页面初始化js渲染等技术的使用,使得传统的通过发起http请求获得的Document无法直接使用。因此,基于实际业务需求,在爬取某电商平台数据时,发现其页面特定位置为js渲染,固此,由此一文,基于实际代码测试,分析HtmlUnit/Se
2017-07-08 21:21:33 4642
XMU《XML》实验任务书 XSLT
2014-01-12
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人