爬虫解析
旺旺的宝宝兔
True Master always have a freshman heart
展开
-
java爬虫解析提取末页数值。
现在写了三种方法获取末页地址。通过获取末页地址得到所需要的page。nextpage,来对网页进行爬取。 简单的思路就是爬取html页面的代码。比如说标签中包括自己所需要的数值。就可以用正则表达式提取标签中所需要的数字,就可以提取出数值。 举个例子。 阴影部分就是所需要位置。为了提取相应的位置信息。 public int parseTotalPage(PageInfo pageIn原创 2016-09-12 17:39:21 · 900 阅读 · 0 评论 -
java将Unicode编码转换为汉字
java实现unicode编码转换为汉字编码的代码!原创 2016-09-20 15:44:05 · 3146 阅读 · 0 评论