- 博客(3)
- 资源 (27)
- 问答 (1)
- 收藏
- 关注
原创 判断网页的编码
判断网页的编码我们主要是为了在解析网页时出现一些乱码问题。主要用到了两个jar包chardet.jar和cpdetector_1.0.7.jar。具体的使用如下: [code="java"]public class BianMa { public static void main(String[] args){ String path="";...
2010-06-22 15:41:28 169
转载 一位硕士毕业生三个月求职经历与经验的结晶
<br />一、 求职历程总结<br /><br />2007年1月10日,随着在三方协议上郑重签下自己的名字,我的求职历程终于划上了一个圆满的句号。在这三个月漫长而艰辛的过程中,我付出了很多,经历了很多,也收获了很多。这一路走来,要感谢的人太多太多,尤其要感谢每一个在找工作过程中关心、帮助过我的人,我会一生铭记你们的恩情。现在,尘埃落定,到了该回报的时候,我首先要回报的就是我的母校和同学。所以,决定把自己找工作中积累的经验写出来给大家分享,希望能对那些将要找工作或还在找工作的
2010-06-19 10:20:00 1372
原创 htmlparser分析网页链接时的问题
利用htmlparser在解析网页的url链接时,我们想提取指定标签下的链接。例如:div id=wrap下的链接,可以通过下面代码实现:[code="java"]Parser parser = new Parser(url);NodeFilter nodefilter1=new AndFilter(new TagNameFilter(nodename),new HasAttr...
2010-06-06 09:57:05 127
自己动手抓数据-网络爬虫
2011-03-14
网页编码解析包(chardet.jar,cpdetector_1.0.7.jar)
2010-07-31
字符串元素数组求并集
2010-12-22
TA创建的收藏夹 TA关注的收藏夹
TA关注的人