爬虫
thehappyyouth
这个作者很懒,什么都没留下…
展开
-
java爬取网页源代码,解析
1.搜索词的地址采用模拟地址方法(通过分析搜索引擎的参数得到,如百度),然后将搜索词加到模拟的地址中。 2.函数的输入参数是模拟地址。 String query = URLEncoder.encode("潘柱廷", "UTF-8"); String url="http://www.baidu.com/s?wd="+query+"&pn="+p*10+"&tn=baiduh...原创 2013-01-16 11:06:31 · 328 阅读 · 0 评论 -
java程序打包成jar文件(自己实践和查网页解决,以中科院分词工具ICTCLAS5.0 为例)...
一、打包过程:右击工程>Export>Java>Runnable JAR File>Launch Configuration中要选择该工程的主类(即入口)。最后打包为foursearch.jar。 二、还要将配置文件放在正确的位置,在初始化之前设置变量String argu = new File("").getAbsolutePath()+"\\bin";然后在打好的...2013-01-23 10:49:34 · 139 阅读 · 0 评论