Java
文章平均质量分 80
thebigforest
这个作者很懒,什么都没留下…
展开
-
Java 简单输入类
封装了标准的java输入机制,隐藏了异常的管理!读取基本类性值时可以获取和处理可能出现的异常,如果出现异常则返回一个缺省值,便于防止异常的传播! 使用它的目的就是给简单程序一个更简单的做法 /**//* This is a Keyboard input class * Written by forest * 2007-4 */import java.io.*;public class原创 2007-05-03 10:36:00 · 809 阅读 · 0 评论 -
抓取百度搜索结果——解密百度狗
网上有很多类似“百度狗” 的元搜索引擎,他们抓取百度和google的搜索结果,然后合并在一个网页里。且不说这样做有什么意义,但是这的确是一件好玩的事,自己想了一下原理,写了这样一个类,可以抓取百度里的搜索结果。原理很简单: 通过搜索关键和页码字进入百度,例如“http://www.baidu.com/s?wd=搜索关键字&pn=页码(这里的页码计算公式是:10*(页码-1))原创 2007-06-13 12:42:00 · 3269 阅读 · 0 评论 -
Nutch使用汇总
网上有好多的Nutch使用的文章,但其实只是几篇文章翻来覆去的拷贝而已!1.Nutch 初体验很经典,讲了nutch与lucene 以及其他一些爬虫的比较。和建立一个抓取企业内部网(Intranet crawling)实例。但是可能是版本的问题。其中少了关键的一步。2.Tutorial (0.8.x) 这里是官方的那个文档,补全了少的那一步。否则出现后果为Fetcher: se原创 2007-10-21 09:51:00 · 1169 阅读 · 0 评论