- 博客(12)
- 资源 (14)
- 收藏
- 关注
原创 开源网络爬虫介绍及其比较
<br />Nutch 开发语言:Java http://lucene.apache.org/nutch/<br />简介: Apache的子项目之一,属于Lucene项目下的子项目。 <br /><br />Nutch是一个基于Lucene,类似Google的完整网络搜索引擎解决方案,基于Hadoop的分布式处理模型保证了系统的性能,类似Eclipse的插件机制保证了系统的可客户化,而且很容易集成到自己的应用之中。 <br /><br /><br />Larbin 开发语言:C++ http://larb
2010-11-08 19:06:00 11579 2
原创 JavaScript之‘联系我们’,‘收藏本站’,‘设为首页’
<br /><a href="mailto:553406220@qq.com">联系我们</a><br /><a href="javascript:window.external.AddFavorite('http://bbs.zbaccp.com','中博社区')">收藏本站</a><br /><a href="#" 【onclick】="this.style.behavior='url(#default#homepage)';this.sethomepage('http://bbs.zbaccp.com
2010-11-07 21:18:00 4435
原创 java中File类详解
<br /> Java.io.File类主要是完成了文件夹管理的命名、查询文件属性和处理目录等到操作它不进行文件夹内容的读取操作。以下描述了File类的主要常用方法。 <br /><br />File():构造函数,一般是依据文件所在的指定位置来创建文件对象。 <br />CanWrite():返回文件是否可写。 <br />CanRead():返回文件是否可读。 <br />CompareTo(File pathname):检查指定文件路径间的顺序。 <br />Delet():从文件系统内删除该文件
2010-11-07 12:07:00 1869
原创 计算程序运行时间
<br />突然想准确的测试一下Java代码的执行时间,在网上找了一会。发现基本有以下两种方法。但是不知道是不是最好的。呵呵,希望大家能指点一下。<br />第一种是以毫秒为单位计算的。Java代码 //伪代码 long startTime=System.currentTimeMillis(); //获取开始时间 doSomeThing(); //测试的代码段 long endTime=System.currentTimeMillis(); //获取结束时间 System.out.pr
2010-11-06 22:00:00 480
原创 关于javaBean属性乱码问题
<br />设置或者获取javaBean属性 出现乱码问题 ,网上查看太多用request.setCharEncoding="GBK"类似的方法,最终还是不行<br /> <br /> <br /> <br />最后是这样解决的<br /> <br /> <br />在bean中set属性方法中,加个编码转换.例如:<br /> <br /> <br />public void setQueryString(String queryString) throws Exception {<br /> this
2010-11-06 01:03:00 993
原创 高亮器
<br /><br /> //准备高亮器<br /> Formatter formatter = new SimpleHTMLFormatter("<font color='red'>","</font>");<br /> Scorer scorer = new QueryScorer(query);<br /> Highlighter highlighter = new Highlighter(formatter, scorer);<br /> Fragmenter fragmenter =
2010-11-05 19:27:00 627
转载 一个最简单的Lucene例子
<br />Lucene的使用,简单来说可以划分为两种类型,一是建立索引,二是搜索内容。<br />一、建立索引的五个基础类 Document, Field, IndexWriter, Analyzer, Directory <br />1、Document类:用来描述文档,这里的文档可以指一个HTML页面,一封电子邮件,或者是一个文本文件。一个 Document 对象由多个Field对象组成的。可以把一个Document对象想象成数据库中的一个记录,而每个Field对象就是记录的一个字段。<br />2、
2010-11-04 10:01:00 1170
原创 关于IndexSearcher检索器
<br />在学习IndexSearcher检索器之前,先大致了解一下下面几项:<br />1、首先,要知道Weight(接口)存在的目的:<br />使得检索不改变一个Query,使得Query可以重用。所以就出现了Weight,一个Weight可以保存与某次检索相关的IndexSearcher检索器的独立状态值。其实Weight间接保存了IndexSearcher索引器的独立状态信息。<br />每次检索,即初始化一个IndexSearcher检索器,都需要一个Query,例如<br /> Quer
2010-11-04 10:00:00 1037
原创 关于IndexSearcher检索器
<br />关于IndexSearcher检索器。<br />在学习IndexSearcher检索器之前,先大致了解一下下面几项:<br />1、首先,要知道Weight(接口)存在的目的:<br />使得检索不改变一个Query,使得Query可以重用。所以就出现了Weight,一个Weight可以保存与某次检索相关的IndexSearcher检索器的独立状态值。其实Weight间接保存了IndexSearcher索引器的独立状态信息。<br />每次检索,即初始化一个IndexSearcher检索器,都
2010-11-03 16:14:00 6237
转载 lucene 的一些整理
lucene3.0学习笔记3-(IndexWriter的一些方法和属性)<br />文章分类:互联网2.3 Basic index operations <br />2.3.1 Adding documents to an index <br />IndexWriter有两个方法可以加入Document的方法 <br />Java代码 addDocument(Document)和addDocument(Document, Analyzer) addDocument(Document)和addDocumen
2010-11-03 12:18:00 605
原创 Lucene:基于Java的全文检索引擎简介--车东老师
<br />Lucene是一个基于Java的全文索引工具包。基于Java的全文索引引擎Lucene简介:关于作者和Lucene的历史全文检索的实现:Luene全文索引和数据库索引的比较中文切分词机制简介:基于词库和自动切分词算法的比较具体的安装和使用简介:系统结构介绍和演示Hacking Lucene:简化的查询分析器,删除的实现,定制的排序,应用接口的扩展从Lucene我们还可以学到什么另外,如果是在选择全文引擎,现在也许是试试Sphinx的时候了:相比Lucene速度更快,有中文分词的支持,而且内置了对
2010-11-01 20:48:00 444
原创 Lucene:基于Java的全文检索引擎简介
<br /><!--[if !supportLists]-->5. <!--[endif]-->Lucene代码分析<br />应用情景分析<br /> <br />Query query = parser.parse(queries[j]);<br /> 获得布尔查询<br /> <br />hits = searcher.search(query);<br /> <br /> <br /> return new Hits(this, query, filter);<br /> <br /> ge
2010-11-01 20:34:00 471
velocity 中文开发文档
2011-09-23
自己写的java猜牌游戏
2010-12-10
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人