任何技能都是从模仿开始,逐步升华。

好的架构是进化而来的,好的产品是推广而来的。

Lucene优化

使用Lucene来开发搜索引擎,一般不会太关注创建索引的效率(异步或定时创建索引),但是,当数据达到一定量级的时候,我们就必须要考虑如何的去提高创建索引的性能,以减少创建索引的时间以及提高查询效率。以下几点可以参考,当然Lucene已经为我们做了优化,通常采用默认的方式创建索引即可。

2015-06-23 16:53:03

阅读数:1847

评论数:0

Lucene简单搜索引擎模拟

前面介绍了Lucene的索引与搜索,及中文分词,下面用一个小实例模拟一下搜索引擎。

2015-06-23 16:51:43

阅读数:877

评论数:0

Lucene索引创建、查询与高亮

前面我们介绍少了Lucene的基本使用及中文分词,下面我以一个实例来看一下Lucene的使用方式。

2015-06-23 16:50:22

阅读数:1190

评论数:0

与Lucene 4.10配合的中文分词比较

比较目的 衡量每种分词的指标,内存消耗、CPU消耗,得到一个在Lucene中比较好的分词版本。 分词源代码介绍 paoding: 庖丁解牛最新版在 https://code.google.com/p/paoding/ 中最多支持Lucene 3.0,且最新提交的代码在 2...

2015-06-23 16:49:03

阅读数:1069

评论数:0

Lucene中文分词mmseg4j

mmseg4j 用 Chih-Hao Tsai 的 MMSeg 算法实现的中文分词器,并实现 lucene 的 analyzer 和 solr 的TokenizerFactory 以方便在Lucene和Solr中使用。

2015-06-23 16:47:44

阅读数:1366

评论数:1

Lucene中文分词Paoding

Paoding中文分词库是一个使用Java开发的基于Lucene4.x的分词器,可结合到Lucene应用中的,为互联网、企业内部网使用的中文搜索引擎分词组件。Paoding填补了国内中文分词方面开源组件的空白,致力于此并希翼成为互联网网站首选的中文分词开源组件。 Paoding中文分词追求分词的高...

2015-06-23 16:47:02

阅读数:2526

评论数:0

Lucene中文分词Jcseg

jcseg是使用Java开发的一款开源的中文分词器, 基于流行的mmseg算法实现,分词准确率高达98.4%, 支持中文人名识别, 同义词匹配, 停止词过滤等。并且提供了最新版本的lucene,solr,elasticsearch分词接口。

2015-06-23 16:45:53

阅读数:3419

评论数:2

Lucene中文分词IK Analyzer

IK Analyzer是一个开源的,基于java语言开发的轻量级的中文分词工具包。从2006年12月推出1.0版开始, IKAnalyzer已经推出了4个大版本。最初,它是以开源项目Luence为应用主体的,结合词典分词和文法分析算法的中文分词组件。从3.0版本开始,IK发展为面向Java的公用分...

2015-06-23 16:44:14

阅读数:4764

评论数:0

Lucene中文分词介绍

由于lucene自带的分词方式对中文分词十分的不友好,所以在对一段中文中的某个词组进行搜索时,需要在创建索引是对其进行分词。下面介绍一些常见的中文分词器。

2015-06-23 16:42:59

阅读数:767

评论数:0

Lucene使用实例

Lucene全文检索大体分两个部分:索引创建(Indexing)和搜索索引(Search)

2015-06-23 16:42:15

阅读数:871

评论数:0

Lucene介绍

Lucene是一套用于全文检索和搜寻的开源程式库,由Apache软件基金会支持和提供。Lucene提供了一个简单却强大的应用程式接口,能够做全文索引和搜寻。在Java开发环境里Lucene是一个成熟的免费开源工具。就其本身而言,Lucene是当前以及最近几年最受欢迎的免费Java信息检索程序库。人...

2015-06-23 16:41:14

阅读数:816

评论数:0

单元测试之Mock

mock测试就是在测试过程中,对于某些不容易构造或者不容易获取的对象,用一个虚拟的对象来创建以便测试的测试方法。

2015-06-03 14:48:08

阅读数:4560

评论数:0

单元测试之TestNG与spring集成

Spring2.5以后,就开始支持TestNG了,org.springframework.test.context.testng包为基于TestNG的测试用例提供了支持类。

2015-06-03 11:41:23

阅读数:10936

评论数:4

单元测试之TestNG

TestNG是一个测试框架,其灵感来自JUnit和NUnit的,但引入了一些新的功能,使其功能更强大,使用更方便。 TestNG是一个开源自动化测试框架;TestNG表示下一代。 TestNG是类似于JUnit(特别是JUnit 4),但它不是一个JUnit扩展。它的灵感来源于JUnit。它的目的...

2015-06-02 16:59:48

阅读数:2526

评论数:0

单元测试之Junit和spring集成

使用 Spring 测试注释来进行常见的 Junit4 或者 TestNG 的单元测试,同时支持访问 Spring 的 beanFactory 和进行自动化的事务管理。

2015-06-02 14:41:37

阅读数:7004

评论数:0

单元测试之Junit使用

以一个实例来演示junit的使用。

2015-06-02 12:54:01

阅读数:1893

评论数:0

单元测试之Junit功能介绍

介绍junit常用的注解、断言等

2015-06-02 11:01:29

阅读数:2000

评论数:0

单元测试之Junit介绍

JUnit是由 Erich Gamma 和 Kent Beck 编写的Java测试框架,用于编写和运行可重复的测试。他是用于单元测试框架体系xUnit的一个实例(用于java语言)。主要用于白盒测试,回归测试。Junit是一套框架,继承TestCase类,就可以用Junit进行自动测试了。

2015-06-02 10:22:04

阅读数:1519

评论数:0

单元测试介绍

单元测试是编写测试代码,用来检测特定的、明确的、细颗粒的功能。单元测试并不一定保证程序功能是正确的,更不保证整体业务是准备的。

2015-06-02 09:56:25

阅读数:1008

评论数:0

XMPP协议之Openfire Connection Manager 配置

Openfire Connection Manager 是 Openfire 服务器的扩展,它可以透明的处理大规模并发 XMPP 客户端对Openfire 服务器的联接。根据 Connection Manager 主页介绍,每个 Connection Manager 可以处理至少5000个并发用户。

2015-06-02 09:18:27

阅读数:2414

评论数:0

提示
确定要删除当前文章?
取消 删除
关闭
关闭