solr
文章平均质量分 81
喝口水就跑
暴躁老哥,在线搬砖。
展开
-
全文索引----中文分词器mmseg4j
通常情况下,我们根据整个字段来索引数据,字段最长时,也不过十个字;但是还有一种情况,如果我们索引的是一篇文章呢?这时候如何处理这个字段,分词器很好的解决了这个问题。 solr服务器默认为我们提供了分词组件,但是Apache Solr提供的分词器对中文不太友好,举例如下: 它把整个句子的每个字都给分开了,这样如果索引一篇文章的...原创 2016-05-10 20:54:36 · 9218 阅读 · 10 评论 -
全文索引----solr服务器更新增量索引
上篇文章我们介绍了全量更新solr索引,但是在数据量较大时,频繁的更新索引会消耗系统性能,如果更新频率较低,则会影响短时的数据准确性,所以,更新时间的间隔是个很难界定。增量索引解决了这个问题,我们可以在较短的时间内只更新那些变化的数据,这样就避免了大批量的数据更新,因为数据量小,我们可以设置较短的时间间隔,大幅度的提高了用户体验度。本文介绍增量索引。 一 配置数据源 1...原创 2016-05-09 16:36:17 · 11316 阅读 · 9 评论 -
全文索引----solr服务器更新全量索引
solr索引设置完成后,需要根据数据库的变化及时更新索引,索引的更新有两种方式,全量更新和增量更新。顾名思义,全量更新即删除solr服务器上的所有索引,然后重新导入数据,增量索引即只更新修改的数据,本篇文章介绍全量索引更新。 一 配置数据源 1.1 数据库 我们使用单表作为测试数据源,包括三个字段,id,title,content,方便测试,使用var...原创 2016-05-08 21:49:21 · 11984 阅读 · 10 评论 -
全文索引----创建多表solr索引
我们在使用solr作为索引服务器时,通常会将多个表的多个字段作为联合索引,对多个表快速的数据查询也是solr服务器高效率的体现。这片文章介绍下如何基于多个数据表创建索引。 一 无关联多表创建索引 1.1 数据库准备 我们使用任意的两个表作为数据源,这两个表可以属于一个数据库,也可以属于不同的数据库,如果使用两个数据库,则...原创 2016-05-07 21:10:39 · 14948 阅读 · 18 评论 -
全文索引----配置solr数据源
上篇文章我们介绍了solrJ工具,本篇文章我们介绍solr的数据源。我们使用solr作为全文索引的服务器,那么必须要为solr提供数据源,小编solr服务器总结了三种数据来源,分别是:使用命令提供数据源、solrJ提供数据源和配置文件配置数据源,下边分别介绍着三种方式。一 使用命令配置数据源 1 环境 本文以linux环境作为示例介绍此功能,操作环境cent...原创 2016-04-30 21:10:04 · 12044 阅读 · 19 评论 -
全文索引----solr客户端工具solrJ
上一篇博客中,我们使用solr的桌面客户端工具展示返回的数据,如果我们需要在程序中使用这些返回值的话,就需要另外的一个工具了----solrJ。一 solrJ介绍 1 是什么? 为了方便的操作solr服务器,Apache为我们提供了solrJ工具,我们可以通过solrJ对solr服务器进行创建索引、更新、查询、处理返回值等操作,它其实相当于solr服务器和我们程...原创 2016-04-27 20:09:33 · 3295 阅读 · 13 评论 -
全文索引----solr入门
一 Apache Solr介绍 1 solr是什么? solr是一个独立的企业级搜索应用服务器,他对外提供类似webservice的API接口。用户可以通过http请求,向搜索引擎服务器提交一定格式的XML文件,生成索引,也可以通过http get 请求提出查找请求,并得到XML格式的返回结果。 2 特点 solr是一个高性能,基于lucene的全文搜索服务...原创 2016-04-26 20:12:49 · 1389 阅读 · 25 评论