solr
文章平均质量分 64
小草丶Bady
这个作者很懒,什么都没留下…
展开
-
solr 拼音检索
拼音检索中国人的专用检索,例如:中文内容为 中国 的输入zhongguo、zg、zhonggu 全拼、简拼、拼音的相邻的一部份都应该能检索出 中国 来。 想要实现拼音检索第一个就是拼音转换我这里用的是pinyin4j进行拼音转换。第二个就是N-Gram的题目,推敲到用户可能输入的既不是前缀也不是后缀,所以此处选择的是N-Gram技巧,但不同于常用的N-Gram,我应用的从一边开端的单向的N-Gr原创 2017-09-01 14:14:51 · 2334 阅读 · 1 评论 -
solr 相似匹配
在我们使用网页搜索时,会注意到每一个结果都包含一个 “相似页面” 链接,单击该链接,就会发布另一个搜索请求,查找出与起初结果类似的文档。Solr 使用 MoreLikeThisComponent(MLT)和 MoreLikeThisHandler 实现了一样的功能。如上所述,MLT 是与标准 SolrRequestHandler 集成在一起的;MoreLikeThisHandler 与 MLT 结合原创 2017-09-01 14:12:43 · 618 阅读 · 0 评论 -
solr 检索建议
检索建议目前是各大搜索的标配应用,主要作用是避免用户输入错误的搜索词,同时将用户引导到相应的关键词搜索上。Solr内置了检索建议功能,它在Solr里叫做Suggest模块.该模块可选择基于提示词文本做检索建议,还支持通过针对索引的某个字段建立索引词库做检索建议。在诸多文档中都推荐使用基于索引来做检索建议,因此我们目前的实现也是采取该方案。 现在我们开始配置Suggest模块,首先在solrcon原创 2017-09-01 13:56:31 · 685 阅读 · 0 评论 -
Solr 基础
在 solrhomr 目录下collection/conf/Schema.xml 打开这个配置文件,你会发现有详细的注释。模式组织主要分为三个重要配置types 部分 是一些常见的可重用定义,定义了 Solr(和 Lucene)如何处理 Field。也就是添加到索引中的xml文件属性中的类型,如int、text、date等. 就像java的8中基本类型一样 ,前面集成的ik分词需要在这定义原创 2017-09-01 13:55:54 · 200 阅读 · 0 评论 -
solr 初探
Solr简介Solr是一个基于Lucene的Java搜索引擎服务器。Solr 提供了层面搜索、命中醒目显示并且支持多种输出格式(包括 XML/XSLT 和 JSON 格式)。它易于安装和配置,而且附带了一个基于 HTTP 的管理界面。 Solr已经在众多大型的网站中使用,较为成熟和稳定。Solr 包装并扩展了 Lucene,所以Solr的基本上沿用了Lucene的相关术语。更重要的是,Solr 创原创 2017-09-01 10:21:36 · 236 阅读 · 0 评论 -
solrj 使用 打分 高亮
QueryResponse response = null; SolrDocumentList results = null; Map mapDto = new HashMap(); //打分 SolrCondition condition = DataCache.AUTHOR_COND_TION; try {原创 2017-09-01 11:43:36 · 334 阅读 · 0 评论 -
Solr IK分词 停止词 扩展词 创建core
solr 配中文分词器在IK目录下将IKAnalyzer2012FF_u1.jar拷贝到 Tomcat的webapps/solr/WEB-INF/lib 下。 将IKAnalyzer.cfg.xml、ext_stopword.dic mydict.dic copy到 Tomcat的 webapps/solr/WEB-INF/classes1 在IKAnalyzer.cfg.xml 添加配置<原创 2017-09-01 10:48:47 · 340 阅读 · 0 评论 -
Solr linux安装配置
环境CentOs 6.4 防火墙 打开8080端口 /etc/sysconfig/iptables Solr:Solr4.10.3 Jdk:jdk1.8.0_131 Tomcat:apache-tomcat-7解压 solr ,tomcat 到目录 /usr/local 下安装 1.将solr 目录下的 example/webapps solr.war 拷贝到Tomcat的webapp目原创 2017-09-01 10:34:20 · 344 阅读 · 0 评论 -
solr 分组统计
我这里实现分组统计的方法是使用了Solr的Facet组件, Facet组件是Solr默认集成的一个组件.Facet是solr的高级搜索功能之一,可以给用户提供更友好的搜索体验.在搜索关键字的同时,能够按照Facet的字段进行分组并统计适宜被Facet的字段一般代表了实体的某种公共属性,如商品的分类,商品的制造厂家,书籍的出版商等等.Facet字段的要求Facet的字段必须被索引.一般来说该字段无原创 2017-09-01 14:05:23 · 3576 阅读 · 0 评论 -
solr 自动聚类
Solr 使用Carrot2完成了聚类功能,能够把检索到的内容自动分类, Carrot2聚类示例: 要想Solr支持聚类功能,首选要把Solr发行包的中的dist/ solr-clustering-4.2.0.jar, 复制到\solr\contrib\analysis-extras\lib下.然后打开solrconfig.xml进行添加配置:<searchComponent name="clu原创 2017-09-01 14:13:58 · 1160 阅读 · 0 评论 -
Lucene简介和索引原理
基于Lucene检索引擎我们开发了自己的全文检索系统,承担起后台PB级、万亿条数据记录的检索工作,这里向大家分享下Lucene底层原理研究和一些优化经验。 从两个方面介绍: 1. Lucene简介和索引原理 2. Lucene优化经验总结1. Lucene简介和索引原理 该部分从三方面展开:Lucene简介、索引原理、Lucene索引实现。1.1 Lucene简介 Lucen转载 2017-12-14 09:55:28 · 5514 阅读 · 1 评论