Solr
lkx94
java开发工程师
展开
-
学习solr不错的系列博文
转载自:http://www.cnblogs.com/xia520pi/archive/2012/04/20/2459325.html 1)Solr 3.5 配置及应用 (1)Solr 3.5 配置及应用(一) 地址:http://blog.csdn.net/chunming8302/article/details/7321367 (2)Solr 3.5 配置转载 2015-07-25 23:57:38 · 454 阅读 · 0 评论 -
Solr 学习(7) —- Solr Facet(实现搜索推荐词条)
转载自:http://martin3000.iteye.com/blog/1330106一、Facet介绍solr facet 是solr搜索的一大特色,facet不好翻译,有说是垂直搜索,有说是分片搜索,但都不是很好,还是懒得翻译了,就叫facet ,具体功能看下面的例子意会吧。 比如你上淘宝,输入“笔记本”进行搜索,就会出现品牌分类,价格范围等分类,这个就叫fa转载 2017-01-03 09:18:43 · 1047 阅读 · 0 评论 -
solr入门之拼音加汉字方式的搜索建议自动补全的不高效实现
转载自:http://blog.csdn.net/sqh201030412/article/details/51018294今天思考实现了下字符加汉字的搜索建议的 实现--思想主要还是昨天的思想,不过这个方法使用的是匹配查询 ,查询速度可能不太理想[java] view plain copy /**转载 2017-01-03 09:23:40 · 1245 阅读 · 2 评论 -
solr spell拼写检查
拼写检查(spellCheck)首先配置 solrconfig.xml,文件可能已经有这两个元素(如果没有添加即可),需要根据我们自己的系统环境做些适当的修改。Java代码 "spellcheck" class="solr.SpellCheckComponent"> "spellchecker"> "name">default转载 2017-01-03 09:25:23 · 190 阅读 · 0 评论 -
solr入门之solr的拼写检查功能的应用级别尝试
转载自:http://blog.csdn.net/sqh201030412/article/details/51029591今天主要是收集了些拼写检查方面的资料和 尝试使用一下拼写检查的功能--=遇到了不少问题拼写检查的四种配置目前我只算是成功了半个吧---------------------------------拼写检查功能,能在搜索时,提供一个较好原创 2017-01-03 09:26:45 · 360 阅读 · 0 评论 -
solr计算坐标距离
转载自:http://outofmemory.cn/code-snippet/12044/solr-gis-location name="id" type="string" indexed="true" stored="true"required="true" multiValued="false" /> name="name" type="text" indexed="true" sto转载 2017-01-03 09:37:53 · 1818 阅读 · 1 评论 -
搜索引擎之阿堂Solr学习笔记系列7(进阶篇:Solr的自动补全功能)
转载自:http://blog.sina.com.cn/s/blog_4c925dca0102vga8.html 本篇文章,阿堂将和大家分享sorl的高级应用自动补全功能。实际上,我们在在一些电商平台上购物就可以经常看到自动补全功能。 如京东网上的截图所示 索引 设想你想在你的在线商店中,给用户一些提示,比如商品的名称。假设我们的索引构建如下转载 2016-12-27 09:40:20 · 1137 阅读 · 0 评论 -
solr多字段排序
比如搜索商铺列表时需要根据销量、距离、商铺入驻时间对搜索结果集进行排序,优先级分别是:销量>距离>商铺入驻时间,则排序语法为:sort=soldNum desc,geodist() asc,createTime desc如上,优先级高的排前面。代码:SolrQuery solrQuery=new SolrQuery();solrQuery.addSort("so原创 2016-12-27 10:08:52 · 7830 阅读 · 1 评论 -
SolrCloud: A previous ephemeral live node still exists(sor6.2.1问题解决)
solrCloud中每个solr服务节点都会在zk上注册一个临时节点,节点命名和zk的客户端有关联,这里直接是和solr服务所在容器的IP和端口有关。在solr_home目录下的solr.xml文件中host和hostPort是指向solr服务所在容器的IP和端口,这里IP不用使用127.0.0.1和localhost,需要指定机器实际的IP,不然就会出现这个问题,其实是节点命名重复引起,原创 2017-04-10 10:06:42 · 837 阅读 · 0 评论 -
solrCloud修改单个配置文件操作(基于zookeeper)
连接zk:首先用zookeeper的zkCli.sh命令连接上zookeeper,然后delete删除对应配置文件组目录下的配置文件 删除文件: 上传单个配置文件到zk:使用solr下的zkcli.sh putfile(使用方法参考对应的资料)指令上传新配置文件到zk中心。./server/scripts/cloud-scripts/zkcli.sh -zkhost 1原创 2017-04-25 16:58:19 · 4118 阅读 · 0 评论 -
Solr分析器、分词器、过滤器(2)
转载自:http://damoqingquan.iteye.com/blog/2312935. solr.HTMLStripWhitespaceTokenizerFactory从结果中出去HTML标签,将结果交给WhitespaceTokenizer处理。例子:my linkmy linkhellohello转载 2016-11-02 11:21:29 · 1585 阅读 · 0 评论 -
Solr分析器、分词器、过滤器(1)
转载自:http://damoqingquan.iteye.com/blog/231225概览 当对一个文档(document是一系列field的集合)进行索引时,其中的每个field(document和file都是lucene中的概念)中的数据都会经历分析,分词和多步的分词过滤等操作。这一系列的动作是什么呢?直观的理解是,将一句话分成单个的单词,去掉句子当中的空白符号,去掉多余转载 2016-11-02 11:20:28 · 594 阅读 · 0 评论 -
Solr基础理论及参数配置
转载自:http://www.cnblogs.com/rainbowzc/p/3695058.html1、 solr基础因为 Solr 包装并扩展了 Lucene,所以它们使用很多相同的术语。更重要的是,Solr 创建的索引与 Lucene 搜索引擎库完全兼容。通过对 Solr 进行适当的配置,某些情况下可能需要进行编码,Solr 可以阅读和使用构建到其他 Lucene 应用程序中转载 2016-11-02 10:07:12 · 1059 阅读 · 0 评论 -
Solr配置IK Analyzer分词器
solr本身对中文分词的处理不是太好,所以中文应用很多时候都需要额外加一个中文分词器对中文进行分词处理,ik-analyzer就是其中一个不错的中文分词器。一、版本信息solr版本:4.7.0需要ik-analyzer版本:IK Analyzer 2012FF_hf1ik-analyzer下载地址:http://code.google.com/p/i转载 2015-07-28 16:17:17 · 549 阅读 · 0 评论 -
html常用解析工具(java)
可能我们在项目中常用Dom解析html,但是以下介绍的解析器可能会让你更简单、容易去解析html。另外javaweb中常用的dom解析是dom4j, 它在web领域中地王道;android中我们常用的是sax、pull。因为它们更省内存。因为不需要将整个XML树读入内存后再进行处理,而是通过输入流的方式进行,在这过程中会触发相关事件........在这些事件回调中我们去做解析工作。转载 2015-08-12 16:23:11 · 1052 阅读 · 0 评论 -
solr 的客户端调用solrj 建索引+分页查询
在 solr 3.5 配置及应用(一) 讲过一了 solr 3.5的详细配置,本节我们讲利用solr 的客户端调用solr的应用了!一、利用SolrJ操作solr API 使用SolrJ操作Solr会比利用httpClient来操作Solr要简单。SolrJ是封装了httpClient方法,来操作solr的API的。SolrJ底层还是通过使用httpClient中的方法来完转载 2015-08-13 10:31:47 · 544 阅读 · 0 评论 -
单机版solr6.2.1搭建window
转载自:http://blog.csdn.net/duan_nian/article/details/528832021. 将solr6.2.1/server/solr-webapp/webapp下的内容复制到tomcat的webapps下并命名为solr2. 复制 solr-6.2.1\server\lib\ext (+ik分词器+MySQL-connection)转载 2016-11-04 17:21:10 · 542 阅读 · 0 评论 -
centos 6.6 使用tomcat6部署solr5.3.1
转载自:http://www.cnblogs.com/usergaojie/p/4939303.htmlSolr现在是一个独立的服务器。从Solr5.0开始,Solr不再发布为在任何Servlet容器中部署的“war”Web应用程序包(Web Application Archive)。网上关于solr在tomcat部署的文章基本上都是4.x的,现在记录下自己在tomcat6下快捷部转载 2016-11-04 17:22:06 · 363 阅读 · 0 评论 -
什么是垂直搜索引擎
转载自:http://blog.csdn.net/kaiyang45/article/details/49174333垂直搜索是针对某一个行业的专业搜索引擎,是搜索引擎的细分和延伸,是对网页库中的某类专门的信息进行一次整合,定向分字段抽取出需要的数据进行处理后再以某种形式返回给用户。垂直搜索引擎和普通的网页搜索引擎的最大区别是对网页信息进行了结构化信息抽取,也就是将网页的非结构化数转载 2016-11-08 13:00:38 · 1070 阅读 · 0 评论 -
解决Solr6.2.1(当前最新版本) schem.xml中Field属性stored设置false仍然会被返回问题
部署了最新的solr发现stored配置无效了,查找了一下,发现这个外国佬说出了问题的原因。第一句话的意思是,最新版本schem.xml里面把docValues默认设置为true(看了一下string字段类型,确实如此),docValues为true即使stored=false,该Field也会在查询时被返回。第二句话是说,可以将docValues设置为false或在查询参数“fl”指原创 2016-11-09 11:19:07 · 2210 阅读 · 0 评论 -
解决solr6.0不支持IK分词器问题
转载自:http://blog.csdn.net/linzhiqiang0316/article/details/51554217solr6.0中进行中文分词器IK Analyzer的配置和solr低版本中最大不同点在于IK Analyzer中jar包的引用。一般的IK分词jar包都是不能用的,因为IK分词中传统的jar不支持solr6.0这个高版本的,所以就会发送运行错误的界面。下面就来转载 2016-11-09 15:56:12 · 1443 阅读 · 0 评论 -
Solr docValues字段属性详解
转载自:http://itindex.net/detail/55167-solr-docvalues什么是docValues?docValues是一种记录doc字段值的一种形式,在例如在结果排序和统计Facet查询时,需要通过docid取字段值的场景下是非常高效的。为什么要使用docValues?这种形式比老版本中利用fieldCache来实现正排查找更加高效,更加节省内存转载 2016-11-02 09:45:30 · 3677 阅读 · 0 评论 -
SolrCloud中的document与Collection管理
转载自:http://blog.csdn.net/zhangketuan/article/details/49660037转载请出自出处:http://eksliang.iteye.com/一.内嵌启动SolrCloud时端口默认分配当 Solr 运行内嵌 zookeeper 服务时,默认使用 solr 端口+1000 作为客户端口,另外,solr 端口+1 作转载 2017-04-25 17:04:04 · 802 阅读 · 0 评论