Solr
无证程序员ao
一个无证程序员的程序之路
展开
-
solr之fields配置
我们定义一个文档由那些字段就是通过配置schema.xml里的部分来决定的,它就相当于关系型数据库里的字段一样。 这里主要有5种字段,分别是:Required fieldsMultivalued fieldsDynamic fieldsCopy fieldsUnique key field原创 2016-06-30 16:17:57 · 1902 阅读 · 0 评论 -
solr之建立索引
关于solr的倒排索引原理这里不涉及,这里只说明当我们向solr提交一个文档后发生了什么,一张图搞定 大致过程就是通过http post把文档提交到solr把出入的文档转换为solr支持的文档格式solr对文档按照schema.xml里配置的字段信息进行解析,这个地方比较重要和复杂,这里会对文本进行分词,分词是建立倒排索引的关键,也就是整个搜索引擎的关键把解析后的分词信息建立索引原创 2016-06-30 16:31:29 · 528 阅读 · 0 评论 -
solr之模糊搜索(Fuzzy matching)
solr的模糊搜索主要有通配符,范围查询,近距离搜索等几类。下面分别探讨一下用法。1. 通配符查询通配符只是对单个term有效,对短语不起作用,ps:短语就是在查询条件上加双引号,比如 title:"xxx yyy"。其实也就跟一般的通配符的匹配方式差不多了,比如我要查询title里有evaluat开头的文档:title:evaluat*Note that:查询语句里一定要用小写,还没研究清楚大小原创 2016-06-23 17:11:41 · 8975 阅读 · 0 评论 -
solr之字段数据类型
solr提供了内建的一些数据类型比如numbers, dates, geo location等类型;详情如下 每种数据类型都有一个Java类来管理。 这里主要讲讲以下几种类型 1. String fields 2. Date fields 3. Numeric fields1. String fields<fieldType name="string" class="solr.S原创 2016-06-30 18:00:53 · 15193 阅读 · 0 评论 -
solr之commit和softcommit
在solrconfig.xml里有两个配置项,autoCommit和autoSoftCommit,他们是干什么的呢?他们是solr提交文档的两种方式。1. commit一般提交又或者叫硬提交(hard commit), 使用这种提交会把文档立即持久化到磁盘,并可以让你能立马查询到它,因为它会开启一个新的searcher,但是它缺点很明显,就是很耗性能,并会阻塞到提交任务完成,使用它是非常昂贵的操作。原创 2016-07-01 18:07:11 · 6457 阅读 · 0 评论 -
solr4.10+tomcat7+mmseg4j中文分词搭建过程
概念: Collection:在SolrCloud集群中逻辑意义上的完整的索引。它常常被划分为一个或多个Shard,它们使用相同的Config Set。如果Shard数超过一个,它就是分布式索引,SolrCloud让你通过Collection名称引用它,而不需要关心分布式检索时需要使用的和Shard相关参数。Config Set: Solr Core提供服务必须的一组配置文件。每个config s原创 2016-08-10 14:27:02 · 558 阅读 · 0 评论