Elasticsearch+Lucenne
文章平均质量分 83
介绍Elasticsearch和Lucenne的相关知识
strong_yu
这个作者很懒,什么都没留下…
展开
-
Elasticsearch5.数据建模和并发控制
并发控制并发控制有两种,悲观并发控制和乐观并发控制悲观并发控制假定有变更冲突的可能。会对资源加锁,防止冲突。例如数据库行锁乐观并发控制假定冲突是不会发生的,不会阻塞正在尝试的操作。如果数据在读写中被修改,更更新将会失败。应用程序决定如何解决冲突,例如重试更更新,使用新的数据,或者将错误报告给⽤户Elasticsearch的并发控制Elasticsearch采用的乐观并发控制,ES中的文档是不可变更更的。如果你更新一个⽂文档,会将就文档标记为删除,同时增加一个全新的⽂文档。同时文档的versi原创 2021-01-20 15:21:16 · 213 阅读 · 0 评论 -
Elasticsearch4.聚合
Elasticsearch的分析分为Bucket,Metric,Pipeline三种类型Metric在一组文档中对某一个数字型字段进行计算指标值Metric包含两种单值分析和多值分析单值分析只输出一个分析结果min, max, avg, sum,Cardinality(类似 distinct Count)多值分析输出多个分析结果stats, extended stats,percentile, percentilerank,top hits(排在前面的结果)Bucket按照一定的规则原创 2021-01-20 15:03:05 · 222 阅读 · 0 评论 -
Elasticsearch3.搜索
词项和全文检索Term表达语义的最小单位,在Es中,对于Term的查询,对输入不做分词,会将输入作为一个整体,在倒排索引中查找准确的词项,并计算词项在该文档中算分 可以通过Constant Score将该查询转换为Filtering,避免算分,利用缓存,提高性能全文检索索引和搜索时,都会分词,查询字符串先传递到一个合适的分词器,然后生成一个供查询的此项列表查询时候,先会对输入的查询进⾏分词,然后每个词项逐个进⾏底层的查询,最终将结果进行合并。并为每个文档生成一个算分检索过程:结原创 2021-01-19 17:19:10 · 212 阅读 · 0 评论 -
Elasticsearch2.基本概念
1.基本概念mapping定义了索引中字段的名称,字段的数据类型,字段的一些特殊设置,比如倒排索引的相关设置等基本数据类型string,long,integer,short,byte,double,float,data,boolean,binary复杂数据类型数组数据类型:不需要专门的类型来定义数组对象数据类型:object,单独的JSON对象嵌套数据类型:netsted,关于JSON对象的数组地理数据类型地理点数据类型:geo_point,经纬点地理形状数据类型:geo_shape,原创 2021-01-19 17:14:38 · 132 阅读 · 0 评论 -
Elasticsearch1.lucenne基本概念
数据写入流程1.数据同时写入indexbuffer缓冲和translog日志文件2.默认每隔一秒钟,buffer中的数据被写入新的segmentfile,并进入os cache,此时segment被打开并供search使用3.buffer被清空4.重复1~3的步骤,新的segment不断添加,buffer不断被清空,而translog中的数据不断累加commit(flush)操作当translog文件达到一定的阀值(默认512M),commit操作发生1.buffer中的所有数据写入一个新的s原创 2021-01-19 14:58:34 · 176 阅读 · 0 评论