坤健的博客

天行健,君子以自强不息。地势坤,君子以厚德载物

elastic search中前缀搜索,通配符搜索,正则搜索的使用

PUT my_index { "mappings": { "my_type": { "properties": { "title": { "type...

2019-07-21 23:47:43

阅读数 1

评论数 0

elastic search中混合使用match实现召回率和精确率的平衡

召回率:比如你搜索一个java spark,总共有100个doc,能返回多少个doc作为结果,就是召回率,即recall; 精准度:比如你搜索一个java spark,能不能尽可能让包含短语 "java spark",或者是java和spark离的很近的doc,排在最前面,即...

2019-07-21 22:52:11

阅读数 1

评论数 0

elastic search中的match phase和近似匹配的原理

phrase match:短语匹配,将多个term作为一个短语,一起去搜索,只有包含这个短语的doc才会作为结果返回。 proximity match:近似匹配 1、java spark,就靠在一起,中间不能插入任何其他字符,就要搜索出来这种doc,使用短语匹配 2、java spark,但是要...

2019-07-21 18:21:59

阅读数 2

评论数 0

elastic search中的most fields策略以及与best fields策略的区别

best-fields策略,主要是说将某一个field匹配尽可能多的关键词的doc优先返回回来 most-fields策略,主要是说尽可能返回更多field匹配到某个关键词的doc,优先返回回来 POST /forum/_mapping/article { "properties...

2019-07-21 10:06:24

阅读数 3

评论数 0

elastic search中best fields策略

需求:搜索title或content中包含java或solution的帖子? 进行multi-field多字段搜索 GET /forum/article/_search { "query": { "bool": { "...

2019-07-20 16:49:05

阅读数 4

评论数 0

elastic search在多shard场景下reveleance score不准确问题解析

如果一个index有多个shard的话,可能搜索结果会不准确,原因见下图: 2、怎么解决该问题? (1)生产环境下,数据量大,数据应该尽可能实现均匀分配 数据量很大的话,一般情况下,在概率学的背景下,es都是在多个shard中均匀路由数据的,路由的时候根据_id,负载均衡 比如说有10个...

2019-07-20 16:38:50

阅读数 4

评论数 0

elastic search中multi-value搜索的实现方式及控制全文搜索的精准度

1、为帖子数据增加标题字段 POST /forum/article/_bulk { "update": { "_id": "1"} } { "doc" : {"title" : "th...

2019-07-20 15:10:43

阅读数 5

评论数 0

elastic search中filter过滤器内部实现

大致过程: 在倒排索引中查找搜索串,获取document list; 为每个在倒排索引中搜索到的结果,构建一个bitset; 遍历每个过滤条件对应的bitset,优先从最稀疏的开始搜索,查找满足所有条件的document; caching bitset,跟踪query; 如果docume...

2019-07-20 13:09:50

阅读数 15

评论数 0

工作流activiti中dueDate设置

格式解析 R2/2015-06-04T19:25:16.828696-07:00/P1DT10S 上面的字符串通过"/"分为了三部分即: 重复次数/开始时间/运行间隔 重复次数 R - 将永远重复 R1 - 将重复一次 R231 - 将重复231次。 开始时间 ...

2019-06-06 15:42:05

阅读数 108

评论数 0

什么是回调函数?

例子: 你到商店买东西,刚好你要买的东西没货了,于是你在店员那里留下了你的电话,过了几天店里有货了,店员就打了你的电话,然后你接到电话就到店里去取了货。 在这个例子里, 你的电话号码就是回调函数; 你把电话号码留给店员就叫等记回调函数; 店里后来有货了叫做触发了回调关联的事件; 店员给...

2019-04-25 20:37:10

阅读数 59

评论数 1

Tomcat启动时 Illegal access: this web application instance has been stopped already的处理

现象 在接入日志采集client包时,总时出些奇怪的问题,昨天接入日志采集,但是加入后,就是启不来; tomcat 有异常信息 信息: Illegal access:thisweb application instance has been stopped already. Could...

2019-04-24 08:59:28

阅读数 259

评论数 0

发布或重启线上服务时抖动问题

转载至http://www.cnblogs.com/LBSer 发布或重启线上服务时抖动问题解决方案 一、问题描述 在发布或重启某线上某服务时(jetty8作为服务器),常常发现有些机器的load会飙到非常高(高达70),并持续较长一段时间(5分钟)后回落(图1),与此同时响应时间曲线(...

2019-04-17 00:10:15

阅读数 36

评论数 0

记录IntelliJ IDEA 合并冲突时的一个bug(冲突解决后代码和本地仓库一样时导致merge失败)

https://blog.csdn.net/qq_29663071/article/details/80760957

2018-08-08 00:39:14

阅读数 402

评论数 0

spring源码之-策略模式

定义 定义一系列算法,将每个算法封装到具有公共接口的一系列策略类中,从而使它们可以相互替换 & 让算法可在不影响客户端的情况下发生变化 简单来说:准备一组算法 & 将每一个算法封装起来,让外部按需调用 & 使得互换。 作...

2018-07-30 21:14:52

阅读数 678

评论数 0

spring中用到的设计模式

  refresh()方法使用的是模板方法模式 模板方法模式: 定义:定义一个模板结构,将具体方法延迟到子类中去实现。 主要作用:在不改变模板结构的前提下在子类中重新定义模板中的内容。 解决的问题: 提高代码复用性 将相同部分的代码放在抽象的父类中,而将不同的代码放入不同的子类中 ...

2018-07-29 22:51:13

阅读数 135

评论数 0

Intella IDEA中的postfix

100.forr 等于for(int i=0;i<100;i++){ } user.nn 等于if(user!=null){ } i.sout 等于 System.out.println(i); 自动创建函数 alter+enter list rapla...

2018-07-29 10:51:19

阅读数 173

评论数 0

git学习之路

转载https://blog.csdn.net/autfish/article/details/52513465

2018-07-22 23:20:45

阅读数 147

评论数 0

linux学习-文件的隐藏属性

Linux系统中的文件除了具备一般权限和特殊权限之外,还有一种隐藏权限,即被隐藏起来的权限,默认情况下不能直接被用户发觉。明明权限充足但却无法删除某个文件的情况,或者仅能在日志文件中追加内容而不能修改或删除内容,这在一定程度上阻止了黑客篡改系统日志的图谋。1.  chattr命令chattr命令用...

2018-06-03 20:37:02

阅读数 296

评论数 0

linux学习-SUID、SGID

1.  SUIDSUID是一种对二进制程序进行设置的特殊权限,可以让二进制程序的执行者临时拥有属主的权限(仅对拥有执行权限的二进制程序有效)。例如,所有用户都可以执行passwd命令来修改自己的用户密码,而用户密码保存在/etc/shadow文件中。仔细查看这个文件就会发现它的默认权限是000,也...

2018-06-03 14:52:20

阅读数 246

评论数 0

linux学习-重要的环境变量

变量是计算机系统用于保存可变值的数据类型。在Linux系统中,变量名称一般都是大写的,这是一种约定俗成的规范。我们可以直接通过变量名称来提取到对应的变量值。Linux系统中的环境变量是用来定义系统运行环境的一些参数,比如每个用户不同的宿主目录、邮件存放位置等。为了通过环境变量帮助Linux系统构建...

2018-05-29 16:25:28

阅读数 164

评论数 0

提示
确定要删除当前文章?
取消 删除
关闭
关闭