ES-面试-原理

李思苇

于 2018-09-18 09:46:10 发布

阅读量1.1k

点赞数

分类专栏： elastic 文章标签： elasticsearch

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/wenxindiaolong061/article/details/82752333

版权

elastic 专栏收录该内容

19 篇文章 0 订阅

订阅专栏

索引及搜索

默认情况下

索引时，会对要索引的字符串做字符过滤、分词、token过滤。
搜索时，会对搜索关键词用同样一套字符过滤器、分词器、token过滤器。

character filter - 字符过滤器，字符整理，如将 & 转换成 and 等。
Tokenizer - 分词器，根据一定规则将字符串分割成多个单词
Token filter - 单词过滤器，如去掉无意义的单词：a, an, the

自定义字符过滤器、分词器、分析器

PUT /my_index
{
	"analyzer" : "standard",	# 指定索引级别的分析器
	"mapping" : {
		"my_type" : {
			"properties" : {
				"product_no" : {
					"type" : "text",
					"analyzer" : "my_analyzer"		# 单独对某字段使用自定义的分析器
				} 
			}
		}
	}	
}

#自定义分析器


PUT /my_index
{
	"analysis" : {		# 进入分析器相关配置
		"char_filter": { }, 	#自定义字符过滤器
        "tokenizer":   { },  	# 自定义分词器
        "filter": {},			# 自定义次元过滤器
        "analyzer" : {} 		#自定义分析器，使用前边自定义的过滤器等
	}
}
#例：
"char_filter": {
    "&_to_and": {
        "type":       "mapping",
        "mappings": [ "&=> and "]
    }
}
"filter": {
    "my_stopwords": {
        "type":        "stop",
        "stopwords": [ "the", "a" ]
    }
}
"analyzer": {
    "my_analyzer": {
        "type":           "custom",
        "char_filter":  [ "html_strip", "&_to_and" ],
        "tokenizer":      "standard",
        "filter":       [ "lowercase", "my_stopwords" ]
    }
}

测试分析器

PUT /_analyze
{
	"analyzer" : "standard"，
	"text" : "中文试一试？"
}

关注

0
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

李思苇 CSDN认证博客专家 CSDN认证企业博客

码龄15年

104: 原创

5万+: 周排名

228万+: 总排名

34万+: 访问

: 等级

3439: 积分

55: 粉丝

89: 获赞

39: 评论

351: 收藏

私信

关注

热门文章

分类专栏

javaweb 5篇
web-css 1篇
nginx 5篇
数据结构 1篇
数学基础 1篇
架构 1篇
intellij 2篇
DOS 1篇
vmware
JAVA-语法基础 50篇
Spring 4篇
mysql 3篇
JAVA-JVM 7篇
maven 4篇
flume 6篇
elastic 19篇
kafka 2篇
linux 13篇
hdfs 2篇
java多线程 6篇
hadoop 6篇
hbase 3篇
优质技术网站
杂 4篇
研发管理 4篇
shell 8篇
REST 2篇
JAVA-JPA 7篇
springboot 4篇

最新评论

正则表达式总结
CSDN-Ada助手: 哇, 你的文章质量真不错，值得学习！不过这么高质量的文章, 还值得进一步提升, 以下的改进点你可以参考下: (1)使用更多的站内链接；(2)提升标题与正文的相关性。
弱引用——WeakReference——所引用的对象的回收规则
qq_40735131: 这句话是不是有误 ----> 如果垃圾收集器在某个时间点确定某个对象的可达性是弱可达的（即这个对象可以通过一个弱引用链可达，即使同时也有其它强引用链或者软引用链可达此对象），那么GC就会清除所有引用这个对象的弱引用，还会通过可以到达这个对象的强引用链和软引用链找到链上其它对象上的所有弱引用、并清除所有这些弱引用。
弱引用——WeakReference——所引用的对象的回收规则
qq_40735131: 你确定弱引用的引用在有强引用时进行GC会将弱引用的连接断开？
Stream： Core Java 2 第一章
TTianbo123: 博主的技术面很广哦，厉害👍可以加您微信随时交流吗？非常感谢
弱引用——WeakReference——所引用的对象的回收规则
qq_34860636: 感谢楼主解答

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。