【Elasticsearch】Elasticsearch ICU现在可以理解表情符号了!

561 篇文章 548 订阅 ¥79.90 ¥99.00
Elasticsearch 6.4引入了ICU数据和对表情符号的真正支持,改变了游戏规则。现在,表情符号如"�"被视为独立的令牌,影响使用icu_tokenizer的索引,需要重建。这一更新使得搜索引擎能够理解和处理表情符号,增强了搜索的相关性,例如在搜索披萨店时,用户可以输入"pizza"或"�"。要实现此功能,需要使用CLDR注释和自定义Token Filter将表情符号作为同义词添加。Elasticsearch 6.4简化了表情符号搜索,相比之前的方法,如使用空白标记器和字符过滤器,现在更加直接和有效。
摘要由CSDN通过智能技术生成

在这里插入图片描述

1.概述

翻译:https://jolicode.com/blog/elasticsearch-icu-now-understands-emoji

ES 6.4中的这个简单变化可能会对你的指数产生你可能认为的更大的影响。

sticsearch 6.4与Lucene 7.4一同发布——这是官方发布的一个小标题,但如果你仔细观察,这个新版本发布了ICU数据和对emoji的真正支持。这将改变游戏规则😎(对某些人来说!)

Unicode的国际组件(ICU)是一个成熟的C/ c++和Java库支持Unicode,软件国际化和软件全球化的开源项目,它无处不在(在你的电脑,你的手机,甚至可能你的连接冰箱)。

的所有用法icu_tokenizer受到影响,这意味着每个人都使用必须需要icu_tokenizer应该重建索引,因为“🍕”现在是一个令牌!

2.安装

如下命令安装


                
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

九师兄

你的鼓励是我做大写作的动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值