1.概述
翻译:https://jolicode.com/blog/elasticsearch-icu-now-understands-emoji
ES 6.4中的这个简单变化可能会对你的指数产生你可能认为的更大的影响。
sticsearch 6.4与Lucene 7.4一同发布——这是官方发布的一个小标题,但如果你仔细观察,这个新版本发布了ICU数据和对emoji的真正支持。这将改变游戏规则😎(对某些人来说!)
Unicode的国际组件(ICU)是一个成熟的C/ c++和Java库支持Unicode,软件国际化和软件全球化的开源项目,它无处不在(在你的电脑,你的手机,甚至可能你的连接冰箱)。
的所有用法icu_tokenizer受到影响,这意味着每个人都使用必须需要icu_tokenizer应该重建索引,因为“🍕”现在是一个令牌!
2.安装
如下命令安装