Elasticsearch 安装ik和pinyin分词器——elasticsearch6.5.4

@羲凡——只为了更好的活着

Elasticsearch 安装ik和pinyin分词器——elasticsearch6.5.4

默认你已经安装好elasticsearch6.5.4,如果没有请先参照我另一篇博客 https://blog.csdn.net/weixin_42003671/article/details/89487433 。本文也是用 deptest30、deptest33、deptest34 三台机器做测试

一、安装ik和pinyin分词器

安装IK分词器github上有说明,
地址如下:https://github.com/medcl/elasticsearch-analysis-ik/tree/6.x#install

1.下载安装包

在以下两个网站中找到与自己es对应的ik和pinyin版本
https://github.com/medcl/elasticsearch-analysis-ik/releases
https://github.com/medcl/elasticsearch-analysis-pinyin/releases

我使用的是 elasticsearch6.5.4 ,所以本文的下载地址如下
ik下载地址: https://github.com/medcl/elasticsearch-analysis-ik/releases/download/v6.5.4/elasticsearch-analysis-ik-6.5.4.zip
pinyin下载地址:https://github.com/medcl/elasticsearch-analysis-pinyin/releases/download/v6.5.4/elasticsearch-analysis-pinyin-6.5.4.zip

2.将安装包解压到${ES_HOME}/plugins/ik目录下

现在一台机器上安装,比如 deptest30
创建 ${ES_HOME}/plugins/ik 和 ${ES_HOME}/plugins/pinyin 目录,并解压到该目录下

mkdir -p ${ES_HOME}/plugins/ik
mkdir -p ${ES_HOME}/plugins/pinyin
unzip elasticsearch-analysis-ik-6.5.4.zip -d ${ES_HOME}/plugins/ik
unzip elasticsearch-analysis-pinyin-6.5.4.zip -d ${ES_HOME}/plugins/pinyin
3.分发到集群的其他机器上,并重启es
scp -r ${ES_HOME}/plugins/ik hadoop@deptest33:${ES_HOME}/plugins/
scp -r ${ES_HOME}/plugins/ik hadoop@deptest34:${ES_HOME}/plugins/
scp -r ${ES_HOME}/plugins/pinyin hadoop@deptest33:${ES_HOME}/plugins/
scp -r ${ES_HOME}/plugins/pinyin hadoop@deptest34:${ES_HOME}/plugins/

然后重启即可
切记一定要重启es哦
切记一定要重启es哦
切记一定要重启es哦

二、测试ik/pinyin分词器

测试ik分词器github上有案例,
地址如下:https://github.com/medcl/elasticsearch-analysis-ik/tree/6.x#quick-example
测试pinyin分词器github上有案例,
地址如下:https://github.com/medcl/elasticsearch-analysis-pinyin

以下是官网上测试ik分词器的案例

1.创建一个索引
curl -XPUT http://deptest30:9200/index?pretty
2.创建一个mapping
curl -XPOST http://deptest30:9200/index/fulltext/_mapping?pretty -H 'Content-Type:application/json' -d'
{
        "properties": {
            "content": {
                "type": "text",
                "analyzer": "ik_max_word",
                "search_analyzer": "ik_max_word"
            }
        }
}'
3.向索引中添加文档
curl -XPOST 'deptest30:9200/index/fulltext/_bulk?pretty' -H 'Content-Type:application/json' -d'
{"index":{"_id":"1"}}
{"content":"美国留给伊拉克的是个烂摊子吗"}
{"index":{"_id":"2"}}
{"content":"公安部:各地校车将享最高路权"}
{"index":{"_id":"3"}}
{"content":"中韩渔警冲突调查:韩警平均每天扣1艘中国渔船"}
{"index":{"_id":"4"}}
{"content":"中国驻洛杉矶领事馆遭亚裔男子枪击 嫌犯已自首"}
'
4.查询并highlight显示
curl -XPOST http://deptest30:9200/index/fulltext/_search?pretty  -H 'Content-Type:application/json' -d'
{
    "query" : { "match" : { "content" : "中国" }},
    "highlight" : {
        "pre_tags" : ["<tag1>", "<tag2>"],
        "post_tags" : ["</tag1>", "</tag2>"],
        "fields" : {
            "content" : {}
        }
    }
}'

====================================================================

@羲凡——只为了更好的活着

若对博客中有任何问题,欢迎留言交流

数据库是一个用于存储、管理和组织数据的集合。下面是一些数据库基本概念: 1. 数据:数据库中存储的信息,可以是文本、数字、图像、音频等各种形式的数据。 2. 表:数据库中的一个基本组成单元,由行和列组成。每一行表示一个记录,每一列表示一个字段,用于存储特定类型的数据。 3. 列:表中的一个垂直的数据字段,定义了该列中存储的数据类型。 4. 行:表中的一个水平数据记录,包含了一组相关的字段值。 5. 主键:表中的一列或一组列,用于唯一标识表中的每一行。主键必须具有唯一性和非空性。 6. 外键:表中的一列或一组列,用于建立与其他表之间的关系。外键与其他表中的主键相对应,用于确保数据之间的完整性。 7. 索引:用于提高数据检索速度的数据结构。通过创建索引,可以快速定位到满足特定条件的数据行。 8. 查询语言:用于与数据库进行交互和操作的语言。SQL(Structured Query Language)是最常用的查询语言,用于查询、插入、更新和删除数据库中的数据。 9. 关系型数据库管理系统(RDBMS):一种基于关系模型的数据库管理系统,用于管理关系型数据库。常见的关系型数据库管理系统包括MySQL、Oracle、SQL Server和PostgreSQL等。 10. 数据库管理系统(DBMS):用于管理数据库的软件系统,负责数据的存储、检索、安全性控制和数据完整性等。 这些是数据库基本概念,了解这些概念可以帮助您更好地理解和使用数据库
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值