Elasticsearch 文档内容检索插件 ingest attachment 安装

Ingest Attachment Processor Plugin 是一个文本抽取插件,本质上是利用了 Elasticsearch的ingest node功能,提供了关键的预处理器 attachment 。

在这里插入图片描述

下载离线安装和HTTP在线安装

Ingest-attachment 插件下载地址:
https://artifacts.elastic.co/downloads/elasticsearch-plugins/ingest-attachment/ingest-attachment-{ElasticsearchVersion}.zip
例如 ES 版本是 7.3.2,则修改下载地址中的变量为 7.3.2 后的下载地址最后的文件名为 ingest-attachment-7.3.2.zip

在安装目录下运行的离线安装命令为

Linux离线

./bin/elasticsearch-plugin install file:///path/to/ingest-attachment-7.3.2.zip

Windows离线

./bin/elasticsearch-plugin install file:///C:/path/to/ingest-attachment-7.3.2.zip

HTTP在线

sudo ./bin/elasticsearch-plugin install http://some.domain/path/to/ingest-attachment-7.3.2.zip

插件安装后如果没有生效,则重启 es 服务。

官网资料:https://www.elastic.co/guide/en/elasticsearch/plugins/current/index.html

定义文本抽取管道

PUT /_ingest/pipeline/attachment
{
    "description": "Extract attachment information",
    "processors": [
        {
            "attachment": {
                "field": "content",
                "ignore_missing": true
            }
        },
        {
            "remove": {
                "field": "content"
            }
        }
    ]
}

在attachment中指定要过滤的字段为content,所以写入Elasticsearch时需要将文档内容放在content字段。

执行命令后响应结果如下:

{
    "acknowledged":true
}

(END)

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

catoop

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值