Elasticsearch安装IK分词插件,一线大厂架构师都推荐的Java零基础大全

3.索引一些文档

curl -XPOST http://localhost:9200/laker/_create/1 -H ‘Content-Type:application/json’ -d’

{“content”:“美国留给伊拉克的是个烂摊子吗”}

curl -XPOST http://localhost:9200/laker/_create/2 -H ‘Content-Type:application/json’ -d’

{“content”:“公安部:各地校车将享最高路权”}

curl -XPOST http://localhost:9200/laker/_create/3 -H ‘Content-Type:application/json’ -d’

{“content”:“中韩渔警冲突调查:韩警平均每天扣1艘中国渔船”}

curl -XPOST http://localhost:9200/laker/_create/4 -H ‘Content-Type:application/json’ -d’

{“content”:“中国驻洛杉矶领事馆遭亚裔男子枪击 嫌犯已自首”}

4.查询高亮

curl -XPOST http://localhost:9200/laker/_search -H ‘Content-Type:application/json’ -d’

{

“query” : { “match” : { “content” : “中国” }},

“highlight” : {

“pre_tags” : [“”, “”],

“post_tags” : [“”, “”],

“fields” : {

“content” : {}

}

}

}

结果

{

“took”: 796,

“timed_out”: false,

“_shards”: {

“total”: 1,

“successful”: 1,

“skipped”: 0,

“failed”: 0

},

“hits”: {

“total”: {

“value”: 2,

“relation”: “eq”

},

“max_score”: 0.642793,

“hits”: [

{

“_index”: “laker”,

“_type”: “_doc”,

“_id”: “3”,

“_score”: 0.642793,

“_source”: {

“content”: “中韩渔警冲突调查:韩警平均每天扣1艘中国渔船”

},

“highlight”: {

“content”: [

“中韩渔警冲突调查:韩警平均每天扣1艘中国渔船”

]

}

},

{

“_index”: “laker”,

“_type”: “_doc”,

“_id”: “4”,

“_score”: 0.642793,

“_source”: {

“content”: “中国驻洛杉矶领事馆遭亚裔男子枪击 嫌犯已自首”

},

“highlight”: {

“content”: [

“中国驻洛杉矶领事馆遭亚裔男子枪击 嫌犯已自首”

]

}

}

]

}

}

字典配置


IKAnalyzer.cfg.xml 位于 {conf}/analysis-ik/config/IKAnalyzer.cfg.xml 或者{plugins}/elasticsearch-analysis-ik-*/config/IKAnalyzer.cfg.xml

rpm安装的位于/etc/elasticsearch/analysis-ik/IKAnalyzer.cfg.xml

<?xml version="1.0" encoding="UTF-8"?>

IK Analyzer 扩展配置

custom/mydict.dic;custom/single_word_low_freq.dic

custom/ext_stopword.dic

location

http://xxx.com/xxx.dic

热更新 IK 分词使用方法


目前该插件支持热更新 IK 分词,通过上文在 IK 配置文件中提到的如下配置

location

location

其中 location 是指一个 url,比如 http://yoursite.com/getCustomDict,该请求只需满足以下两点即可完成分词热更新。

  1. 该 http 请求需要返回两个头部(header),一个是 Last-Modified,一个是 ETag,这两者都是字符串类型,只要有一个发生变化,该插件就会去抓取新的分词进而更新词库。

  2. 该 http 请求返回的内容格式是一行一个分词,换行符用 \n 即可。

满足上面两点要求就可以实现热更新分词了,不需要重启 ES 实例。

小编13年上海交大毕业,曾经在小公司待过,也去过华为、OPPO等大厂,18年进入阿里一直到现在。

深知大多数初中级Java工程师,想要提升技能,往往是自己摸索成长,但自己不成体系的自学效果低效又漫长,而且极易碰到天花板技术停滞不前!

因此收集整理了一份《2024年最新Java开发全套学习资料》送给大家,初衷也很简单,就是希望能够帮助到想自学提升又不知道该从何学起的朋友,同时减轻大家的负担。
img
img
img

由于文件比较大,这里只是将部分目录截图出来,每个节点里面都包含大厂面经、学习笔记、源码讲义、实战项目、讲解视频

如果你觉得这些内容对你有帮助,可以添加下面V无偿领取!(备注Java)
img

的朋友,同时减轻大家的负担。**
[外链图片转存中…(img-ImCa7jUv-1710784654366)]
[外链图片转存中…(img-dxMuR2bN-1710784654367)]
[外链图片转存中…(img-WPA6Ry8r-1710784654367)]

由于文件比较大,这里只是将部分目录截图出来,每个节点里面都包含大厂面经、学习笔记、源码讲义、实战项目、讲解视频

如果你觉得这些内容对你有帮助,可以添加下面V无偿领取!(备注Java)
[外链图片转存中…(img-rDZQCXtg-1710784654368)]

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值