ik php分词,IK中文分词的配置和使用

最新推荐文章于 2024-04-16 17:42:44 发布

泠川

最新推荐文章于 2024-04-16 17:42:44 发布

阅读量225

点赞数

文章标签： ik php分词

IK中文分词的配置和使用

目前有很多优秀的中文分词组件。本篇只以 IKAnalyzer 分词为例，讲解如何在 solr 中及集成中文分词，使用 IKAnalyzer的原因 IK 比其他中文分词维护的勤快，和 Solr 集成也相对容易。具体就不多介绍，这里直接solr 集成 IK 的方法。

1.首先，下载IKKAnalyzer,下载注意：以前的老的IK不支持Solr 5.3的版本，请注意下载最新的.

2. 将ik的相关文件拷贝到 webapps\solr\WEB-INF\lib 目录下

3. 在 solr_home\mycore1\conf\schema.xml 增加如下配置

1c4684ec9aec

同时，把需要分词的字段，设置为text_ik

4.重启服务

注意：如果之前已经创建了索引，需要将之前的索引删除掉，重新创建分词后的索引。

5.在admin后台，analysis下查看分词的效果

1.中文分词的效果

1c4684ec9aec

2.索引查询的效果

1c4684ec9aec

6. 配置IKAnalyzer分词器的扩展词典，停止词词典

1. 将文件夹下的IKAnalyzer.cfg.xml , ext.dic和stopword.dic 三个文件复制到/webapps/solr/WEB-INF/classes 目录下，并修改IKAnalyzer.cfg.xml

IK Analyzer 扩展配置

ext.dic;

stopword.dic;

2. 在ext.dic 里增加自己的扩展词典，例如，婴儿奶粉3段

1c4684ec9aec

注意: 记得将stopword.dic，ext.dic的编码方式为UTF-8 无BOM的编码方式。

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

泠川

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

ElasticSearch测试、IK分词简单测试（PHP）

派煌篇的博客

11-21

3071

以下全是测试代码：如有需要了解安装 ElasticSearch和IK分词的可参考：https://blog.csdn.net/weixin_42579642/article/details/84317099 use Elasticsearch\ClientBuilder; class ElasticController extends Controller { public funct...

ik分词器 mysql php_ES-MySQL-PHP的使用

weixin_36182568的博客

01-31

197

ES简介一个高扩展、开源的全文检索和分析引擎，它可以准实时地快速存储、搜索、分析海量的数据。全文检索是指计算机索引程序通过扫描文章中的每一个词，对每一个词建立一个索引，指明该词在文章中出现的次数和位置，当用户查询时，检索程序就根据事先建立的索引进行查找，并将查找的结果反馈给用户的检索方式。这个过程类似于通过字典中的检索字表查字的过程。全文搜索搜索引擎数据库中的数据ES 为什么比 mysql 快My...

参与评论您还未登录，请先登录后发表或查看评论

ik php分词,php中如何安装和配置ik分词器？

weixin_39623411的博客

03-12

279

php中如何安装和配置ik分词器？发布时间：2020-05-23 11:06:54来源：亿速云阅读：173作者：Leah这篇文章给大家分享的是php中安装和配置ik分词器的方法，相信大部分人都还没学会这个技能，为了让大家学会，给大家总结了以下内容，话不多说，一起往下看吧。安装IKwin环境下，命令行进入bin，然后执行elasticsearch-plugin install https://git...

ik分词 php,利用IKAnalyzer分词和索引维护(示例代码)

weixin_28861381的博客

03-20

185

1.默认标准分析器所有分析器最终继承的类都是Analyzer1.1 编写AnalyzerTest类//默认标准分析器//1.创建一个Analyzer对象Analyzer analyzer=newStandardAnalyzer();//2.调用Analyzer对象的tokenStream方法获取TokenStream对象，此对象包含了所有分词结果TokenStream tokenStream=...

最新php中es安装ik分词器（Elasticsearch安装篇二）

php-yyds

09-04

970

一、中文分词ik 注意Elasticsearch版本要对应ik的版本安装方式方式1.开源分词器 Ik 的github：https://github.com/medcl/elasticsearch-analysis-ik 下载后放到plugins文件夹里面方式 2.使用命令安装，要对应版本，7.14.1是对应es版本，不一样请自行更改 ./bin/elasticsearch-plugin install https://github.com/medcl/elasticsearc...

IK智能分词器下载8.12.2版本

03-28

IK智能分词器下载8.12.2版本IK智能分词器下载8.12.2版本IK智能分词器下载8.12.2版本IK智能分词器下载8.12.2版本IK智能分词器下载8.12.2版本IK智能分词器下载8.12.2版本IK智能分词器下载8.12.2版本IK智能分词器下载...

ik中文分词词库35万中文分词词库(含电商)

01-11

ik中文分词词库35万中文分词词库(含电商)

elasticsearch-ik中文分词器7.6.2.zip

04-11

**Elasticsearch 7.6.2 中文分词器详解** Elasticsearch 是一个流行的开源全文搜索引擎，它提供了一种高效、灵活的方式来存储、搜索和分析...正确配置和使用IK分词器，对于提升Elasticsearch的中文检索性能至关重要。

ik中文分词词库，包含不低于20万词

12-17

2. **词典加载**：接着，你需要配置ik分词器加载“中文分词词库.txt”文件。这通常在分词器的配置文件中完成，确保分词器在启动时能够找到并使用这个词库。 3. **自定义词典**：除了默认词库外，ik分词器还支持用户...

IK分词器完整资源包有配置文件和jar包

07-23

IK分词器是一款广泛应用于Java环境中的...总之，IK分词器作为一个强大的中文分词工具，提供了完整的资源包，包括配置文件和JAR包，使得开发者能够轻松地在各种Java项目中集成和使用，提升中文文本处理的效率和质量。

ES ik分词器安装及使用 | PHP创建带分词器的索引

qq_41473768的博客

05-06

1313

es ik分词器安装及使用；PHP创建带分词器的索引

elasticsearch-php使用案例(二)拼音，ik分词

hgb24660的博客

05-05

428

需要下载对应elasticsearch版本的IK分词器和拼音分词器 IK分词器下载地址:https://github.com/medcl/elasticsearch-analysis-ik pinyin分词器下载地址：https://github.com/medcl/elasticsearch-analysis-pinyin/releases 放到elasticsearch\plugins目录下 require './vendor/autoload.php'; use Elasticsearch\Cl.

php环境下，使用elasticSearch+ik分词器进行全文搜索

strike2206的博客

11-22

1432

首先需要说明的一点是，如果需要启用ik分词器，那么分词器的版本必须与es版本一致，即6.3.0的分词器需要同样6.3.0版本的es支持。安装java win-64bit的安装包需要去java英文官网查找安装ES 6.3.0版本es下载地址：https://www.elastic.co/downloads/past-releases/elasticsearch-6-3-0 安装I...

ik中文分词

中国华的博客

10-09

288

到git官网上https://github.com/medcl/elasticsearch-analysis-ik，里面有详细的安装说明

中文分词插件ik

王兆镇的博客

05-15

296

1.下载文件 wget https://download.elastic.co/elasticsearch/release/org/elasticsearch/distribution/rpm/elasticsearch/2.4.1/elasticsearch-2.4.1.rpm 2.安装 yum -y install elasticsearch-2.4.1.rpm 3.修改配置文件 vim /etc/elasticsearch/elasticsearch.yml cluster.name: yl_shop

php elasticsearch ik,elasticsearch 中文分词（elasticsearch-analysis-ik）安装

weixin_29103603的博客

03-12

190

elasticsearch 中文分词(elasticsearch-analysis-ik)安装在elasticsearch的plugins目录下，创建ik目录cd /usr/local/elasticsearch-6.3.0/pluginsmkdir ik将解压的内容，放入其中重新启动elasticsearch服务elasticsearch restart这个时候中文分词就生效了，数据重新插入即可...

IK分词器安装、配置、分词自定义、Rest使用、SpringBoot使用