solr4.0版本加入中文分词IKanalry

最新推荐文章于 2024-05-31 10:46:10 发布

chunzhuanlong5114

最新推荐文章于 2024-05-31 10:46:10 发布

阅读量176

点赞数

文章标签： java

原文链接：https://my.oschina.net/u/3959200/blog/1942513

版权

1：首先在tomcat下面的solr.war下lib中加入：IKAnalyzer2012FF_u1.jar包(不是tomcat的ilb目录)

2：然后再solr词库目录C:\solr\collection1\conf下的schema.xml文件中加入：

<field name="title" type="text_ik" indexed="true" stored="true"/>

</fieldType>

就可以了，在solr界面中analys选则 type下的 text_ik就可以分词了

注意:如果出现以下错误

collection1: org.apache.solr.common.SolrException:org.apache.solr.common.SolrException: Could not load conf for core core1: Plugin init failure for [schema.xml] fieldType "text_ik": Cannot load analyzer: org.wltea.analyzer.lucene.IKAnalyzers. Schema file is D:\test\solr\collection1\conf\schema.xml
Please check your logs for more information

请检查以下字段是否重复,如有重复请删除

转载于:https://my.oschina.net/u/3959200/blog/1942513

优惠劵

chunzhuanlong5114

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
solr4.0版本加入中文分词IKanalry

1：首先在tomcat下面的solr.war下lib中加入：IKAnalyzer2012FF_u1.jar包(不是tomcat的ilb目录) 2：然后再solr词库目录C:\solr\collection1\conf下的schema.xml文件中加入： <!--这里让title字段...
复制链接

扫一扫

solr安装包与ik中文分词器.zip

12-09

该压缩包中包含solr安装包与ik中文分词器，安装也很简单，按照我博客中的步骤即可，亲测有效！！！！！

solr中文分词高版本

08-29

由于网上提供的solr中文分词器大多不吃吃6.5以上，会报错（具体错误提示忘了），这里提供高版本，内含使用教程

参与评论您还未登录，请先登录后发表或查看评论

在Solr4.10配置IKAnalyzer 同义词、扩展词库、停顿词详解

ystyaoshengting的专栏

10-12

2174

在Solr4.10配置IKAnalyzer同义词、扩展词库、停顿词详解在配置IKAnalyzer 同义词，扩展词，停顿词时，出现了很麻烦的事情，搞了一段时间，因为现在直接从官网上下载下来的IKAnalyzer是能够直接的进行中文的分词，但是进行useSmart参数控制，及同义词，扩展词，停顿词的配置则需要对IKAnalyzer的jar包进行修改才可以使用。我使用的IKAnalyzer的ja

solr4.0加入中文分词IKanalry

追随大师的脚步,,,

11-01

1：solr4.0加入中文分词：在IK的自带文档中有：这里特别的罗嗦几句，在Solr4.0发布以后，官方取消了BaseTokenizerFactory接口，而直接使用Lucene Analyzer标准接口。因此IK分词器2012 FF版本也取消了org.wltea.analyzer.solr.IKTokenizerFactory类。 2：首先在tomcat不是的solr目录下...

solr 4.0 集成 IK Analyzer 中文分词

路虽远行则将至，事虽难做则必成

12-09

171

环境 jdk 1.7 tomcat1.7 solr 4.10 IK Analyzer 2012FF_hf1.zip solr的下载官网[url]http://lucene.apache.org/solr/[/url] 下载:[url]http://www.eu.apache.org/dist/lucene/solr/[/url] IK Analyzer下载 (找个免费 V...

04、在solr中添加中文分词

qq_46023503的博客

10-26

193

将solr\contrib\analysis-extras\lucene-libs\lucene-analyzers-smartcn.jar 复制到 solr\server\solr-webapp\webapp\WEB-INF\lib 目录中。

Solr：配置IK中文分词器

qq_33240556的博客

04-07

403

从IK分词器的官方仓库、GitHub或其他可信来源下载适用于您Solr版本的IK分词器JAR包。确保下载的版本与您的Solr版本兼容。例如，如果您使用的是Solr 8.x版本，应下载对应版本的IK分词器。对于Solr服务的重启方式，请参考您的Solr部署指南或相关文档。至此，Solr已成功配置为使用IK中文分词器处理指定字段的中文文本。如果您的Solr部署结构不同，请确保将JAR文件放置到Solr实例能够加载到类路径的位置。可以根据需要添加或调整IK分词器的其他参数以及后续的分析器组件（如过滤器）。

给solr添加中文分词器IK

cherry_vicent的专栏

09-27

327

最近，很多朋友问我solr 中文分词配置的问题，都不知道怎么配置，怎么使用，原以为很简单，没想到这么多朋友都有问题，所以今天就总结总结中文分词的配置吧。　　有的时候，用户搜索的关键字，可能是一句话，不是很规范。所以在 Solr 中查询出的时候，就需要将用户输入的关键字进行分词。　　目前有很多优秀的中文分词组件。本篇只以 IKAnalyzer 分词为例，讲解如何在 sol...

Windows部署Solr全文检索+中文分词

dongyan3595的博客

10-27

590

官网下载 Solr Downloads - Apache Solr 解压文件(全英文路径) 手动创建索引库该路径下创建一个自己索引库的文件夹(名字自己定 ) 找到 solr-8.10.1\server\solr\configsets\sample_techproducts_configs 目录, 并将conf目录以及该目录下的所有文件都复制一份放到刚刚创建的索引库shopCore 目录下配置中文分词库 1. 下载下载地址 :https://search.mave...

Solr搜索引擎——中文分词器

gaohuanjie的专栏

08-25

1069

Solr搜索引擎——中文分词器

Solr中文分词及分数计算

沙码龙

05-23

2144

Solr中文分词及分数计算 中文分词 基本概念众所周知，英文是以词为单位的，词与词之间是靠空格隔开，而中文是以字为单位，句子中所有的字连起来才能表达清楚意思。举个例子，英文句子I am a student，用中文表示“我是一个学生”。如果是处理英文的话，计算机可以通过空格知道student是一个单词，但是不能够识别出学生为一个词。把中文的汉字序列切分成有意义的词，就是中文分词，也可以称为切词。...

docker 安装solr8.6.2 配置中文分词器的方法

09-29

主要介绍了docker 安装solr8.6.2 配置中文分词器的方法，本文给大家介绍的非常详细，对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下

Solr4.3 版本中文分词组件

07-09

最高版本的 solr 中文分词配置，小弟已经测试过了里面的 jar 要到各官网上下载

solr环境搭建和中文分词器IK配置

04-11

solr7.2.1环境搭建和中文分词器IK配置亲测可用，安装过程自己记录的。

operator ＜=＞ (spaceship operator)

janeqi1987的专栏

05-28

1010

= 与!= 操作符为了检查是否相等，现在定义== 操作符就够了。当编译器找不到表达式的匹配声明a!=b 时，编译器会重写表达式并查找!(a==b)。若这不起作用，编译器也会尝试改变操作数的顺序，所以也会尝试!(b==a):a!=b,!(b==a)因此，对于TypeA 的a 和TypeB 的b，编译器将能够识别并编译a!= b若需要的话，可以这样做• 一个独立函数operator!• 一个独立函数operator==(TypeA, TypeB)

Java 异常处理中try-catch块、finally子句以及自定义异常的使用

最新发布

Itmastergo的博客

05-31

808

异常是程序运行过程中出现的非正常情况。Java 使用异常类（Exception 类及其子类）来表示这些异常情况。异常处理的核心思想是将正常的程序流程与异常处理流程分离开来，使代码更加清晰和可维护。Throwable 类：所有异常和错误的基类。Error 类：表示系统级的错误，程序通常无法处理，比如内存不足（OutOfMemoryError）。Exception 类：表示程序中可以处理的异常情况。RuntimeException 类。

Java手动启动jar包

liangweihao的博客

05-29

300

【代码】Java手动启动jar包。

java调用cmd执行命令

weixin_45210565的博客

05-28

263

3、exec(String command, String[] envp) ，在调用外部程序之前设置系统环境变量，该变量仅供command入参使用，envp每个元素为一个系统环境变量，并且字符串格式为“环境变量名=环境变量值”。2、exec(String[] cmdArray) ，调用外部程序，入参cmdArray的元素将组合成为一条完整的外部可执行程序的启动路径或命令。1、exec(String command) ，调用外部程序，入参command为外部可执行程序的启动路径或命令。

solr 9.2.0版本配置中文分词

05-05

Solr 9.2.0默认使用Lucene 8.6.0，其自带了一个中文分词器SmartChineseAnalyzer。在Solr中配置中文分词器的步骤如下： 1. 在solrconfig.xml中配置分词器在schema.xml中定义field时，需要指定使用的分词器，例如： ``` <field name="text" type="text_cn" indexed="true" stored="true"/> ``` 在solrconfig.xml中，需要配置text_cn类型的分词器，例如： ``` <fieldType name="text_cn" class="solr.TextField"> <analyzer type="index"> <tokenizer class="org.apache.lucene.analysis.cn.smart.SmartChineseTokenizerFactory"/> </analyzer> <analyzer type="query"> <tokenizer class="org.apache.lucene.analysis.cn.smart.SmartChineseTokenizerFactory"/> </analyzer> </fieldType> ``` 其中，tokenizer指定了使用的分词器，这里使用的是SmartChineseTokenizerFactory，它是SmartChineseAnalyzer的底层分词器。 2. 配置停用词在solrconfig.xml中，可以配置停用词，在分词时将停用词过滤掉，例如： ``` <filter class="solr.StopFilterFactory" words="stopwords.txt" ignoreCase="true" /> ``` 其中，words指定了停用词文件的路径，可以自己定义。 3. 配置同义词在solrconfig.xml中，可以配置同义词，在分词时将同义词替换掉，例如： ``` <filter class="solr.SynonymFilterFactory" synonyms="synonyms.txt" ignoreCase="true" expand="true" /> ``` 其中，synonyms指定了同义词文件的路径，可以自己定义。expand指定是否将同义词扩展，例如"中国, 中国人, 中国人民"，如果expand=true，则搜索"中国"时会将其扩展为"中国中国人中国人民"。以上就是在Solr 9.2.0中配置中文分词器的基本步骤。

“相关推荐”对你有帮助么？

非常没帮助
没帮助
一般
有帮助
非常有帮助

提交