目的:在对英文句子分词的时候,一般采用采用的分词器是WhiteSpaceTokenizerFactory,有一次因业务要求,需要根据某一个特殊字符(以逗号分词,以竖线分词)分词。如图1,我输入的词,如果用ik分词器,会分成如图1的效果,用自定义按逗号分割的分词器,会分成如图2的效果。
图(1)
图(2)
1.加入jar包
<dependency>
<
目的:在对英文句子分词的时候,一般采用采用的分词器是WhiteSpaceTokenizerFactory,有一次因业务要求,需要根据某一个特殊字符(以逗号分词,以竖线分词)分词。如图1,我输入的词,如果用ik分词器,会分成如图1的效果,用自定义按逗号分割的分词器,会分成如图2的效果。
图(1)
图(2)
1.加入jar包
<dependency>
<