mysql全文检索公司_实现全文检索-基于MySQL

最新推荐文章于 2022-05-12 13:11:12 发布

其实我想做条鱼

最新推荐文章于 2022-05-12 13:11:12 发布

阅读量100

点赞数

文章标签： mysql全文检索公司

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_34421376/article/details/113946247

版权

我们经常在网站上能看到搜索框，可以用空格分割关键词、可以用拼音搜索等...

把关键字拆分为一组词

例子：搜索懒人快乐，后台程序就会把懒人快乐拆分成两个词懒人,快乐。

说明：可以使用jieba-analysis结巴分词，用法如下：

com.huaban

jieba-analysis

1.0.2

package com.kangyonggan.blog.util;

import com.huaban.analysis.jieba.JiebaSegmenter;

import com.huaban.analysis.jieba.SegToken;

import org.apache.commons.lang3.StringUtils;

import java.util.List;

/**

* @author kangyonggan

* @since 16/7/22

*/

public class FenCi {

/**

* 分词器

*/

private static final JiebaSegmenter segmenter = new JiebaSegmenter();

/**

* 中文分词, 并转成拼音

*

* @param data

* @return

*/

public static String process(String data) {

if (StringUtils.isEmpty(data)) {

return "";

}

data = data.replaceAll("\\s", " ");

data = data.replaceAll("'", " ");

List list = segmenter.process(data, JiebaSegmenter.SegMode.INDEX);

StringBuilder sb = new StringBuilder();

list.forEach(segToken -> sb.append(PinYin.converterToSpellWithMuti(segToken.word)).append(","));

sb.deleteCharAt(sb.lastIndexOf(","));

return sb.toString();

}

}

把词转化为拼音

例子：懒人,快乐会被后台程序转化为lanren,kuaile,kuaiyue，之所以不是lanren,kuaile而是lanren,kuaile,kuaiyue，是因为乐是多音字。

说明：可以使用pinyin4j把汉字转化为拼音，用法如下：

com.belerweb

pinyin4j

2.5.1

package com.kangyonggan.blog.util;

import net.sourceforge.pinyin4j.PinyinHelper;

import net.sourceforge.pinyin4j.format.HanyuPinyinCaseType;

import net.sourceforge.pinyin4j.format.HanyuPinyinOutputFormat;

import net.sourceforge.pinyin4j.format.HanyuPinyinToneType;

import net.sourceforge.pinyin4j.format.exception.BadHanyuPinyinOutputFormatCom

最低0.47元/天解锁文章

其实我想做条鱼

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
mysql全文检索公司_实现全文检索-基于MySQL

我们经常在网站上能看到搜索框，可以用空格分割关键词、可以用拼音搜索等...把关键字拆分为一组词例子：搜索懒人快乐，后台程序就会把懒人快乐拆分成两个词懒人,快乐。说明：可以使用jieba-analysis结巴分词，用法如下：com.huabanjieba-analysis1.0.2package com.kangyonggan.blog.util;import com.huaban.analy...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。