golang jieba库 分词搜索

⚪ 有这样一个场景,某36为了推广,需要根据你的兴趣爱好给你发广·告,这个依据就是你在他游览器搜索的内容。比如36接了个广告任务,推广霸王去屑洗发水,用户在百度的时候,直接搜“霸王去屑洗发水”的很少,这时就体现了分词的力量。
⚪36将“霸王去屑洗发水”这个字符串分成“霸王”,“去屑”,“洗发水”,甚至”屑“,”洗发“。当用户搜“如何去屑?”,“洗发水成分是什么”,“洗发水能喝吗”,“霸王别姬”类似的一旦含有以上分词,该用户就被认定为潜在的”发展对象“,这样一定程度上增加了推广的准确性。

下面是Go语言字符串的分词化
1、git clone 大佬王斌的结巴库

git clone "https://github.com/wangbin/jiebago"

2、定义一个分词器对象,绑定规范,这个dict.txt在库里本身存在,我感觉这个文本就是一个划分的例子,然后划分分词都要根据这个例子照葫芦画瓢,我猜的,别被我误导了。这个seg是专门针对汉语的分词结构

var seg jiebago.Segmenter
func init() {
	seg.LoadDictionary("dict.txt")
}

3.调用这个函数,就把你的字符串str划分成了分词数组,返回一个切片

cutchan := seg.CutForSearch(str, true)

4.然后就可以遍历这个切片进行检索了

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值