分词算法
Chen__Wu
这个作者很懒,什么都没留下…
展开
-
elasticsearch安装与对外开放连接
elasticsearch的安装与网络开放,安装遇到的bug原创 2023-02-24 15:40:42 · 955 阅读 · 0 评论 -
基于概率最大化的分词算法
一、算法介绍1、核心累积概率计算公式:P’(Wi)=P’(Wi-1) × P(Wi)2、算法概述:步骤:对一个带分词的字符串S,从左往右选出候选词W1,…Wn计算每个候选词的概率值,并记录候选词的全部左邻词计算候选词累积概率,选择累积概率最大的左邻接词为最佳左邻词如果Wn是字符串的尾部并且累积概率最大,那么Wn作为终点词从Wn开始,从右向左,输出对应词的最佳左邻词3、伪代码:3....原创 2019-10-17 16:41:53 · 1118 阅读 · 0 评论