- 博客(1)
- 收藏
- 关注
原创 word分词器
什么是分词 分词就是将连续的字序列按照一定的规范重新组合成词序列的过程。在英文中,单词之间会以空格作为分割符,将词与词之间进行分割,但是对于中文,没有一个显式的分割符。 正是因为缺乏这种显式的分割符,导致我们对中文中的词,进行分割的时候会出现很多的偏差。 分词的算法 中文分词有难度,不过也有成熟的解决方案。现有的分词算法,大概可分为三类: 基于字符串匹配的分词算法 基于理解的分词算法 基于统计的分词算法 1. 基于字符串匹配的分词算法 这种分词方法,又叫机械分词算法,它会..
2020-07-06 17:13:01 1826
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人