- 博客(1)
- 收藏
- 关注
原创 中文分词及词袋分类
中文分词(Chinese Word Segmentation) 指将汉字序列切分成单独的词。分词就是将连续的字序列按照一定的规范重新组合成词序列的过程。在中文里,“词”和“词组”边界模糊。中文分词是文本挖掘的基础,利于电脑自动识别语句含义。 现有的分词算法可分为三大类:基于字符串匹配的分词方法、基于理解的分词方法和基于统计的分词方法。按照是否与词性标注过程相结合,又可以分...
2018-02-26 14:55:04 1586
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人