使用CRF分词的原理和实现过程
目前业内分词效果最好的是CRF模型,而CRF++是CRF实现的比较成熟的工具,下面是用CRF++做分词的过程。
1.使用4-tags标记,对训练语料做预处理
分别用B代表词首,E代表词尾,M代表词中,S代表单字词。然后使用
使用CRF分词的原理和实现过程
目前业内分词效果最好的是CRF模型,而CRF++是CRF实现的比较成熟的工具,下面是用CRF++做分词的过程。
1.使用4-tags标记,对训练语料做预处理
分别用B代表词首,E代表词尾,M代表词中,S代表单字词。然后使用