利用HMM模型实现分词:
四种状态:
B:词语的开头
M:一个词语的中间词
E:一个词语的结果
S:非词语,单个词
学习:Baum-Welch算法
预测:维特比算法
数据集:人民日报1998年中文标注语料库
链接:https://pan.baidu.com/s/1SKi9DUjxuh6tENfm6jmNCA
提取码:hz3q
复制这段内容后打开百度网盘手机App,操作更方便哦
代码引用自:www.pkudodo.com
#coding=utf-8
#Author:Dodo
#Date:2018-12-10
#Email:lvtengchao@pku.edu.cn
#Blog:www.pkudodo.com
'''
学习:Baum-Welch算法
预测:维特比算法
数据集:人民日报1998年中文标注语料库
------------------------------
运行结果:
-------------------原文----------------------
深圳有个打工者阅览室
去年12月,我在广东深圳市出差,听说南山区工商分局为打工者建了