viterbi用于中文词性标注

最新推荐文章于 2021-11-12 00:02:47 发布

NirvanaFeng

最新推荐文章于 2021-11-12 00:02:47 发布

阅读量7.7k

点赞数 1

文章标签：算法 bi

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/nirvanafeng/article/details/4171799

版权

tag：词性标注，viterbi，解码算法

【今天看一篇分词和词性标注一体化的文章，解码问题又折腾了老半天，才想起来复习下viterbi】

该算法解决的是HMM经典问题中最优状态序列的选择问题。词性标注问题映射到隐马模型可以表述为：模型中状态(词性)的数目为词性符号的个数N；从每个状态可能输出的不同符号(单词)的数目为词汇的个数M。假设在统计意义上每个词性的概率分布只与上一个词的词性有关(即词性的二元语法)，而每个单词的概率分布只与其词性相关。那么，我们就可以通过对已分词并做了词性标注的训练语料进行统计，需要统计如下矩阵：

最低0.47元/天解锁文章

关注

1
点赞
踩
4

收藏

觉得还不错? 一键收藏
5
评论
viterbi用于中文词性标注

tag：词性标注，viterbi，解码算法【今天看一篇分词和词性标注一体化的文章，解码问题又折腾了老半天，才想起来复习下viterbi】该算法解决的是HMM经典问题中最优状态序列的选择问题。词性标注问题映射到隐马模型可以表述为：模型中状态(词性)的数目为词性符号的个数N；从每个状态可能输出的不同符号(单词)的数目为词汇的个数M。假设在统计意义上每个词性的概率分布只与上一个词的词
复制链接

扫一扫

NirvanaFeng CSDN认证博客专家 CSDN认证企业博客

码龄16年

29: 原创

105万+: 周排名

118万+: 总排名

11万+: 访问

: 等级

1755: 积分

35: 粉丝

16: 获赞

25: 评论

74: 收藏

私信

关注

热门文章

分类专栏

最新评论

MAC地址查看方法
qq_32913629: 表示没看懂，那么多物理地址到底是哪个
分布式数据库复习总结
qq_42395323: 可不可以分享一个关于分布式数据库处理和优化这段内容的PPT
分布式数据库复习总结
小雷FansUnion: 太枯燥了~
共引聚类分析方法研究
cnhuduo: 说实话，这个标题很吸引人，但是我看完了看了3遍没啥收获，感觉还是我知道的那些。
viterbi用于中文词性标注
Cyprestar: 看完以后才发现自己把词语当状态了怪不得写不出来只能说太感谢了~

最新文章

目录

评论 5

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。