HMM最大匹配分词算法(Python)

本文介绍了使用最大正向匹配算法进行中文分词的实践,通过Python实现。虽然此算法简单,但准确率有限,主要用于机器粗分。文中提到的召回率和正确率均为100%,并提及了受到'Blueliner,fighting!!!'的启发。" 119835978,7852142,Java实现AES/ECB/PKCS7Padding加密解密,"['Java', '加密算法', '信息安全']
摘要由CSDN通过智能技术生成

正向最大匹配算法是我国最早提出的解决中文分词问题的算法,因其简单易操作,至今仍作为机器分词的粗分算法,在今天看来,这种算法的准确率远不够高,无法达到令人满意的要求。这只是一次练习。


待切分文本是:
我和你共同创造美好的新生活


词典:
共同,创造,美好,的,新,生活


预期分词效果:
我 和 你 共同 创造 美好 的 新 生活


# Python 3.4.3

lexicon = ('共同','创造','美好','的','新','生活') # 为了方便,词典直接写在程序里。
wordSeg = []    # 新建列表存放切分好的词
maxWordLen = 3
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值