ICTCLAS分词系统研究（八）--生成最终分词结果

最新推荐文章于 2021-02-13 14:32:34 发布

sinboy

最新推荐文章于 2021-02-13 14:32:34 发布

阅读量6.9k

点赞数

分类专栏：自然语言文章标签：优化

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/sinboy/article/details/1637530

版权

自然语言专栏收录该内容

13 篇文章 0 订阅

订阅专栏

经过人名、地名等未登陆词的识别之后，再次生成二叉分词图表，求取N－最短路径。为何再次执行这样的循环，是因为在得到初分结果后又增加了新的节点（比如：人名或地名）到结果链表中，需要再次求取最短路径：

经过优化后的二叉分词图表：

	1	2	3	4	5	6	7	8	9	10	11
0	始##始@张	始##始@未##人
1			张@华	张@未##人
2						未##人@说
3					华@平
4						未##人@说
5						平@说
6							说@的
7								的@确实
8									确实@在
9										在@理
10											理@末##末

经过优化后的二叉分词路径：

序号	二叉分词路径
0	0 2 6 7 8 9 10 11

至此，我们得到了最终的分词路径，正确的把人名识别出来，但在这个结果只有一部分词正确标注了词性，主要是未登陆词，即源码中以“未＃＃X”表示的，其它的分词并未成功的进行记性标记。所以需要再次调用记性标记这一次过程，把剩余的词的词性成功标注出来。

经过优化后的分词结果：

序号	分词结果
0	张华平/nr 说/v 的/uj 确实/ad 在/p 理/n

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
2
评论
ICTCLAS分词系统研究（八）--生成最终分词结果

经过人名、地名等未登陆词的识别之后，再次生成二叉分词图表，求取N－最短路径。为何再次执行这样的循环，是因为在得到初分结果后又增加了新的节点（比如：人名或地名）到结果链表中，需要再次求取最短路径：经过优化后的二叉分词图表： 1 2 3
复制链接

扫一扫

专栏目录

博客等级

码龄23年

65
原创

11
点赞

22
收藏

239
粉丝

关注

私信

热门文章

分类专栏

GIS 2篇
JAVA 31篇
Linux 7篇
管理架构 1篇
自然语言 13篇

最新评论

Django学习笔记二：结构分析
Tisfy: 十分完美，正如：别裁伪体亲风雅，转益多师是汝师。
ICTCLAS分词系统研究（八）--生成最终分词结果
xinnan123 回复 anyisok: 这个系统里其实N=1，也就是只找了一个最短路径
ICTCLAS分词系统研究（一）
niulihui: 您好！张老师，请问您有ICTCLAS的Java版的源码吗?写论文需要用到，能发给我一份吗？我的邮箱是871298207@qq.com 非常感谢！！！
ICTCLAS4J源代码示例（－）
大号小白兔: 感谢博主分享
ICTCLAS分词系统研究（二）--词典结构
w314236918: count:5 wordLen:2 frequency:0 handle:24832 word:(黯)淡 wordLen:2 frequency:1 handle:24942 word:(黯)淡 wordLen:2 frequency:3 handle:31232 word:(黯)然 wordLen:6 frequency:0 handle:27648 word:(黯)然神伤 wordLen:6 frequency:0 handle:26880 word:(黯)然失色这个例子有问题吧，怎么看不懂

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。