2017-09-29-word-split.md

最新推荐文章于 2024-07-20 22:58:39 发布

firestone-sh

最新推荐文章于 2024-07-20 22:58:39 发布

阅读量373

点赞数

分类专栏： AI 文章标签：机器学习算法

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/echohfut/article/details/78128919

版权

AI 专栏收录该内容

1 篇文章 0 订阅

订阅专栏

算法

基于词典字符串匹配

例子： ikanalyzer,paoding

优点：速度块，都是O(n)时间复杂度，实现简单
缺点，就是对歧义和未登录词处理不好

基于统计以及机器学习

这类分词基于人工标注的词性和统计特征，对中文进行建模，即根据观测到的数据（标注好的语料）对模型参数进行估计，即训练。在分词阶段再通过模型计算各种分词出现的概率，将概率最大的分词结果作为最终结果。常见的序列标注模型有HMM和CRF。
例子：

优点：能很好处理歧义和未登录词问题，效果比前一类效果好
缺点：需要大量的人工标注数据，以及较慢的分词速度

库

结巴分词
基于前缀词典实现高效的词图扫描，生成句子中汉字所有可能成词情况所构成的有向无环图 (DAG)；采用了动态规划查找最大概率路径, 找出基于词频的最大切分组合；对于未登录词，采用了基于汉字成词能力的 HMM 模型，使用了 Viterbi 算法。
IKAnalyzer https://github.com/wks/ik-analyzer
HanLP

性能比较

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
2017-09-29-word-split.md

算法基于词典字符串匹配例子： ikanalyzer,paoding * 优点：速度块，都是O(n)时间复杂度，实现简单 * 缺点，就是对歧义和未登录词处理不好基于统计以及机器学习这类分词基于人工标注的词性和统计特征，对中文进行建模，即根据观测到的数据（标注好的语料）对模型参数进行估计，即训练。在分词阶段再通过模型计算各种分词出现的概率，将概率最大的分词结果作为最终结果。常见的序列标注模型有H
复制链接

扫一扫

专栏目录

firestone-sh CSDN认证博客专家 CSDN认证企业博客

码龄22年

431: 原创

14万+: 周排名

2万+: 总排名

18万+: 访问

: 等级

4483: 积分

19: 粉丝

10: 获赞

15: 评论

20: 收藏

私信

关注

热门文章

分类专栏

Linux 1篇
js 1篇
心情日记 3篇
算法 1篇
Diary 30篇
性能调优 14篇
JDK 53篇
其他 7篇
design 38篇
Database 44篇
Open Source 13篇
Hibernate 9篇
UI 31篇
Security 8篇
Cloud 5篇
Mobile Programming 2篇
websphere 23篇
SOA 27篇
Requirement 9篇
android 1篇
Management 46篇
水平网站 6篇
J2EE事务相关 16篇
Spring 6篇
Integration 4篇
Audio 2篇
笔记本推荐 1篇
AI 1篇
Websphere Portlet Factory 2篇

最新评论

算法：二分搜索
CSDN-Ada助手: 不知道算法技能树是否可以帮到你：https://edu.csdn.net/skill/algorithm?utm_source=AI_act_algorithm
Jetspeed2
meizhiping2010: 可算是搞定了，我换成maven2.x得版本就好使了，谢楼主宝地了。
Jetspeed2
meizhiping2010: 错误信息比较多， Caused by: org.apache.maven.plugin.PluginExecutionException: Execution deploy of goal org.apache.portals.jetspeed-2:jetspeed-deploy-maven-plugin:2.2.2:deploy failed: Plugin org.apache.portals.jetspeed-2:jetspeed-deploy-maven-plugin:2.2.2 or one of its dependencies could not be resolved: Failed to collect dependencies at org.apache.portals.jetspeed-2:jetspeed-deploy-maven-plugin:jar:2.2.2 -> org.apache.portals.tutorials:jetexpress-portal:war:1.0-SNAPSHOT Caused by: org.apache.maven.plugin.PluginResolutionException: Plugin org.apache.portals.jetspeed-2:jetspeed-deploy-maven-plugin:2.2.2 or one of its dependencies could not be resolved: Failed to collect dependencies at org.apache.portals.jetspeed-2:jetspeed-deploy-maven-plugin:jar:2.2.2 -> org.apache.portals.tutorials:jetexpress-portal:war:1.0-SNAPSHOT
Jetspeed2
meizhiping2010: org.apache.portals.tutorials:jetexpress-portal:war:1.0-SNAPSHOT: Failed to read artifact descriptor for org.apache.portals.tutorials:jetexpress-portal:war:1.0-SNAPSHOT: Failure to find org.apache.portals.tutorials:jetexpress:pom:1.0-SNAPSHOT in http://repository.apache.org/snapshots was cached in the local repository, resolution will not be reattempted until the update interval of apache.snapshots has elapsed or updates are forced -> [Help 1] org.apache.maven.lifecycle.LifecycleExecutionException: Failed to execute goal org.apache.portals.jetspeed-2:jetspeed-deploy-maven-plugin:2.2.2:deploy (deploy) on project jetspeed-mvn-portal-pom: Execution deploy of goal org.apache.portals.jetspeed-2:jetspeed-deploy-maven-plugin:2.2.2:deploy failed: Plugin org.apache.portals.jetspeed-2:jetspeed-deploy-maven-plugin:2.2.2 or one of its dependencies could not be resolved: Failed to collect dependencies at org.apache.portals.jetspeed-2:jetspeed-deploy-maven-plugin:jar:2.2.2 ->
Jetspeed2
meizhiping2010: 楼主您好，最近您我也在整jetspeed2，我也是按 http://portals.apache.org/jetspeed-2/tutorial/01/genapp.html步骤来得，但是我执行mvn jetspeed:mvn -Dtarget=all命令后，在后面deploy时出错了。错误信息如下： [INFO] ------------------------------------------------------------------------ [INFO] BUILD FAILURE [INFO] ------------------------------------------------------------------------ [INFO] Total time: 0.765s [INFO] Finished at: Tue Dec 17 14:23:28 CST 2013 [INFO] Final Memory: 4M/15M [INFO] ------------------------------------------------------------------------ [ERROR] Failed to execute goal org.apache.portals.jetspeed-2:jetspeed-deploy-maven-plugin:2.2.2:deploy (deploy) on project jetspeed-mvn-portal-pom: Execution deploy of goal org.apache.portals.jetspeed-2:jetspeed-deploy-maven-plugin:2.2.2:deploy failed: Plugin org.apache.portals.jetspeed-2:jetspeed-deploy-maven-plugin:2.2.2 or one of its dependencies could not be resolved: Failed to collect dependencies at org.apache.portals.jetspeed-2:jetspeed-deploy-maven-plugin:jar:2.2.2 ->

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。