中文分词比较困难的句子

原创 2016年08月29日 14:07:07
        TestSegment(analyzer,"沿海南方向逃跑");
        TestSegment(analyzer,"他说的确实在理");
        TestSegment(analyzer,"谢霆锋和张柏芝离婚了");
        TestSegment(analyzer,"结婚的和尚未结婚的");
        TestSegment(analyzer,"提高产品质量");
        TestSegment(analyzer,"中外科学名著");
        TestSegment(analyzer,"北京大学生前来应聘");
        TestSegment(analyzer,"为人民服务");
        TestSegment(analyzer,"独立自主和平等互利的原则");
        TestSegment(analyzer,"为人民办公益");
        TestSegment(analyzer,"这事的确定不下来");
        TestSegment(analyzer,"这扇门把手");
        TestSegment(analyzer,"把手抬起来");
        TestSegment(analyzer,"学生会宣传部");
        TestSegment(analyzer,"学生会主动完成作业");
        TestSegment(analyzer,"学生会游戏");
        TestSegment(analyzer,"研究生活水平");
        TestSegment(analyzer,"中国有企业");
        TestSegment(analyzer,"我爱美国手球");
        TestSegment(analyzer,"中国喜欢狗");
        TestSegment(analyzer,"中国热爱狗");
        TestSegment(analyzer,"王军虎去广州了");
        TestSegment(analyzer,"王军虎头虎脑的");
        TestSegment(analyzer,"将军任命了一名中将");
        TestSegment(analyzer,"产量三年中将增长两倍");

相关文章推荐

自然语言处理与中文分词的难点总结

中文自动分词 指的是使用计算机自动对中文文本进行词语的切分,即像英文那样使得中文句子中的词之间有空格以标识。中文自动分词被认为是中文自然语言处理中的一个最基本的环节。 中文分词的难点 ...

IKAnalyzer中文分词计算句子相似度

  • 2015年01月22日 17:53
  • 3.35MB
  • 下载

IKAnalyzer中文分词,计算句子相似度

IKAnalyzer中文分词,计算句子相似度

哈工大LTP和中科院NLPIR中文分词比较

个人实验总结,仅供参考。 1.LTP有自动分句功能,NLPIR没有分句功能; LTP的分句是根据中文标点里的句号、问号、感叹号、分号、省略号。 2.NLPIR分词有两种方式,分词...

有哪些比较好的中文分词方案?

原贴:https://www.zhihu.com/question/19578687 作者:沈沉 链接:https://www.zhihu.com/question/19578687/...
  • soipray
  • soipray
  • 2016年12月08日 16:23
  • 905

几种常见的中文分词包的分析与比较

1:中文分词简介 2:Lucence的中文分词 3:庖丁分词简介 4:IK中文分词简介 一:中文分词简介     1:分词算法分类         -----基于字符串匹配的中文分词方法     ...

用于Lucene的各中文分词比较

用于Lucene的各中文分词比较 作者: Claymore 时间: 2011-09-09 17:53:26 Arial Tahoma Verdana 宋体 楷体  字体减小 字体加大 ...

与Lucene 4.10配合的中文分词比较

比较目的 衡量每种分词的指标,内存消耗、CPU消耗,得到一个在Lucene中比较好的分词版本。 分词源代码介绍 paoding: 庖丁解牛最新版在 https://code.go...

与Lucene 4.10配合的中文分词比较

比较目的 衡量每种分词的指标,内存消耗、CPU消耗,得到一个在Lucene中比较好的分词版本。 分词源代码介绍 paoding: 庖丁解牛最新版在 https://code.go...
  • lizzy05
  • lizzy05
  • 2017年05月04日 12:20
  • 123

lucene初探(二):中文分词,以及系统自带分词简单比较

lucene学习我不得不承认这门技术是我目前接触的最有难度的一门技术,也许是因为我最近比较浮躁吧,也也是因为我没有找到,官方的说明文档和网络上比较不错的视频教程,不是有的讲解人普通话说得跟方言似的,英...
内容举报
返回顶部
收藏助手
不良信息举报
您举报文章:中文分词比较困难的句子
举报原因:
原因补充:

(最多只允许输入30个字)