NLP
文章平均质量分 92
ykf173
这个作者很懒,什么都没留下…
展开
-
hanlp,jieba,nlpir分词工具安装报错完全解决方案
问题分析及解决方案错误原因分析解决方案参考博文错误原因分析github地址可以看到setup.py最下方两行安装环境要求.fasttext; 2.micrsoft c++ 14.0; 3.JDK)解决方案参考博文...原创 2020-04-18 17:24:37 · 929 阅读 · 0 评论 -
中文分词工具使用方法及比较
中文分词工具分词背景介绍安装及介绍(jieba、pyhanlp、pkuseg、thulac、snownlp、nlpir)windowst系统分词工具安装Linux系统分词工具安装数据集介绍实验结果及比较参考文献分词背景介绍 不管在平时的实验还是比赛中,NLP的绝大多数任务(情感分析、阅读理解、对话系统、文本分类、...原创 2020-04-19 22:43:21 · 3908 阅读 · 0 评论 -
机器学习平行语料库(翻译记忆库)(句对齐)开源工具及方法介绍
最近一直在做平行语料库句对齐的工作,新手上路根据自己查的一些资料这里概括一下大致的思路(这里假设你有自己的语料库,文章,而且是双语的,也就是已经翻译好的文章,并且已经做了分段,且双语已经做了段落对齐。如果没有的话可以下载,一些双语语料库,如联合国双语语料库http://opus.nlpl.eu/MultiUN.php,有了这些,你要做一个分句,接就要对齐了,之后一般是要形成一个翻译记忆库,.t...原创 2019-02-19 10:09:24 · 9079 阅读 · 0 评论