NLP
菜菜2022
这个作者很懒,什么都没留下…
展开
-
【Hanlp】使用pyhanlp进行新词发现的一点小结
之前我使用pyhanlp进行新词发现都是使用:word_info_list = HanLP.extractWords(IOUtil.newBufferedReader(corpus), 100)这种方式进行读取的,注意这里的IOUtil.newBufferedReader(corpus),这里的corpus是要进行新词发现的文本路径,由于适应IOUtil包下的接口对这个文件进行读取,导致文件读取之后释放缓慢,后期继续访问该文件进行其他操作的时候会出现一些问题。所以,下面我们使用其他的方式进行读取,从原创 2021-07-14 11:37:19 · 1250 阅读 · 0 评论 -
【NLP】Paddle2.0新时代:(一)安装
1、安装安装paddle2.0包,这里我使用的是CPU版本python -m pip install paddlepaddle==2.0.0 -i https://mirror.baidu.com/pypi/simple出现下面的画面说明安装成功!2、验证是否安装成功import paddleprint("paddle " + paddle.__version__)输出paddle的版本号:paddle 2.0.0说明paddle2.0安装成功!...原创 2021-04-09 08:46:43 · 381 阅读 · 0 评论 -
【NLP】句法分析学习笔记(一)
句法结构(syntactic structure)分析,主要有两种方式:成分句法分析(Constituent Parsing)与依存句法分析(Dependency Parsing)学习资料:http://web.stanford.edu/~jurafsky/NLPCourseraSlides.html成分句法分析(Constituent Parsing)Constituency Parsing主要用phrase structure grammer即短语语法来不断的将词语整理成嵌套的组成成分,又被称为c原创 2021-02-04 14:45:06 · 2836 阅读 · 0 评论 -
【Hanlp2.0】探索Hanlp2.0步骤及遇到的问题汇总(最新的解决方案)
安装注意事项1、hanlp1.x版本pip install pyhanlp2、安装hanlp2.x版本,本文主要介绍2.0版本的安装及遇到的问题pip install hanlp[full] #可以使用镜像加速,如何使用镜像加速呢?#这里安装的是hanlp2.0完全版(没找到官方的翻译,这里是我自己的翻译)#强烈建议安装hanlp[full]而不是hanlp,否则可能后期出现一系列的问题,eg:下文的【问题1】。使用镜像加速的教程请看我的另一篇文章:《python包的安装、更新》问题原创 2021-02-03 15:26:23 · 4113 阅读 · 11 评论 -
【NLP】自然语言处理中常见的英文单词
parser 解析器;分析器;剖析器;解析;语法分析器原创 2021-01-31 11:41:19 · 1051 阅读 · 0 评论