自然语言处理
文章平均质量分 74
JYUIIT
这个作者很懒,什么都没留下…
展开
-
如何在python种调用Hanlp的常用接口
在安装HanLP后,来看看如何在python种调用Hanlp的常用接口。这里给出一个大而不全的例子。安装和使用Hanlp参考:https://blog.csdn.net/weixin_44763047/article/details/114998652from pyhanlp import *print(HanLP.segment('你好,欢迎在Python中调用HantP的API'))for term in HanLP.segment('下雨天地面积水'): print('{}\t{}'.原创 2021-03-26 10:29:33 · 632 阅读 · 0 评论 -
NLTK学习3:语言计算:简单统计
3语言计算:简单统计在本节中,我们将探讨使文本与众不同的问题,并使用自动方法来查找文本的特征词和表达。saying = ['After', 'all', 'is', 'said', 'and', 'done', 'more', 'is', 'said', 'than', 'done']tokens = set(saying)tokens = sorted(tokens)print(tokens[-2:])3.1 频率分布我们如何自动识别最能提供有关文本主题和体裁信息的文原创 2021-03-22 01:42:39 · 422 阅读 · 0 评论 -
NLTK学习2:深入了解Python:文本作为单词列表
2深入了解Python:文本作为单词列表2.1 清单什么是文字?在一个级别上,它是诸如此类的页面上的一系列符号。在另一个层次上,它是由一系列章节组成的一系列章节,其中每个章节都是一系列段落,依此类推。但是,出于我们的目的,我们将文本看作只是一系列单词和标点符号。这是我们用Python表示文本的方式,在本例中是sent1:Moby Dick的开篇句子:sent1 = ['Call', 'me', 'Ishmael', '。']print(len(sent1))def lexical_diversit原创 2021-03-21 01:35:40 · 328 阅读 · 0 评论 -
NLTK学习1:用python语言进行计算:文本和单词
1用python语言进行计算:文本和单词在继续之前,您应该安装NLTK 3.0 ,教程见https://blog.csdn.net/weixin_44763047/article/details/1150195461.1 NLTK的入门示例加载text1,…, text9和lsend1,… send9键入要查看的文本或句子的名称。输入: texts () 或 sents () 以列出材料。文本1:白鲸由赫尔曼·梅尔维尔1851年文本2:理智与情感简·奥斯汀1811文字3:创世记文原创 2021-03-21 00:36:46 · 585 阅读 · 0 评论 -
NLTK安装及语料库包下载 & nltk.download()报错问题解决
NLTK安装及语料库包下载使用命令pip install nltk NLTK语料库和众多模块可使用NLTK下载器安装import nltknltk.download()运行后发现网页并不能成功打开,nltk语料库下载失败,报错:无法连接。又或者下载极慢,这里直接手动下载到指定目录下解压指定目录:数据包下载:百度网盘链接:https://pan.baidu.com/s/108PCcxz1sLuOT1YAbmYf9g提取码:p2zn确认是否下载成功NLTK数据用如下命令确认N原创 2021-03-20 01:52:06 · 2107 阅读 · 1 评论 -
Hanlp的安装和使用
Hanlp的安装和使用目前开源界贡献了许多优秀的NLP工具,·教学常用的NLTK ( Natural Language Toolkit )·斯坦福大学开发的CoreNLP·国内哈工大开发的LTP(Language TechnologyPlatform )·何哈开发的HanLP ( Han Language Processing )何晗开发的 HanLP ( Han Language Processing ) 是其中一种自然语言处理工具。这里主要介绍 Hanlp 在 cmd 下的安装和使用。安原创 2021-03-19 22:48:40 · 4311 阅读 · 0 评论