NLTK中常见定义的函数

最新推荐文章于 2020-06-04 15:34:44 发布

Teng、Jiao

最新推荐文章于 2020-06-04 15:34:44 发布

阅读量1.1k

点赞数 2

分类专栏： NLP python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Teng49/article/details/76636209

版权

NLP 同时被 2 个专栏收录

4 篇文章 1 订阅

订阅专栏

2 篇文章 0 订阅

订阅专栏

一、NLTK频率分布类中定义的函数

用法含义

fdist = FreqDist（sample）创建包含给定样本的频率分布

fdist.inc(sample) 增加样本

fdist['monstrous'] 计数给定样本出现的次数

fdist.freq('monstrous') 给定样本的频率

fdist.N() 样本总数

fdist.keys() 以频率递减顺序排列的样本链表

for sample in fdist: 以频率递减顺序遍历样本

fdist.max() 数值最大的样本

fdist.tabulate() 绘制频率分布表

fdist.plot() 绘制频率分布图

fdist.plot(cumulative=True) 绘制累积频率分布图

fdist1<fdist2 测试样本在fdist1中出现的频率是否小于fdist2

Note：fdist类似于字典 key-value

二、词汇比较相关函数

函数用法含义

s.startswith(t) 测试s是否以t开头

s.endswith(t) 测试s时候以t结尾

t in s 测试t是否包含于s

s.islower() 判断s中的字符是否都是小写字母

s.isupper() 判断s中的字符是否都是大写字母

s.isalpha() 判断s中的字符是否都是字母

s.isalnum() 判断s中的字符是否都是字母或数字

s.isdigit() 判断s中的字符是否都是数字

s.istitle() 判断s中的字符是否都是首字母大写

Note：函数返回类型都为True or false

三、NLTK中定义的基本语料库函数

函数描述

fileids() 语料库中的文件

fileids([categories]) 语料库中对应分类的文件

categories() 语料库中的分类

categories([fileids]) 文件对应的语料库中的分类

raw() 语料库的原始内容

raw(fileids=[f1,f2,f3]) 指定文件的原始内容

raw(categories=[c1,c2]) 指定分类的原始内容

sents() 指定分类中的句子

sents(fileids=[f1,f2,f3]) 指定文件中的句子

sents(categories=[c1,c2]) 指定分类中的句子

abspath(fileid) 指定文件在磁盘中的位置

encoding(fileid) 返回文件的编码

open(fileid) 打开指定语料库文件的文件流

root() 到本地安装的语料库根目录的路径

readme() 语料库的readme内容

四、NLTK中的条件频率分布相关函数

用法描述

cfdist=ConditionalFreqDist(pairs) pairs为一个配对链表，以此来创建条件频率分布

cfdist.conditions() 将条件按字母排序来分类

cfdist[condition] 此条件下的频率分布

cfdist[condition][sample] 此条件下给定样本的频率

cfdist.tabulate() 为条件频率分布制表

cfdist.tabulate(samples,conditions) 在指定样本和条件限制下制表

cfdist.plot() 为条件频率分布绘图

cfdist.plot(samples,conditions) 在指定样本和条件下绘图

cfdist1 <cfdist2 测试样本在cfdist1中出现次数是否小于在cfdist2中出现的次数

关注

2
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
NLTK中常见定义的函数

一、NLTK频率分布类中定义的函数例子描述fdist = FreqDist（sample）创建包含给定样本的频率分布fdist.inc(sample) 增加样本fdist['monstrous']
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。